Datenqualität in der Blockchain-Analyse: 10 Sorgfaltsfragen
Wenn ein Compliance-Team, eine Aufsichtsbehörde oder ein Ermittler auf der Grundlage von Blockchain-Analyseergebnissen handelt, sind die Folgen schlechter Daten schwerwiegend: verschwendete Ressourcen durch falsche Hinweise, übersehene Sanktionsrisiken und im schlimmsten Fall eine einzige falsche Zuordnung, die eine ganze Untersuchung zunichtemacht oder zu einem unrechtmäßigen Kundenausschluss führt. Chainalysis hat einen Rahmen mit zehn Fragen veröffentlicht, die jede Organisation einem Anbieter von Blockchain-Analysen stellen sollte, bevor sie sich auf dessen Daten für AML-, Sanktions- oder Ermittlungsarbeiten verlässt. Die Fragen gehen weit über Funktionsvergleiche und Abdeckungsangaben hinaus. Sie untersuchen Methodik, Beweisstandards und die Sicherheitsvorkehrungen, die eine gründliche Analyse von scheinbar fundierten Vermutungen unterscheiden.
Warum Datenqualität das eigentliche Risiko in der Blockchain-Analyse ist
Blockchain-Analysewerkzeuge sind nur so nützlich wie die Schlussfolgerungen, die sie tatsächlich stützen können. Ein Anbieter mag eine breite Abdeckung über Dutzende Chains hinweg versprechen, aber wenn seine Zuordnungslogik undurchsichtig ist oder seine Clustering-Methode nie einer unabhängigen Prüfung unterzogen wurde, bauen Compliance-Teams ihre Entscheidungen im Wesentlichen auf unbewiesenen Behauptungen auf.
Die Einsätze sind konkret. Falsche Zuordnungen können Hunderte verwandter Erkenntnisse auf einmal diskreditieren. Ein Cluster, der bei einer Überprüfung zusammenbricht, kann eine Durchsetzungsmaßnahme gefährden, die Monate gedauert hat, um aufgebaut zu werden. Aufsichtsbehörden und Gerichte wollen zunehmend nicht nur wissen, was ein Werkzeug geschlussfolgert hat, sondern auch, wie es zu dieser Schlussfolgerung gelangt ist und ob dieser Prozess externen Tests standgehalten hat.
Die Lücke zwischen Abdeckungsangaben und tatsächlicher Genauigkeit
Viele Anbieter beschreiben ihre Methodik in Verkaufsgesprächen in allgemeinen Begriffen. Die folgenden Fragen sollen diese Ebene durchbrechen. Wenn ein Anbieter sie nicht klar und spezifisch beantworten kann, ist das an sich ein aussagekräftiges Signal für die Zuverlässigkeit seiner Ergebnisse.
Zehn Fragen, die Sie stellen sollten, bevor Sie sich auf die Daten verlassen
Chainalysis gruppiert seine Due-Diligence-Fragen um vier Kernbereiche: Clustering-Methodik, Kennzeichnung und Zuordnung, rechtliche und externe Validierung sowie Überwachung maschinellen Lernens. Die folgende Aufschlüsselung ordnet jede Frage ihrer praktischen Compliance-Auswirkung zu.
Clustering-Methodik
Der erste Bereich behandelt, wie ein Anbieter Adressen gruppiert, um gemeinsames Eigentum zu erschließen. Einige Techniken bestimmen gemeinsames Eigentum deterministisch, andere probabilistisch. Beide haben legitime Anwendungen, aber ein Compliance-Analyst muss wissen, welche wann angewendet wird, um das Gewicht der Ergebnisse richtig einzuschätzen.
Anbieter sollten auch die bekannten blinden Flecken ihrer Techniken benennen können. CoinJoin-Transaktionen müssen beispielsweise erkannt und von UTXO-Mitausgabenheuristiken ausgeschlossen werden; sonst produziert die Clustering-Logik falsch-positive Ergebnisse. Ein gründlicher Anbieter hat diese Randfälle kartiert und explizite Schutzmaßnahmen eingebaut, anstatt anzunehmen, dass Fehler selten sind.
Auch die Chain-Architektur ist wichtig. Bitcoin und Ethereum basieren auf grundlegend unterschiedlichen Transaktionsmodellen. Gruppierungstechniken, die auf einer Kette gut funktionieren, lassen sich nicht automatisch auf eine andere übertragen. Wenn ein Anbieter identische Terminologie über Chains hinweg verwendet, ohne zu erklären, wie sich die zugrunde liegende Methode anpasst, ist eine direkte Rückfrage angebracht.
Kennzeichnungs- und Zuordnungsstandards
Eine durch behördlich beschlagnahmte Daten bestätigte Kennzeichnung hat ein völlig anderes Beweisgewicht als eine, die von einem einzigen unbestätigten Bericht abgeleitet wurde. Compliance-Teams sollten genau verstehen, welche Quellen den Kennzeichnungen zugrunde liegen, die sie sehen, und ob diese Quellen offengelegt oder zumindest nach Zuverlässigkeitsstufe eingestuft werden können.
Ebenso wichtig ist die Unabhängigkeit von Clustering und Kennzeichnung. Wenn das Entfernen einer Kennzeichnung von einem Adress-Cluster dazu führt, dass der Cluster selbst zerfällt, steht weder die Gruppierung noch die Kennzeichnung für sich allein. Die beiden Schlussfolgerungen müssen unabhängig voneinander belegbar sein.
Eine subtilere, aber wichtige Frage betrifft die Unterscheidung zwischen Nutzer und Verwahrer. Wenn ein Kunde Kryptowährung bei einer Börse einzahlt, gehört die Einzahlungsadresse in gewissem Sinne dem Kunden, wird aber von der Börse kontrolliert. Wenn ein Werkzeug nicht unterscheidet, wer eine Adresse nutzt und wer sie letztendlich kontrolliert, führt dies zu Zuordnungsfehlern, die sich auf die nachgelagerte Analyse auswirken können. Dieselbe Logik gilt für verschachtelte Entitäten, bei denen ein Unternehmen auf die Verwahrungsinfrastruktur eines anderen angewiesen ist. Das Verständnis der Kontrolle, nicht nur der Interaktion, ist der Standard, den ein glaubwürdiger Anbieter erfüllen sollte. Dies steht in direktem Zusammenhang mit der breiteren Frage der unabhängigen Abgleichspraktiken, die Prüfer jetzt unter die Lupe nehmen, wenn sie prüfen, wie Unternehmen On-Chain-Daten beziehen und validieren.
Rechtliche und externe Validierung
Gerichtsverfahren gehören zu den anspruchsvollsten Tests, denen eine Methodik ausgesetzt sein kann. Eine Clustering- oder Zuordnungsmethode, die den Daubert-Standard in einem US-Bundesgericht erfüllt hat, wurde auf wissenschaftliche Validität, Peer Review, Fehlerraten und allgemeine Akzeptanz geprüft. Das ist etwas grundsätzlich anderes als eine Methode, die noch nie in einem kontradiktorischen Umfeld angefochten wurde.
Ebenso aufschlussreich ist, wie ein Anbieter reagiert, wenn eine externe Validierung möglich wird. Wenn Strafverfolgungsbehörden Wallet-Infrastruktur beschlagnahmen und empirische Grundwahrheiten verfügbar werden, zeigt ein Anbieter, der diesen Vergleich begrüßt, Vertrauen in seine Methoden. Ein Anbieter, der ihn vermeidet, tut dies nicht. Das Verständnis, wie die Blockchain-Analyse die Betrugsbekämpfung und Durchsetzungsergebnisse unterstützt, hängt direkt davon ab, ob die zugrunde liegenden Daten durch reale Ergebnisse belastbar getestet wurden.
Überwachung maschinellen Lernens
Maschinelles Lernen ist effektiv bei der Identifizierung von Mustern im großen Maßstab. Das Risiko entsteht, wenn probabilistische ML-Ergebnisse als bestätigte Fakten behandelt werden, anstatt als Signale, die einer weiteren Validierung bedürfen. Wenn ein Anbieter nicht klar erklären kann, wo in seinem Workflow ML eingesetzt wird, und nicht bestätigen kann, dass diese Ergebnisse getrennt von evidenzbasierten Schlussfolgerungen gekennzeichnet sind, können sich Fehler schnell in der Zuordnung ausbreiten.
Für jeden bestimmten Cluster sollte ein Anbieter rekonstruieren können, wie er aufgebaut wurde, und die Beweise identifizieren können, die ihn stützen. Wenn diese Audit-Trail nicht verfügbar ist, ist die Zuverlässigkeit des Clusters unbekannt, unabhängig davon, wie vertrauenswürdig die Oberfläche aussieht.
Was diese Fragen über die Qualität des Anbieters aussagen
Ein Anbieter, der alle zehn Fragen klar, mit konkreten Details statt allgemeinen Aussagen beantworten kann, demonstriert Transparenz und Verantwortlichkeit. Ein Anbieter, der ausweicht, nur allgemeine Antworten gibt oder seine Methodik für einen bestimmten Cluster auf Anfrage nicht erklären kann, zeigt Einschränkungen an, die Compliance-Teams in ihre Risikobewertung einbeziehen sollten.
Dieselben Beweisstandards, die einer soliden Untersuchung zugrunde liegen, sollten auch den Werkzeugen zugrunde liegen, die sie unterstützen. Beschaffungsentscheidungen, die Blockchain-Analyse als Ware und nicht als methodische Wahl behandeln, sind ein eigenständiges Compliance-Risiko.
Was bedeutet „deterministisches“ versus „probabilistisches“ Clustering in der Praxis?
Deterministisches Clustering verwendet On-Chain-Regeln, die eine eindeutige Schlussfolgerung liefern, zum Beispiel, dass zwei Adressen einen gemeinsamen Eigentümer haben müssen, basierend darauf, wie sie gemeinsam in einer Transaktion erscheinen. Probabilistisches Clustering schließt auf wahrscheinliches gemeinsames Eigentum basierend auf statistischen Mustern, kann aber alternative Erklärungen nicht ausschließen. Compliance-Teams sollten wissen, welche Methode einer bestimmten Zuordnung zugrunde liegt, damit sie angemessene Vertrauensniveaus anwenden können.
Warum ist die Unterscheidung zwischen Nutzer und Verwahrer für das Sanktionsscreening wichtig?
Eine Einzahlungsadresse an einer Börse wird technisch von der Börse kontrolliert, auch wenn sie mit einem bestimmten Kunden verbunden ist. Wenn ein Werkzeug die Kontrolle falsch zuordnet, könnte ein Compliance-Team die falsche Partei kennzeichnen oder freigeben. Diese Unterscheidung richtig zu treffen, ist besonders wichtig in verschachtelten Entitätsstrukturen, in denen mehrere Verwahrungsebenen beteiligt sind.
Was ist der Daubert-Standard und warum ist er für die Blockchain-Analyse relevant?
Der Daubert-Standard ist ein US-Bundesschwellenwert für die Zulässigkeit von Sachverständigenbeweisen. Ein Gericht, das ihn anwendet, prüft, ob die Methodik getestet wurde, ob sie eine bekannte oder schätzbare Fehlerrate hat, ob sie einem Peer Review unterzogen wurde und ob sie in dem relevanten Fachgebiet allgemein akzeptiert ist. Eine Blockchain-Analyse-Methodik, die der Daubert-Prüfung standgehalten hat, hat eine Ebene unabhängiger Anfechtung durchgemacht, die die meisten nicht erfahren haben.
Wie sollten Unternehmen ML-generierte Zuordnungsergebnisse anders behandeln als evidenzbasierte?
ML-Ergebnisse sollten als probabilistische Signale behandelt werden, die eine Bestätigung erfordern, nicht als bestätigte Fakten. Anbieter sollten ML-abgeleitete Schlussfolgerungen separat und klar kennzeichnen, damit Analysten angemessene Skepsis anwenden und zusätzliche Beweise einholen können, bevor sie auf der Grundlage dieser Ergebnisse eine Compliance-Entscheidung treffen.
Kann eine einzige falsche Zuordnung wirklich eine gesamte Untersuchung gefährden?
Ja. Da Clustering Adressen miteinander verbindet, kann eine falsche Zuordnung kaskadieren: Wenn Adresse A fälschlicherweise mit einem Cluster verknüpft wird, erbt jede aus diesem Cluster abgeleitete Erkenntnis den Fehler. In Durchsetzungskontexten kann die Gegenpartei eine nachgewiesene Ungenauigkeit nutzen, um die Zuverlässigkeit der Methodik des Anbieters über alle zugehörigen Ergebnisse hinweg in Frage zu stellen.
Quelle: Chainalysis
