6 Grundlagen für die Betrugsbekämpfung mit maschinellem Lernen

Header-Bild

Header-Bild

Zur Verfügung gestellt von SAS

Stu Bradley

Stu Bradley ist Vizepräsident für Betrugs- und Sicherheitsaufklärung bei SAS.

Wir hören es die ganze Zeit: Betrugsprävention ist schwierig, weil Betrüger sich ständig ändern und anpassen. In dem Moment, in dem Sie herausfinden, wie Sie einen Betrug erkennen und verhindern können, taucht ein neuer auf, der seinen Platz einnimmt.

Die beste Technologie zur Betrugsbekämpfung ist daher natürlich eine, die sich so schnell ändern und anpassen kann wie die Taktik des Betrügers. Das macht maschinelles Lernen (ML)-Systeme, die sich perfekt für die Betrugsbekämpfung eignen. Wenn sie optimal gestaltet sind, lernen, passen sie sich an und decken aufkommende Muster auf, ohne die Überanpassung, die zu zu vielen Fehlalarmen führen kann.

Traditionell haben sich Organisationen auf regelbasierte Systeme verlassen, um Betrug aufzudecken. Regeln verwenden eine Wenn-Dann-Logik, die bekannte Betrugsmuster gründlich aufdecken kann. Und obwohl Regeln ein wichtiges Instrument zur Betrugsbekämpfung bleiben, insbesondere in Kombination mit fortschrittlichen Ansätzen, beschränken sie sich auf das Erkennen von Mustern, die Sie bereits kennen und in die Logik einprogrammieren können. Sie sind nicht in der Lage, sich an neue Betrugsmuster anzupassen, unbekannte Schemata aufzudecken oder immer ausgefeiltere Betrugstechniken zu identifizieren.

Aus diesem Grund setzen immer mehr Branchen auf ML und künstliche Intelligenz zur Betrugserkennung. Neuere Forschung von SAS und der Association of Certified Fraud Examiners fanden heraus, dass nur 13 % der Unternehmen in allen Branchen diese Technologien nutzen, um Betrug aufzudecken und abzuwehren. Weitere 25 % planen, sie in den nächsten zwei Jahren in ihre Betrugsbekämpfungsprogramme aufzunehmen – ein Sprung von fast 200 %.

Überwachtes oder unüberwachtes Lernen zur Betrugserkennung

Also, wie funktioniert es? Einfach ausgedrückt automatisiert ML die Extraktion bekannter und unbekannter Muster aus Daten. Sobald es diese Muster erkennt, kann es sein Wissen auf neue und unsichtbare Daten anwenden. Die Maschine lernt und passt sich an, wenn ihr neue Ergebnisse und neue Muster über eine Rückkopplungsschleife präsentiert werden.

Bei der Betrugserkennung versuchen überwachte ML-Modelle, aus identifizierten Aufzeichnungen in Daten zu lernen, die oft als gekennzeichnete Daten bezeichnet werden. Um ein überwachtes Modell zu trainieren, legen Sie ihm sowohl betrügerische als auch nicht betrügerische Aufzeichnungen vor, die als solche gekennzeichnet wurden.

Unüberwachtes ML ist anders. Wenn Sie nicht wissen, welche Daten betrügerisch sind, bitten Sie das Modell, die Datenstruktur selbst zu lernen. Sie präsentieren es einfach mit Daten, und das Modell versucht, die zugrunde liegende Struktur und die Dimensionen dieser Daten zu verstehen.

Betrugserkennung mit ML: Die Komponenten

Um ML zur Betrugserkennung anzuwenden, benötigen Sie mindestens die folgenden Komponenten:

  1. Daten : Wie bei allen ML-Anwendungen sind Qualitätsdaten die Grundlage für den Aufbau von ML-Systemen zur Betrugsbekämpfung. Die Datensätze werden immer größer, und mit zunehmendem Volumen wächst auch die Herausforderung, Betrug aufzudecken. Zum Glück gilt das Sprichwort, dass mehr Daten bessere Modelle bedeuten, wenn es um die Betrugserkennung geht. Der Erfolgsfaktor ist eine ML-Plattform, die mit zunehmender Datenmenge und zunehmender Komplexität skaliert werden kann.
  2. Vielzahl : Es gibt keinen einzigen ML-Algorithmus oder keine Methode, die am besten für die Betrugserkennung geeignet ist. Der Erfolg resultiert aus der Fähigkeit, viele verschiedene Methoden auszuprobieren, Varianten zu testen und sie mit einer Reihe von Datensätzen zu bewerten. Dazu ist ein Toolkit mit einer Vielzahl von überwachten und nicht überwachten Methoden sowie einer Reihe von Feature-Engineering-Techniken erforderlich. Die Anwendung von ML auf neue und neuartige Weise, wie die Kombination einer Vielzahl von überwachten und nicht überwachten Methoden in einem System, ist effektiver als jede einzelne Methode allein.
  3. Integration : Dies scheint ein offensichtliches Muss zu sein, bleibt jedoch in vielen Unternehmen ein gängiges Hindernis für den Erfolg. Nur 50% aller entwickelten Modelle schaffen es jemals in die Produktion, was zu viel verschwendetem Aufwand führt. Sobald Sie ein ML-Modell entwickelt haben, besteht die Herausforderung darin, es in einer operativen Laufzeitumgebung bereitzustellen. Wenn sich Ihre Daten in Hadoop befinden, ist es sinnvoll, dass Ihr ML-Modell in Hadoop angewendet werden kann. Wenn Ihre Daten in Echtzeitsystemen gestreamt werden, benötigen Sie eine ML-Engine, die in Echtzeit oder im Stream ausgeführt werden kann. Die Übertragbarkeit des Modells und die Integration der Entscheidungslogik in Betriebssysteme sind von größter Bedeutung, um Betrug in großem Maßstab zu stoppen – und wie er in großem Maßstab auftritt.
  4. Whiteboxing : ML-Methoden und -Modelle sind im Allgemeinen Black Boxes. Es ist oft sehr schwierig (wenn nicht unmöglich), den Entscheidungsträgern zu erklären, wie das Modell zu seiner Bewertung oder Schlussfolgerung gekommen ist. Aber das Was und Wie für ML-Systeme zu erklären, ist von entscheidender Bedeutung, insbesondere in stark regulierten Branchen wie Finanzdienstleistungen. Dieser Erklärbarkeitsfaktor wird oft als White-Boxing oder Interpretierbarkeit bezeichnet und ist entscheidend für die Unterstützung von Modellvalidierungs- und Governance-Prozessen.
  5. Laufende Überwachung : Die laufende Überwachung von ML-Betrugserkennungssystemen ist für den Erfolg unerlässlich. Wenn sich die Populationen und die zugrunde liegenden Daten verschieben, müssen Sie damit rechnen, dass sich die Systemeingaben verschlechtern und die Gesamtleistung beeinträchtigen. Dies ist nicht nur bei ML-Systemen der Fall; regelbasierte Systeme haben die gleiche Herausforderung. Neuere ML-Methoden können sich jedoch an neue und nicht identifizierte Muster anpassen, wenn zugrunde liegende Änderungen auftreten. Dadurch entfallen einige, aber nicht alle ML-Umschulungs- und Bewertungsschritte. Ein gutes Überwachungsprogramm registriert und verfolgt die laufende Wirksamkeit aller Modelle.
  6. Experimentieren : Erfolgreiche ML-Programme beinhalten ein Element des kontinuierlichen Experimentierens. Es reicht nicht aus, einfach ein ML-Modell zu bauen und es knirschen zu lassen. Betrüger sind schlau und die Technologie ändert sich schnell. Eine Sandbox zu haben, in der Datenwissenschaftler frei mit einer Vielzahl von Methoden, Daten und Techniken zur Betrugsbekämpfung experimentieren können, ist zu einem entscheidenden Aspekt der wichtigsten Betrugsbekämpfungsprogramme geworden. Investitionen in die Stärkung der Kapazitäten von Datenwissenschaftlern, die Betrug bekämpfen, können sich fast sofort auszahlen.

Erkennung und Kundenerlebnis ausbalancieren

Das Erkennen schändlicher Transaktionen bei gleichzeitiger Bereitstellung eines qualitativ hochwertigen Kundenservice ist ein heikler Balanceakt. Ein Unternehmen, das legitime Transaktionen häufig ablehnt oder seine Authentifizierungsmaßnahmen zu umständlich gestaltet, verliert leicht Kunden. ML-Systeme sind ideal, um diese Art von Reibung zu minimieren.

Beispielsweise hat ein globales Finanzinstitut kürzlich mit SAS zusammengearbeitet, um sein regelbasiertes Betrugserkennungssystem zu modernisieren und dabei zu helfen, ein Gleichgewicht zwischen Aufsicht und Kundenservice zu finden. Zu diesem Zweck implementierte die Bank eine ML-basierte Lösung von SAS, die ein Ensemble neuronaler Netze verwendet, um zwei verschiedene Betrugsbewertungen zu erstellen:

  1. Ein primärer Betrugswert, der die Wahrscheinlichkeit bewertet, dass sich ein Konto in einem betrügerischen Zustand befindet.
  2. Ein Transaktions-Score, der die Wahrscheinlichkeit bewertet, dass eine einzelne Transaktion betrügerisch ist.

Mit diesem Dual-Score-Ansatz identifizierte das Finanzinstitut monatlich Transaktionen in Höhe von fast 1 Million US-Dollar, die fälschlicherweise als Betrug identifiziert worden waren. Es war auch in der Lage, weitere 1,5 Millionen Dollar pro Monat an Betrug zu finden, der zuvor unentdeckt geblieben war.

Alles zusammenbringen

Betrugserkennung ist ein schwieriges Problem. Während betrügerische Transaktionen nur einen sehr kleinen Teil der Aktivitäten innerhalb eines Unternehmens ausmachen, kann ein kleiner Prozentsatz der Aktivitäten ohne die richtigen Tools und Systeme schnell zu großen Geldverlusten führen. Mit den Fortschritten in ML können Systeme neue Muster zur Betrugsprävention lernen, anpassen und aufdecken – so können Sie mit den Betrügern Schritt halten, selbst wenn sie sich weiterentwickeln und ihre Taktiken ändern.

verbergen