Facebook erstellt Software, die fast so gut zu Gesichtern passt wie du

Auf die Frage, ob zwei unbekannte Fotos von Gesichtern dieselbe Person zeigen, wird ein Mensch in 97,53 Prozent der Fälle richtig liegen. Eine neue Software, die von Forschern bei Facebook entwickelt wurde, kann bei derselben Herausforderung 97,25 Prozent erreichen, unabhängig von Lichtschwankungen oder ob die Person auf dem Bild direkt in die Kamera schaut.

Das ist ein bedeutender Fortschritt gegenüber früherer Face-Matching-Software und zeigt die Leistungsfähigkeit eines neuen Ansatzes für künstliche Intelligenz, bekannt als Deep Learning, auf den Facebook und seine Konkurrenten im vergangenen Jahr stark gesetzt haben (siehe Deep Learning). Bei diesem Bereich der KI handelt es sich um Software, die mithilfe von Netzwerken simulierter Neuronen lernt, Muster in großen Datenmengen zu erkennen.

Normalerweise sieht man diese Art von Verbesserung nicht, sagt Yaniv Taigman, ein Mitglied des KI-Teams von Facebook, einer Forschungsgruppe, die letztes Jahr gegründet wurde, um zu untersuchen, wie Deep Learning dem Unternehmen helfen könnte (siehe Facebook Launches Advanced AI Effort ). Wir nähern uns der menschlichen Leistung sehr nah, sagt Taigman über die neue Software. Er stellt fest, dass die Fehlerquote im Vergleich zu früherer Software, die dieselbe Aufgabe übernehmen kann, um mehr als ein Viertel reduziert wurde.



Kopfdrehung: DeepFace verwendet ein 3D-Modell, um Gesichter virtuell zu drehen, sodass sie der Kamera zugewandt sind. Bild (a) zeigt das Originalbild und (g) zeigt die endgültige, korrigierte Version.

Die neue Software von Facebook, bekannt als DeepFace, führt das durch, was Forscher Gesichtsverifizierung nennen (sie erkennt, dass zwei Bilder dasselbe Gesicht zeigen), keine Gesichtserkennung (einem Gesicht einen Namen zuordnen). Einige der zugrunde liegenden Techniken könnten jedoch auf dieses Problem angewendet werden, sagt Taigman, und könnten daher die Genauigkeit von Facebook verbessern, vorzuschlagen, wen Benutzer auf einem neu hochgeladenen Foto markieren sollten.

Allerdings bleibt DeepFace vorerst ein reines Forschungsprojekt. Facebook veröffentlichte eine Forschungsarbeit über das Projekt letzte Woche, und die Forscher werden die Arbeit auf der IEEE-Konferenz zu Computer Vision und Mustererkennung im Juni. Wir veröffentlichen unsere Ergebnisse, um Feedback von der Forschungsgemeinschaft zu erhalten, sagt Taigman, der DeepFace zusammen mit den Facebook-Kollegen Ming Yang und Marc’Aurelio Ranzato und dem Universitätsprofessor Lior Wolf von Tel Aviv entwickelt hat.

DeepFace verarbeitet Bilder von Gesichtern in zwei Schritten. Zuerst korrigiert es den Winkel eines Gesichts so, dass die Person auf dem Bild nach vorne schaut, wobei ein 3D-Modell eines durchschnittlichen nach vorne gerichteten Gesichts verwendet wird. Dann kommt das Deep Learning ins Spiel, während ein simuliertes neuronales Netzwerk eine numerische Beschreibung des neu ausgerichteten Gesichts ausarbeitet. Wenn DeepFace genügend ähnliche Beschreibungen aus zwei verschiedenen Bildern liefert, entscheidet es, dass sie dasselbe Gesicht zeigen müssen.

Die Leistung der endgültigen Software wurde gegen a Standarddatensatz die Forscher verwenden, um Gesichtsverarbeitungssoftware zu vergleichen, die auch verwendet wurde, um zu messen, wie Menschen bei übereinstimmenden Gesichtern abschneiden.

Neeraj Kumar , ein Forscher an der University of Washington, der an der Verifizierung und Erkennung von Gesichtern gearbeitet hat, sagt, dass die Ergebnisse von Facebook zeigen, wie das Auffinden von genügend Daten für die Einspeisung in ein großes neuronales Netzwerk erhebliche Verbesserungen in der maschinellen Lernsoftware ermöglichen kann. Ich wette, dass ein Großteil des Gewinns hier aus dem resultiert, was Deep Learning im Allgemeinen bietet: die Möglichkeit, riesige Mengen externer Daten in einem Lernmodell mit viel höherer Kapazität zu nutzen, sagt er.

Der Deep-Learning-Teil von DeepFace besteht aus neun Schichten einfacher simulierter Neuronen mit mehr als 120 Millionen Verbindungen zwischen ihnen. Um dieses Netzwerk zu trainieren, haben die Forscher von Facebook einen winzigen Datenausschnitt aus dem Hort von Benutzerbildern ihres Unternehmens angezapft – vier Millionen Fotos von Gesichtern von fast 4.000 Menschen. Da sie Zugriff auf viele Daten dieser Form haben, können sie erfolgreich ein Hochleistungsmodell trainieren, sagt Kumar.

verbergen