Wenn Social Media Mining schief geht

Ein komplexes Bild Ihres Privatlebens kann jetzt mithilfe einer Vielzahl öffentlicher Datenquellen und immer ausgefeilterer Data-Mining-Techniken erstellt werden. Aber wie genau ist dieses Bild?

Letzte Woche in Las Vegas, auf der Computersicherheitskonferenz Schwarzer Hut , Alessandro Einkäufe , ein außerordentlicher Professor für Informationstechnologie und öffentliche Ordnung am Heinz College der Carnegie Mellon University, zeigte, wie ein Foto einer Person verwendet werden kann, um ihr Geburtsdatum, ihre Sozialversicherungsnummer und andere Informationen mithilfe von Gesichtserkennungstechnologie zu finden um das Bild einem Profil auf Facebook und anderen Websites zuzuordnen. Acquisti erkennt die Auswirkungen dieser Arbeit auf den Datenschutz an, warnt jedoch davor, dass das größte Problem die Ungenauigkeit dieser und anderer Data-Mining-Techniken sein könnte.

Acquisti sagt, dass seine aktuelle Arbeit ein Versuch ist, die Zukunft einzufangen, in die wir uns begeben. In dieser Zukunft sieht er, dass Online-Informationen verwendet werden, um eine Person auf vielen Ebenen vorwegzunehmen – als potenzieller Termin, Kreditnehmer, Mitarbeiter, Mieter usw. Das Internet, sagt er, könnte zu einem Ort werden, an dem jeder Ihren Namen kennt – eine weltweite Kleinstadt, in der Sie nichts im Stich lassen.

Abgesehen von den offensichtlichen Bedenken, dass Fremde mehr denn je über Sie wissen, macht sich Acquisti Sorgen darüber, was passieren wird, wenn die Technologie Fehler macht. Wir neigen dazu, bei schwachen Daten starke Hochrechnungen anzustellen, sagt Acquisti. Es ist unmöglich, dagegen anzukämpfen, weil es in unserer Natur liegt.

Eine Reihe von Unternehmen hat bereits damit begonnen, soziale Medien zu nutzen, um die Reputation zu messen und zu verfolgen. Die Firma Santa Barbara, Kalifornien Soziale Intelligenz , führt beispielsweise Social-Media-Hintergrund-Screenings bei potenziellen Mitarbeitern durch und verspricht, negative Informationen wie rassistische Äußerungen oder sexuell eindeutige Fotos oder positive Informationen wie Anzeichen von Social-Media-Einfluss in einem bestimmten Bereich preiszugeben. Andere Unternehmen, wie z Klout , verfolgen den Grad des sozialen Einflusses der Nutzer, sodass Werbetreibende denjenigen mit hoher Punktzahl besondere Belohnungen anbieten können.

Die Forschung von Acquisti zeigte jedoch die Tücken, wenn man Daten aus sozialen Netzwerken zu viel Bedeutung beimisst. Sein Team machte Fotos von Freiwilligen und benutzte einen handelsüblichen Gesichtserkenner namens PittPatt (vor kurzem von Google erworben), um das Facebook-Profil jedes Freiwilligen zu finden, das oft den richtigen Namen dieser Person und viele weitere persönliche Informationen enthält. Anhand dieser Informationen konnte das Team manchmal einen Teil der Sozialversicherungsnummer einer Person herausfinden. Sie haben auch einen Prototyp einer Smartphone-App entwickelt, die persönliche Informationen über eine Person abruft, nachdem sie mit der Kamera des Geräts aufgenommen wurde.

In ihrem Experiment konnte das Team etwa ein Drittel der Probanden den richtigen Profilen zuordnen. Von dort aus machten sie andere Vorhersagen. In 75 % der Fälle haben sie die Interessen der Probanden richtig vorhergesagt. Sie sagten die ersten fünf Ziffern der Sozialversicherungsnummern der Freiwilligen in etwa 16 Prozent der Fälle bei zwei Versuchen richtig voraus. (Die Genauigkeit wurde mit mehr Versuchen erhöht.)

Dies bedeutet jedoch, dass sie in zwei Dritteln der Fälle die Personen nicht richtig identifizierten. Und diejenigen, die richtig identifiziert wurden, wurden immer noch zu 25 Prozent fälschlicherweise bestimmten persönlichen Interessen zugeordnet und zu mehr als 80 Prozent der falschen Sozialversicherungsnummer.

Acquisti geht davon aus, dass sich die Gesichtserkennungstechnologie in den kommenden Jahren weiter verbessern wird, und fragt, was passieren wird, wenn sie als gut genug angesehen wird, um die meiste Zeit zu vertrauen. Es könnte für diejenigen, die falsch identifiziert werden, ein Albtraum sein. Es gibt nichts, was wir als Individuen kontrollieren können, sagt er.

Andere Forscher untersuchen die Zuverlässigkeit des Mining sozialer Daten. Beim Defcon , eine Hacker-Konferenz in Las Vegas am vergangenen Wochenende, eine Gruppe namens the Stiftung für Online-Datenschutz präsentierte Ergebnisse seiner Big-Five-Experiment , eine Studie, die darauf abzielte, die Persönlichkeitsmerkmale von Freiwilligen mit den Qualitäten auf Facebook-Profilen abzugleichen. Nach der Verabreichung von a Persönlichkeitstest für Freiwillige erstellten sie Profile, um Schlüsselmerkmale zu identifizieren.

Die Forscher der Online Privacy Foundation fanden eine positive Korrelation zwischen Menschen, deren Persönlichkeiten zu Offenheit neigten, und denen, deren Facebook-Profile mit mehr Informationen gefüllt waren: längere Interessenlisten, längere Biografien und mehr Diskussionen über Geld, Religion, Tod und negative Emotionen. Sie fanden auch eine positive Korrelation zwischen angenehmen Menschen – definiert als mitfühlend, kooperativ, mit der Fähigkeit zu vergeben und pragmatisch zu sein – und Facebook-Status, die in längeren Sätzen geschrieben wurden, positive Emotionen diskutierten oder relativ mehr Kommentare, Freunde und hatten Fotos. In beiden Fällen waren die Korrelationen jedoch relativ schwach.

Die Forscher kommen zu dem Schluss, dass ein Facebook-Profil kaum eine verlässliche Informationsquelle ist. Wichtig ist, sich daran zu erinnern, dass dies eine Wette ist, sagt der Mitbegründer der Stiftung Chris Sumner . Die Botschaft lautet: Ja, es gibt einen Link, aber verwenden Sie ihn nicht allein für kritische Entscheidungen.

Acquisti und Sumner sagen, dass möglicherweise neue Regierungsrichtlinien erforderlich sind, um Einzelpersonen vor übermäßigem Data Mining und vor dem Missbrauch ihrer Informationen zu schützen. Dies könnte das Festlegen von Genauigkeitsstandards beinhalten, die Organisationen einhalten müssen. Die entscheidende Frage unserer Zeit, so Acquisti, sei, wie wir als Gesellschaft mit Big Data umgehen?

verbergen