Deinen Siri-Fingerabdruck wegwischen

Selbst in einer Zeit, in der die Privatsphäre schwindet, teilen Menschen, die Apples digitalen Assistenten Siri verwenden, eine deutliche Sorge. Aufzeichnungen ihrer tatsächlichen Stimmen, in denen Fragen gestellt werden, die möglicherweise persönlich sind, werden zur Verarbeitung über das Internet an einen entfernten Apple-Server übertragen. Dann bleiben sie dort gespeichert; Apple sagt nicht, wie lange.

Diese Sprachaufzeichnung ist im Gegensatz zu den meisten Daten, die von Smartphones und anderen Computern erzeugt werden, ein tatsächlicher biometrischer Identifikator. Ein Stimmabdruck kann – wenn er durch Zufall, Hack oder Vorladung offengelegt wurde – mit einer bestimmten Person verknüpft werden. Und mit dem aktuellen Boom bei Spracherkennungs-Apps ist Apple nicht der einzige, der solche Daten anhäuft.



Es gibt möglicherweise eine Möglichkeit, diese Kennung vertraulicher zu halten. Forscher sagen, dass Apple und andere, die Spracherkennungsanwendungen wie Siri entwickeln, einen Teil der Datenverarbeitung direkt am Telefon durchführen könnten. Anstatt die vollständige Aufzeichnung zu versenden, könnten sie dann spezifische Informationen übermitteln, die schwerer eindeutig einer Person zugeordnet werden können.

Vielleicht sollten Sie alles, was identifiziert, am Telefon bleiben, sagt Prem Natarajan, Executive Vice President bei Raytheon BBN Technologies in Cambridge, Massachusetts, einem wichtigen Zentrum für Spracherkennungsforschung. Er sagt, es könnte für Apple klüger sein, Funktionen aus der Sprache zu übertragen – und nicht aus der Sprache selbst.

Dieser Ansatz würde zwar den Prozessor und den Akku des Telefons stärker belasten, aber die Qualität der Spracherkennung nicht beeinträchtigen. Ich denke, man kann mit Sicherheit sagen, dass der fehlende Zugriff auf das [Vollstimme]-Signal keine bedeutende Strafe auferlegt, sagt Natarajan. Die Begrenzung der Menge der weitergegebenen biometrischen Daten würde dem Beispiel von Geräten wie Microsofts Kinect folgen, die aus Datenschutzgründen so entwickelt wurden, dass diese Daten an Bord bleiben.

Trudy Muller, eine Apple-Sprecherin, bestätigte, dass Sprachaufzeichnungen gespeichert werden, wenn Benutzer eine gesprochene Frage wie Wie ist das Wetter jetzt? Diese Daten werden nur für den Betrieb von Siri verwendet und helfen Siri, sein Verständnis und seine Erkennung zu verbessern, sagte sie. Muller fügte hinzu, dass das Unternehmen den Datenschutz sehr ernst nehme, und wies darauf hin, dass Fragen und Antworten, die Siri über das Internet sendet, verschlüsselt sind und dass Ihre Sprachaufzeichnungen nicht mit anderen Informationen verknüpft sind, die Apple über Sie generiert hat. (Siri lädt jedoch Ihre Kontaktliste, Ihren Standort und die Liste der gespeicherten Lieder hoch, um Ihre Anfragen zu beantworten.)

Obwohl Stimmabdrücke nicht so eindeutig sind wie Fingerabdrücke, können sie den Sprecher unter vielen Umständen eindeutig identifizieren. Das US-Heimatschutzministerium verwendet Stimmabdrücke, um Vielreisende zu identifizieren, die sich in einem System registriert haben, das einen schnellen Grenzübertritt ermöglicht.

Um zu sehen, warum Stimmabdrücke von Bedeutung sein könnten, betrachten Sie den Mordprozess gegen Casey Anthony, die Mutter aus Florida, die letztes Jahr beim Tod ihrer zweijährigen Tochter Caylee freigesprochen wurde. An einer Stelle wies die Staatsanwaltschaft auf Internetrecherchen – nach Chloroform und anderen belastenden Begriffen – vom Computer des Angeklagten aus. Anthonys Mutter sagte aus, sie habe den Suchbegriff selbst als Schreibfehler von Chlorophyll eingegeben. Wenn die Durchsuchungen von Siri per Stimme durchgeführt worden wären, hätten Staatsanwälte – und Geschworene – möglicherweise feststellen können, wer tatsächlich Chloroform gesagt hat. (Apple lehnte es ab zu sagen, ob es jemals eine Vorladung für den Stimmabdruck von jemandem erhalten hat.)

Wenn Sie in der Zwischenzeit einen unangemessenen Text diktierten oder Siri nach einer sensiblen medizinischen Angelegenheit fragten und Apple gehackt wurde (oder ein böswilliger Mitarbeiter Daten veröffentlichte), würde nicht nur die peinliche Kommunikation freigegeben, sondern auch mit Ihrer eigenen Stimme. Natarajan sagt, dass Biometrie völlig neue Datenschutzfragen aufwerfen könnte. Jemand, der beispielsweise nach dem Ort eines Protests gegen ein repressives Regime sucht, könnte in Schwierigkeiten geraten, wenn dieser Regierung die Daten zur Verfügung stehen. Wenn Sie eine Gruppe von Leuten haben, die nach Protesten fragen, haben Sie jetzt leider Stimmbiometrie für diese Leute, sagt er.

Einige Beobachter, darunter große Technologieunternehmen, werfen umfassendere Fragen zu Siri auf. Letzten Monat Technologieüberprüfung berichtet, dass IBM seine Mitarbeiter gebeten hatte, die Funktion nicht zu verwenden, eine Entscheidung, die laut IBM durch die Notwendigkeit zum Schutz von Kontaktlisten und anderen sensiblen Unternehmensinformationen motiviert wurde. Es ist ein Anliegen, das andere Organisationen teilen sollten, glauben einige Experten. Wenn ich einen Geheimdienst oder einen großen Konzern leiten würde, würde ich einen solchen Dienst intern nicht zulassen, sagt Radu Sion, Informatiker an der Stony Brook University und führender Forscher im Bereich Cloud-Computing-Sicherheit.

Die Spracherkennung von Siri funktioniert so: Sie sprechen eine Frage oder Anfrage und die Sprachaufzeichnung wird an einen Apple-Server gesendet. Dort wird die Aufnahme in einem als Merkmalsextraktion bezeichneten Prozess zerlegt, der die Schallwelle numerisch transformiert und relevante Merkmale herauszieht. Diese durchlaufen eine Spracherkennungs-Engine, um das Gesagte zu interpretieren und in Text umzuwandeln. Siri verwendet dann Ressourcen wie das Internet, Ihre Kontaktliste (Call Dad) oder Ihren Standort (Wo ist das nächste thailändische Essen?), um auf Ihre Bedürfnisse einzugehen.

Es gibt keinen Grund, warum die anfängliche Aufgabe der Merkmalsextraktion nicht direkt am Telefon durchgeführt werden könnte, damit einige Elemente dort bleiben können. Tonhöhenmuster sind zum Beispiel wichtig, um den Sprecher zu identifizieren, aber nicht, um das Gesagte zu erkennen. Aus technologischer Sicht könnten Sie das Material senden, an dem der Erkenner arbeiten wird, aber nicht die vollständige Wellenform, sagt Natarajan. Dies sei zwar keine perfekte Lösung, sagt er, aber es würde die Privatsphäre erheblich verbessern – und, vielleicht noch wichtiger, die Wahrnehmung der Privatsphäre, da man das Sprachsignal aus den Funktionen nicht rekonstruieren kann.

James Glass, leitender Forscher am MIT und Leiter seines Gruppe gesprochene Sprachsysteme , sagt, dass die Onboard-Verarbeitung, auch als verteilte Spracherkennung bekannt, umfassend untersucht wurde. Es bietet keinen vollständigen Schutz, warnt er: Biometrische Verfahren, die die Sprecheridentifikation durchführen … verwenden typischerweise ähnliche Signaldarstellungen wie diejenigen, die nur Spracherkennung durchführen. Eine lokale [Verarbeitung] würde die Daten also nicht vollständig anonymisieren, wenn dies Ihr Ziel wäre.

Er fügt hinzu, dass der einfachste Weg, einen Stimmabdruck zu anonymisieren, darin besteht, die Aufzeichnungen von anderen Daten wie der Handynummer zu trennen. Es würde bedeuten, dass es für Systeme schwieriger wäre, sich an Ihre Stimme und Ihre Anfragen anzupassen, aber einige Leute könnten diese Option bevorzugen, wenn sie ihnen mehr Privatsphäre bietet, sagt er. Dies ist die Position, für die ich plädieren würde, da sie ähnlich ist, wie einige Apps gerade um Erlaubnis bitten, Ihren Standort zu verwenden.

Da immer mehr Sprachanwendungen in immer mehr Umgebungen auftauchen, wird der Schutz biometrischer Identifikatoren wichtiger, sagt Andrew Sudbury, Mitbegründer von Abine, einem Online-Datenschutzsoftwareunternehmen in Boston, das Verbrauchern hilft, die Verfolgung ihrer Online-Aktivitäten zu blockieren. Es ist wirklich fast ein Wendepunkt, da dies einen sehr schnellen Anstieg der Spracherkennung an vielen Orten ankündigen wird, sagt er. Und es wird einfacher, Menschen anhand ihrer Stimme ziemlich gut zu identifizieren.

Ein Grund, warum Apple möglicherweise vollständige Sprachabdrücke speichern möchte, besteht darin, die Möglichkeit zu behalten, solche Dienste bereitzustellen. Theoretisch könnte ein Spracherkenner wissen, dass Sie sprechen, nicht Ihr Ehepartner oder Ihr Kind, und Ihnen persönlich zugeschnittene Antworten geben. Es wäre ziemlich cool, wenn Sie von einem anderen Telefon aus anrufen und sie Sie identifizieren könnten, sagt Natarajan.

Eine riesige Datenbank mit den tatsächlichen Stimmen der Menschen würde dies ermöglichen. Solche Merkmale seien noch spekulativ, warnt er. Aber bei jeder Innovation geht es darum, Dinge zu tun, die derzeit niemand plant, sagt er. Auch ich würde gerne auf all diese Daten zugreifen.

verbergen