Finger weg von der Fernbedienung

Das Wohnzimmer von Ketan Banjara ist nicht mit Fernbedienungen überladen. Um die Musik zum Schweigen zu bringen, hält er einfach einen Finger an die Lippen. Und wenn er von der Couch aufsteht und das Zimmer verlässt, pausiert sein Fernsehbildschirm automatisch.

Banjara ist Mitbegründer von VorhersageBlick , ein Startup, das Blickerkennung, Gestenerkennung und Gesichtserkennung kombiniert, um natürlichere Möglichkeiten zu schaffen, alles vom Fernseher bis zum Auto zu steuern.

Während viele Leute gerade ihr erstes Touchscreen-Gadget in die Hände bekommen, ist PredictGaze eines von vielen Unternehmen, die darauf wetten, dass berührungslose Bedienelemente das nächste große Ding sein werden. Da nach vorne gerichtete Kameras in alle möglichen Geräte eingebettet sind, ist es nicht schwer vorstellbar.



Bisher wurde die Software des Unternehmens in eine iOS-Spiel um es Benutzern zu ermöglichen, ein nahrungsfressendes Monster mit Zahnlücken durch Kopfbewegungen zu kontrollieren. Die Technologie wird auch in einigen Geschäften in Japan getestet, in denen Kameras das Geschlecht, das Lächeln und die Zeit, die ein Kunde vor einem Produkt verbringt, verfolgen, in der Hoffnung, dass die Daten verwendet werden können, um den Umsatz zu steigern, indem einem zögerlichen Käufer zum richtigen Zeitpunkt ein Coupon angeboten wird oder durch die Verbesserung der Produktplatzierung.

PredictGaze stellt sich alle Arten von Anwendungen für seine Technologie vor, einschließlich der Verhinderung des Anschauens von Inhalten für Erwachsene im Fernsehen und der Feststellung, dass Sie am Steuer Ihres Autos einschlafen.

Die Technologie des Unternehmens kombiniert maschinelles Lernen und Computer-Vision-Algorithmen in einer Software, die eine Standard-VGA-Kamera verwenden kann, um herauszufinden, wo Sie hinschauen, welches Geschlecht Sie haben, ob Sie lächeln und vieles mehr. Es kann auch Gesten identifizieren, die dann alle in Aktionen von Geräten übersetzt werden können.

Um beispielsweise das Alter einer Person zu erkennen, hat PredictGaze seine Software mit Bildern von Menschen unterschiedlichen Alters trainiert. Diese Informationen können dann verwendet werden, um Ihr Alter anhand eines Bildes von Ihnen zu erkennen, wenn Sie vor einer Kamera stehen, die beispielsweise mit einem iPad mit dessen Software verbunden ist.

In ähnlicher Weise trainierte das Unternehmen seine Software mit Tausenden von Bildern von zum Schweigen bringenden und nicht zum Schweigen bringenden Aktionen, um diese Aktion zu identifizieren.

Um die Blickverfolgung durchzuführen, erfasst die Kamera kontinuierlich Ihre Augenbewegungen und verwendet diese Daten, um zu berechnen, wohin Sie schauen. Das kann beispielsweise in die Bewegung eines Charakters in einem Spiel übersetzt werden.

Es ist nicht so, dass wir verschiedene Technologien zusammengebracht haben. Das ist ein Unterschied. Es ist eine Technologie, die in der Lage ist, Gesichter, Gesten und Blicke zu verarbeiten, sagt Banjara.

Das Unternehmen sagt, dass es alle Daten auf dem Gerät verarbeitet, auf dem seine Software ausgeführt wird, anstatt sie an Remote-Server zu senden, und keines der von den Kameras aufgenommenen Bilder wird gespeichert. Die Technologie funktioniere auch bei wechselndem Licht, so das Unternehmen.

In Banjaras spärlich eingerichtetem Wohnzimmer in Mountain View, Kalifornien, zeigte mir das PredictGaze-Team eine Flut von Demos auf einem Fernseher, Laptop, iPad, iPhone und iPod Touch.

In einem saßen Banjara und ich vor einem großen Flachbildfernseher, der mit einem iPad verbunden war, auf dem die PredictGaze-Software lief. Als im Fernsehen ein Musikvideo von Rihanna dröhnte, stand Banjara auf und ging weg; nichts ist passiert. Ich ging auch weg und das Video pausierte, als die Frontkamera des iPads feststellte, dass niemand mehr zu sehen war.

In einer anderen Demo durchsuchte ein PredictGaze-Teammitglied mit einem iPad eine Webseite und blätterte mit seinem Blick durch die Seiten eines E-Books.

In einer dritten Demo saßen zwei von uns vor dem iPad und die Software ermittelte genau, wie viele Leute da waren, welches Geschlecht jede Person hatte, ob sie lächelte und mehr. Es konnte mein Geschlecht bestimmen, selbst wenn ich eine Brille trug und meine Haare bedeckte.

Im Moment sind einige der Bemühungen von PredictGaze sensibel und wählerisch: Wenn Banjara und ich auf der Couch sitzen blieben, uns aber zudrehten, hörte Rihanna ebenfalls auf zu singen. Und wenn ich das iPhone-Spiel gespielt habe, das die PredictGaze-Software enthält, pausierte es oft, weil es Probleme gab, meine Kopfbewegungen zu verfolgen. Aber mit ein bisschen Optimierung – und der Aufnahme von Weitwinkelkameras in Fernseher und Tablets, die mehr Action einfangen können – kann ich mir den Nutzen von PredictGaze vorstellen.

Das Unternehmen möchte sein Software Development Kit an Entwickler zur Verwendung in ihren Anwendungen verkaufen. Es plant auch, seine Technologie an Elektronikunternehmen zu verkaufen, die zunehmend Geräte mit Frontkameras verkaufen, damit PredictGaze direkt in Geräte integriert werden kann. Eventuell baut PredictGaze auch seine eigene Hardware.

Aber Roel Vertegaal, außerordentlicher Professor für Mensch-Computer-Interaktion an der Queen's University in Kingston, Ontario, und Direktor des Human Media Lab der Schule, ist nicht so beeindruckt von der Technologie von PredictGaze, die seiner Meinung nach nicht neu ist. Er und andere arbeiten seit Jahren an solchen Schnittstellen, sagt er.

Dennoch findet er es gut, dass eine solche Technologie kommerziell rentabel wird.

Ich glaube, so etwas ist wirklich nötig, sagt er.

Zurück in seinem Wohnzimmer denkt Banjara auch.

verbergen