Forscher verwandeln Twitter in Echtzeit-Sportkommentatoren

Die globale menschliche Bevölkerung kann als geografisch verteilte, multimodale Sensoren betrachtet werden, sagen Siqi Zhao von der Rice University in Houston und einige Kumpel.

Und wenn das der Fall ist, präsentiert die Twitter Firehose die Messwerte dieser Sensoren.

Wir wissen seit einiger Zeit, dass dieses Sensorsystem Echtzeit-Updates über Großereignisse wie Erdbeben, Waldbrände und das Sterben von Prominenten liefert.



Aber was ist mit häufigeren, sich schnell ändernden Ereignissen, fragen Zhao und Co.

Um das herauszufinden, haben diese Jungs während der Spielzeit von 101 American-Football-Spielen in der Saison 2010-2011 Tweets gesammelt. Das sind insgesamt 19 Millionen Tweets von 3,5 Millionen Tweetern.

Diese Tweets zu verstehen ist keine leichte Aufgabe. Zuerst mussten Zhao und seine Kumpels die fußballbezogenen Tweets vom Rest trennen. Das ist schwierig, da nur 11 Pet-Cent der Tweets Hashtags enthalten, die auf ihr Thema hinweisen.

Dann mussten sie herausfinden, auf welches Spiel sich jeder Tweet bezog. Auch dies kann schwierig sein, wenn bis zu 10 Spiele gleichzeitig gespielt werden, obwohl Zhao und Co. sagen, dass 60 Prozent der spielbezogenen Tweets Teamnamen enthalten.

Als nächstes mussten sie herausfinden, wann ein „Ereignis“ tatsächlich eingetreten ist; Dinge wie Touchdowns, Interceptions, Fumbles und Field Goals. Dies tun sie mit einem zweistufigen Prozess, der nach diesen Keywords sucht und die Häufigkeit misst, mit der sie innerhalb eines bestimmten Zeitfensters erscheinen. Wenn die Postrate über einen vorbestimmten Schwellenwert ansteigt, entscheidet das System, dass dieses Ereignis eingetreten ist.

Schließlich muss das System all dies in Echtzeit aus einer Feuerwehr mit bis zu 800 Tweets pro Sekunde machen

Es stellt sich heraus, dass Twitter mit der richtigen Filterung einen bemerkenswert genauen Kommentar liefern kann, der innerhalb weniger Sekunden genau ist. Zhao und Co. sagen, dass Hochtöner im Durchschnitt 17 Sekunden brauchen, um ein Spielereignis zu melden.

Seltsamerweise funktionierte ihr System bei allen von ihnen überwachten Fußballspielen gut, außer einem: dem Super Bowl selbst.

Das liegt daran, dass die schiere Anzahl von Tweets zu diesem Spiel die Fähigkeit von Twitter zu sättigen schien, sie zu verbreiten. So konnten Zhao und Co. keine Erhöhung der Schlagwort-Erscheinungsrate feststellen.

Abgesehen davon schienen diese Jungs eine großartige Möglichkeit gefunden zu haben, Echtzeitkommentare zu erstellen. Die meisten Techniken können ohne weiteres auf viele andere Sportspiele angewendet werden, sagen sie. Obwohl diese Spiele eine ähnlich große Fangemeinde erfordern würden. Fußball und Baseball sind offensichtliche Kandidaten, und ein Start-up für automatisierte Sportkommentare kann nicht weit davon entfernt sein.

Die Technik hat jedoch eine wichtige Einschränkung. Es funktioniert nur bei Events, bei denen Schlüsselwörter im Voraus bekannt sind – Dinge wie „Tor“ oder „Homerun“ und so weiter. Wenn unerwartete Ereignisse eintreten, nimmt das System keine Kenntnis.

Dies legt eine naheliegende Forschungsrichtung nahe: einen Weg zu finden, wichtige, aber unerwartete Ereignisse zu erkennen. Wir sind gespannt, was sich Zhao und Co. einfallen lassen.

Ref: arxiv.org/abs/1106.4300 : Menschen als Echtzeitsensoren sozialer und physischer Ereignisse: Eine Fallstudie zu Twitter und Sportspielen

verbergen