Ist es möglich, die Nutzer von sozialen Netzwerken wie z.B. Twitter als Basis zur Informationsextraktion bei Naturkatastrophen einzusetzen und damit z.B. als festen Bestandteil, neben teuren Sensorsystemen, im Bereich der Erdbebenvorhersage und Früherkennung von Naturkatastrophen zu nutzen? Mit dieser Thematik, entsprechender Literatur und einigen Studien hat sich kürzlich unser Gastautor Tobias Bödger auseinandergesetzt. Lesen Sie die Zusammenfassung der zum Thema durchgeführten Studie von CROOKS, A.; A. CROITOROU; A. STEFANIDIS & J. RADZIKOWSKI (2012): #Earthquake: Twitter as a Distributed Sensor System. Transactions in GIS, 17(1): 124-147 hier.
1. Einleitung
Die Verwendung sozialer Netzwerke hat in den letzten Jahren verstärkt zugenommen. Vor allem, wenn es darum geht relevante Themen und Ereignisse zu teilen oder seine Meinung diesbezüglich kundzugeben. Ob die Unruhen in Teheran 2009 oder die Katastrophe in Fukushima 2011: Es gibt einen Zusammenhang zwischen der Aktivität von Nutzern sozialer Netzwerke und relevanten Ereignissen.
In dem vorliegenden Paper verfolgen die Autoren das Ziel räumliche und zeitliche Charakteristika über die Twitter Aktivität von Nutzern bezüglich eines Erdbebens an der Ostküste der USA nahe Mineral (VA) herauszustellen und zu analysieren. Die User fungieren in diesem Sinne als Sensoren, die ein Erdbeben wahrnehmen und Informationen darüber bei Twitter veröffentlichen. Um diese gesammelten Ergebnisse einschätzen zu können, sollen diese in einem weiteren Schritt mit den Reaktionen auf der Internetseite „Did you feel it?“ des U.S. Geological Survey (USGS), einem Internetportal, welches Bürgerinfos zu Erdbeben sammelt und modelliert, verglichen werden. Die anleitende Frage dieses Paper ist, ob anhand der Filterung von Tweets, die sich auf dieses Ereignis beziehen, ein Haupteinflussgebiet des Bebens identifiziert und lokalisiert werden kann sowie ob Twitter demnach als Frühwarnsystem für Erdbeben und ähnliche Naturereignisse fungieren könnte.
2. Datengrundlage
Die Autoren greifen als Datengrundlage auf ein 1% Sample an Twitter Meldungen zurück, das von Twitter (via API) frei zur Verfügung gestellt wird. Das von den Autoren verwendete Sample beinhaltet Tweets, die in den ersten acht Stunden nach Eintreten des Erbebens erstellt wurden und in denen die Schlüsselwörter „earthquake“ oder „earth“ und „quake“ oder die Hashtags „#earthquake“ oder „#quake“ vorkommen (= 144.892 Tweets). Von diesen Twitter Meldungen gehen aber nur die in die analytische Betrachtung ein, die entweder über geographische Koordinaten oder deskriptiv geocodiert waren. Dies sind lediglich 14,7%, sodass 21.362 Twitter Nachrichten in die Studie einbezogen werden (S. 126-132).
3. Ergebnisse
Etwa 54 Sekunden nach Beginn des Erdbebens, dass eine Magnitude von 5,8 hatte und von der Ostküste bis Illinois im Westen und von Maine im Norden bis ins Zentrum von Georgia im Süden zu spüren war, erfolgte der erste Tweet, nach zwei Minuten waren es rund hundert, nach fünf bereits tausend. Da es sich um ein 1% Sample handelt, ziehen die Autoren in Betracht die Anzahl der Tweets mit dem Faktor 100 multiplizieren zu können, um die tatsächliche Anzahl an Tweets bezüglich des Ereignisses zu erhalten: Somit gehen sie in der Realität von 10.000 Tweets nach zwei Minuten und 100.000 nach fünf Minuten aus (S. 132).
Die räumlichen und zeitlichen Charakteristika veranschaulichen die Autoren anhand einiger Abbildung. Sie stellen eine Akkumulation von Tweets im Bereich von 700-950 km vom Epizentrum (Bereich bis Boston und Chicago) über die ersten 400 Sekunden nach dem Beben fest und identifizieren damit diesen Bereich als Haupteinflussgebiet des Erdbebens, da dort die meisten Reaktionen über Twitter gezeigt werden (Abb. 4, 6 & 7). Vor allem die Hauptmetropolen wie Washington D.C. Philadelphia und New York City weisen eine große Anzahl an Tweets in Bezug auf das Beben auf. In unmittelbarer Nähe des Epizentrums sind die Twitterreaktionen am schnellsten. Die Reaktionszeit (abgelaufene Zeit zwischen Beginn des Bebens und Tweet) nimmt im Bereich bis 950 km dann mit zunehmender Entfernung vom Epizentrum aber (quasi linear) zu, was natürlich damit einhergeht, dass die Ausbreitung des Bebens Zeit benötigt. Zudem werden die Tweets mit zunehmender Entfernung immer weniger (S. 132-139).
Weiterhin stellen die Autoren fest, dass die Reaktionen auf Twitter außerhalb des direkten Einflussgebiets wieder schneller werden. Diese Meldungen sind natürlich keine direkten Reaktionen auf das physikalische Ereignis an sich. Daher passen sie die Reaktionszeit mit Hilfe der Formel der USGS für die theoretische Ankunftszeit eines Erdbebens in Bezug auf die örtliche Ankunftszeit an. So bekommen Tweets, die außerhalb der 950 km lokalisiert wurden, wie beispielsweise Meldungen aus Salt Lake City, Seattle oder Los Angeles, teilweise negative Reaktionszeiten, da sie bereits vor dem potentiellen Auftreten des Bebens erstellt wurden (Abb. 6). Die Autoren nehmen diese Tatsache als Argument, dass Twitter als Frühwarnsystem fungieren könnte (S. 136-137).
Um die zeitliche und räumliche Verbreitung von Tweets in einem weiteren Schritt zu visualisieren, integrieren die Autoren die Meldungen in Karten, in denen auch die Ausbreitung der Erdbebenwellen zu sehen sind (Abbildung 8 & 9). Sie stellen anhand dieser Grafiken fest, dass die Tweets der ersten fünf bis zehn Minuten nach dem Auftreten des Bebens am geeignetsten sind, um ein Einflussgebiet zu identifizieren. Weiterhin ist ersichtlich, dass nach zwei bis drei Minuten vermehrt Meldungen von außerhalb des Einflussgebiets kommen, sodass sich das Wissen über das Erbeben schneller verbreitet als das Ereignis selbst (S. 136-138).
Abschließend werden noch die Reaktionen auf „Did you feel it?“ (DYFI) mit den Twitter Meldungen verglichen. Twitter verzeichnet im Vergleich zu DYFI in kürzester Zeit einen schnellen Anstieg an Meldungen, der aber auch nach rund einer Stunde stark abflacht. Die Meldungen auf DYFI nehmen nur langsam zu (Abb. 10). Vergleicht man die absoluten Zahlen so weist DYFI 125.000 Meldungen in den ersten acht Stunden auf und Twitter, wie bereits erwähnt, 21.362, wobei das Twitter Sample ja nur 1% beinhaltet und die Autoren somit von 2,3 Millionen Tweets über acht Stunden ausgehen. Die Herkunftsverteilung der Meldungen auf beiden Portalen ist dagegen vergleichbar (Abb. 11 & 12; S. 140-143).
Aufgrund all dieser Ergebnisse folgern die Autoren, dass Twitter durchaus zur Lokalisierung eines Einflussgebiets und als Frühwarnsystem fungieren könnte und nicht unterschätzt werden sollte.
4. Weitere Studien
Die Autoren Crooks et al. sind nicht die einzigen die sich mit dieser Thematik auseinandersetzen. SAKAI ET AL. (2010) und DOAN ET AL. (2012) filterten ebenfalls Twitter Meldung in Bezug auf Erdbeben in Japan und konnten einen Zusammenhang zwischen Event und der Aktivität von Usern feststellen. Auch sie stellen hervor, dass Twitter den Vorteil genießt schnell Informationen verbreiten zu können und durch die zunehmende Verbreitung von Smartphones nicht unterschätzt werden sollte. Des Weiteren stellt Twitter Daten kostenlos zur Verfügung, was vor allem in den Regionen, wo Seismographen spärlich sind, von Vorteil sein kann. Die Analyse von EARLE ET AL. (2011) kommt zu ähnlichen Ergebnissen.
5. Fazit & Kritik
Sicherlich kann abschließend festgehalten werden, dass Twitter ein gewisses Potential zu Identifikation eines Einflussgebiets eines Bebens haben kann und gewisse Vorteile beinhaltet. Die Folgerung von CROOKS ET AL., dass Twitter vor allem in Kopplung mit anderen Netzwerken und Sensoren das Katastrophenmanagement erleichtern könnte, erscheint plausibel. Die Autoren veranschaulichen dabei ihre Thesen mit Grafiken, betten die Thematik sinnvoll in den Forschungskontext ein und verweisen auf Herausforderungen dieser Thematik für die Zukunft.
Jedoch muss bedacht werden, dass Twitter keine quantitativen Daten liefern kann, sondern lediglich qualitative und damit zum Beispiel keine Aussagen über die Stärke eines Ereignisses treffen kann. Weiterhin können Lokalisierungsstrategien von Tweets fehlerhaft sein und genauso zu Fehlinterpretationen führen wie die Twitter Nachricht an sich: „I’m watching an Earthquake documentation“ wäre bei CROOKS ET AL. als Meldung in Bezug auf das Beben wohl in die Studie mit eingegangen, obwohl sich diese Nachricht nicht auf das Ereignis bezieht. Diesbezüglich müsste geschaut werden, wie diese Fehlinterpretationen minimiert werden könnten. Weiterhin bezog sich ihre Filterung nach Tweets nur auf die Suchwörter „earthquake“ oder „earth“ und „quake“. Die Integration weiterer Schlüsselwörter (z.B. „shaking“, „temblor“ oder „tremor“) hätte diese Analyse ausbauen können. Des Weiteren sollte man sich stets bewusst sein, dass User als Sensoren zu hinterfragen sind, da sie im Vergleich zu physikalischen Sensoren nicht konstant und verlässlich sind. So stellt sich die Frage, was passiert, wenn ein Erdbeben in der Nacht auftritt, wenn die Nutzer schlafen, wenn sich ein solches Event über dem Meer ereignet oder beispielsweise in bevölkerungsarmen oder in sozial schwächeren Regionen, wo Internet und Smartphones spärlich sind. Weiterhin ist die Frage, was passiert, wenn das Erbeben so stark ist, dass an eine Meldung über Twitter nicht mehr zu denken ist, weil der Nutzer mit anderen Problemen zu kämpfen hat. Ebenfalls ist nicht sicher, inwiefern sich User über Twitter in Zukunft aufgrund der Diskussion der Privatsphäre überhaupt noch lokalisieren lassen. Eine Ortsangabe bei Twitter ist für die Detektion eines Erdbebens aber sicherlich von Nöten. Aufgrund dieser Probleme ist klar, dass soziale Netzwerke als Frühwarnsystem Seismographen nicht ersetzen können, sondern lediglich zu ergänzen vermögen.
Ebenso sollte beachtet werden, dass diese Studie nach dem Erdbeben angefertigt wurde. Eine derartige Analyse in real-time würde sich eventuell anders gestalten. Auch sagen die Autoren wenig zu der verwendeten Methode zur Lokalisierung der Tweets, sondern erwähnen nur, dass sie die Meldungen einbeziehen, bei denen der Ort entweder durch den Nutzer (in seinem Profil) oder durch die Applikation (Ortungsfunktion) zur Verfügung gestellt wurde. Dabei kann dies zu falschen Rückschlüssen führen, denn Nutzer können falsche Orte in ihrem Profil angeben oder sich eventuell zur Zeit des Tweets im Urlaub befinden, sodass die Meldungen falsch lokalisiert werden würden. Auch ist die Ortungsfunktion über Twitter fehlerbehaftet und ungenau, sodass es auch hier zu falschen Lokalisierungen kommen könnte. Weiterhin verwenden die Autoren als ein Argument für Twitter als Frühwarnsystem, dass außerhalb des direkten Einflussgebiets über das Ereignis getwittert wurde bevor es an diesen Orten angekommen ist (vgl. S. 136). Jedoch stellt sich hierbei die Frage, ob die Twittermeldung wirklich von außerhalb des Einflussgebiets kommt: Ein User mit L.A. als Wohnort im Profil kann durchaus zur Zeit des Bebens in Virginia gewesen sein und von dort getwittert haben; lokalisiert würde sein Tweet bei CROOKS ET AL. aber fälschlicherweise nach L.A. Außerdem stellt sich die Frage, ob das Erbeben überhaupt in entfernte Regionen vordringen wird, da über dessen Stärke via Twitter keine Aussagen getroffen werden können. In Salt Lake City wurde beispielsweise eine Minute vor dem potentiellen Eintreten des Bebens über dieses Ereignis via Twitter berichtet. Ob dieser Pufferzeitraum ausreichen dürfte, um Maßnahmen einzuleiten, steht doch sehr zur Frage. Die Ergebnisse dieser Studie müssen also auch mit Vorsicht genossen werden.
Grundlagentext:
CROOKS, A.; A. CROITOROU; A. STEFANIDIS & J. RADZIKOWSKI (2012): #Earthquake: Twitter as a Distributed Sensor System. Transactions in GIS, 17(1): 124-147.
Weitere Quellen:
EARLE, P.S.; D.C. BOWDEN & M. GUY (2011): Twitter earthquake detection: earthquake monitoring in a social world. Annals of Geophysics, 54(6): 708-715. http://www.annalsofgeophysics.eu/index.php/annals/article/view/5364/5494 (20.05.2013).
DOAN, S.; B.-K. HO VO. & N. COLLIER (2012): An Analysis of Twitter Messages in the 2011 Tohoku Earthquake. Electronic Healthcare, 91: 58-66. http://arxiv.org/ftp/arxiv/papers/1109/1109.1618.pdf (20.05.2013).
SAKAI, T.; M. OKAZAKI & Y. MATSUO (2010): Earthquake shakes Twitter users: real-time event detection by social sensors. Proceedings of the 19th international conference on World wide web: 851-860. http://dl.acm.org/citation.cfm?id=1772777&bnc=1 (20.05.2013).
Über den Gastautor Tobias Bödger
Tobias Bödger ist Student der Universität Heidelberg (Master Geographie) Schwerpunkt erneuerbare Energien, Gloabal Change, Katastrophen- und Risikomanagement und hat seinen Bachelor in Osnabürck sowie Montréal absolviert.