https://frosthead.com

Die Welt Laut Twitter in Karten

Tweets aus der ganzen Welt, die im Rahmen einer neuen Studie nach Orten geordnet wurden. Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Es ist schwer einzuschätzen, wie schnell und gründlich Twitter die Welt erobert hat. Noch vor sieben Jahren, im Jahr 2006, war es eine Idee, die auf einem Block Papier skizziert wurde. Derzeit wird der Dienst von geschätzten 554 Millionen Nutzern genutzt - eine Zahl, die fast 8 Prozent aller Menschen auf der Erde ausmacht - und es wurden geschätzte 170 Milliarden Tweets gesendet, wobei diese Zahl jeden Tag um etwa 58 Millionen zunimmt .

Alle diese Tweets bieten eine unschätzbare Quelle für Nachrichten, Unterhaltung, Unterhaltung und Verbindung zwischen Menschen. Für Wissenschaftler sind sie aber auch etwas ganz anderes: Rohdaten.

Da Twitter über eine offene API verfügt (mit der Tweets als unformatierte, analysierbare Daten heruntergeladen werden können) und viele Tweets mit Geotags versehen sind, können Forscher Milliarden dieser Tweets verwenden und nach Standorten analysieren, um mehr über die Geographie des Menschen auf der ganzen Welt zu erfahren. Im letzten Herbst analysierte ein Team der Universität von Illinois im Rahmen des globalen Twitter-Herzschlags die Sprache und den Ort von über einer Milliarde Tweets aus den USA, um ausgefeilte Karten von Dingen wie positiven und negativen Emotionen zu erstellen, die während des Hurrikans Sandy oder der Unterstützung für Barack zum Ausdruck kamen Obama oder Mitt Romney während der Präsidentschaftswahlen.

Wie Joshua Keating im Blog "War of Ideas" von Foreign Policy bemerkte, sind Mitglieder derselben Gruppe, angeführt von Kalev Leetaru, in letzter Zeit noch einen Schritt weiter gegangen. Wie in einer neuen Studie Anfang dieser Woche im Online - Journal First Monday veröffentlicht, analysierten sie die Standorte und Sprachen von 46.672.798 Tweets, die zwischen dem 23. Oktober und dem 30. November des vergangenen Jahres veröffentlicht wurden, um ein beeindruckendes Porträt menschlicher Aktivitäten rund um den Planeten zu erstellen oben auf dem Post. Sie nutzten Twitter decahose, einen Datenstrom, der zu jedem beliebigen Zeitpunkt 10 Prozent aller Tweets weltweit erfasst (im Zeitraum insgesamt 1.535.929.521), und konzentrierten sich lediglich auf die Tweets mit den dazugehörigen geografischen Daten.

Wie die Forscher bemerken, entspricht die geografische Dichte von Tweets in vielen Regionen - insbesondere in der westlichen Welt, in der Computer, Mobilgeräte und Twitter zu Spitzenzeiten verwendet werden - weitgehend den Raten der Elektrifizierung und des Lichtverbrauchs. Infolgedessen sehen die Karten von Tweets (wie die Detailansicht der kontinentalen USA unten) nachts wie Satellitenbilder von künstlichem Licht aus.

Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Als Test für die Übereinstimmung von Tweets mit der künstlichen Lichtnutzung erstellten sie die unten stehende zusammengesetzte Karte, in der Tweets als rote Punkte und die nächtliche Beleuchtung als blaue Punkte angezeigt werden. Bereiche, in denen sie in der Häufigkeit übereinstimmen (und sich effektiv gegenseitig auslöschen), werden als weiß angezeigt, und Bereiche, in denen einer den anderen überwiegt, bleiben rot oder blau. Viele Gebiete sehen mit einigen wichtigen Ausnahmen ziemlich weiß aus: Iran und China, in denen Twitter verboten ist, sind auffallend blau, während viele Länder mit relativ niedrigen Elektrifizierungsraten (bei denen Twitter jedoch immer noch beliebt ist) rot erscheinen.

Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Das Projekt wurde noch interessanter, als die Forscher ein automatisiertes System verwendeten, um Tweets nach Sprache aufzuteilen. Die häufigste Sprache in Twitter ist Englisch, das in 38, 25 Prozent aller Tweets vertreten ist. Danach folgten Japanisch (11, 84 Prozent), Spanisch (11, 37 Prozent), Indonesisch (8, 84 Prozent), Norwegisch (7, 74 Prozent) und Portugiesisch (5, 58 Prozent).

Das Team erstellte eine Karte aller Tweets, die in den 26 beliebtesten Sprachen verfasst wurden, wobei jede in einer anderen Farbe dargestellt ist:

Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Während die meisten Tweets der Länder von ihren Amtssprachen dominiert werden, wird offengelegt, dass viele Tweets in einer Vielzahl anderer Sprachen enthalten sind. Wenn Sie genau hinschauen, sehen Sie einen Regenbogen von Farben, die auf subtile Weise aus den grauen Punkten (englischen Tweets) auftauchen, die die USA bedecken:

Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Unter anderem untersuchte das Forschungsteam sogar die Geografie von Retweeting und Referenzierung - die durchschnittliche Entfernung zwischen einem Benutzer und einer Person, die er retweetet, sowie die durchschnittliche Entfernung zwischen diesem Benutzer und einer Person, die er oder sie einfach in einem Tweet referenziert. Im Durchschnitt betrug die Entfernung für einen Retweet 1.115 Meilen und 1.118 als Referenz. Es bestand jedoch ein positiver Zusammenhang zwischen der Häufigkeit, mit der ein bestimmter Benutzer einen anderen Benutzer retweetet oder auf ihn verwiesen hat, und seiner Entfernung: Paare von Benutzern mit nur einer Handvoll Interaktionen waren insgesamt wahrscheinlicher enger beieinander (500-prozentig). 600 Meilen voneinander entfernt) als diejenigen mit Dutzenden von Retweets und Referenzen zwischen ihnen.

Dies weist darauf hin, dass Benutzer, die weit voneinander entfernt wohnen, Twitter häufiger für die regelmäßige Interaktion nutzen. Eine Erklärung könnte sein, dass die Entitäten mit den meisten Followern - und damit den meisten Referenzen und Retweets - häufig Berühmtheiten, Organisationen oder Unternehmen sind, Benutzer, mit denen Menschen vertraut sind, die jedoch keine persönliche Beziehung haben. Eine globale Karte der Retweets zwischen Benutzern finden Sie unten:

Klicken um zu vergrößern. Bild über den Ersten Montag / Leetaru et. al.

Das Papier ging noch detaillierter auf andere Daten im Zusammenhang mit Tweets ein: Das Verhältnis zwischen der Berichterstattung in den Hauptnachrichten und der Anzahl der Tweets in einem Land (Europa und die USA erhalten überproportionale Berichterstattung in den Medien, während Lateinamerika und Indonesien übersehen werden), die Orte, die Twitter hat fügte die meisten Nutzer in letzter Zeit hinzu (der Nahe Osten und Spanien) und die Orte, an denen Nutzer im Durchschnitt die meisten Follower haben (Südamerika und die Westküste).

All diese Daten weisen einige Einschränkungen auf. Zum einen machen die analysierten Tweets nur 0, 3 Prozent aller gesendeten Tweets aus, sodass sie möglicherweise nicht alle Twitter-Muster angemessen wiedergeben, insbesondere wenn Benutzer, die Geotagging aktivieren, sich anders verhalten als andere. Darüber hinaus haben sich in der sich schnell verändernden Welt von Twitter einige Trends möglicherweise bereits seit dem letzten Herbst erheblich geändert. Da Twitter jedoch weiter wächst und immer mehr Daten zur Verfügung stehen, wird diese Art der Analyse offensichtlich nur bei Demografen, Informatikern und anderen Forschern immer beliebter.

Die Welt Laut Twitter in Karten