Als Reaktion auf eine verheerende Cholera-Epidemie, die sich in London ausbreitete, stellte der britische Arzt John Snow 1854 eine Idee vor, die das Gebiet der öffentlichen Gesundheit revolutionieren würde: die epidemiologische Karte. Er zeichnete Fälle von Cholera in verschiedenen Stadtvierteln auf und zeichnete sie auf einer Karte auf, die sich nach den Patientenresidenzen richtete. Dabei stellte er fest, dass eine einzige kontaminierte Wasserpumpe für einen Großteil der Infektionen verantwortlich war.
Die Karte überzeugte ihn - und schließlich die öffentlichen Behörden - davon, dass die Miasma-Theorie der Krankheit (die behauptete, dass sich Krankheiten über schädliche Gase ausbreiten) falsch war und dass die Keimtheorie (die zu Recht behauptete, dass die Mikroorganismen schuld waren) wahr war. Sie verriegelten den Griff der Pumpe, die für den Ausbruch verantwortlich war, und signalisierten einen Paradigmenwechsel, der den Umgang mit Infektionskrankheiten und damit die Hygiene nachhaltig veränderte.
Die Kartentechnologie und die Krankheit sind sehr unterschiedlich, aber es gibt eine gewisse Ähnlichkeit zwischen der Karte von Snow und einem neuen Projekt, das von einer Gruppe von Forschern unter der Leitung von Henry Kautz von der Universität von Rochester durchgeführt wurde. Durch die Entwicklung von Algorithmen, die Grippetrends erkennen und anhand von Schlüsselwörtern in öffentlich verfügbaren Tweets mit Geotags Vorhersagen treffen können, wird ein neuer Ansatz zur Untersuchung der Übertragung von Krankheiten verfolgt, der die Art und Weise, wie wir die Bewegung von Krankheiten in der Gesellschaft untersuchen und verfolgen, verändern könnte .
„Wir können uns Menschen als Sensoren vorstellen, die die Welt um sich herum betrachten und dann über das berichten, was sie in den sozialen Medien sehen und erleben“, erklärt Kautz. "Dadurch können wir detaillierte Messungen auf einer Populationsskala durchführen, und es ist keine aktive Beteiligung der Benutzer erforderlich."
Mit anderen Worten, wenn wir twittern, dass wir gerade von einem schmerzhaften Husten und Fieber geplagt wurden, liefern wir unwissentlich umfangreiche Daten für ein riesiges Experiment im Bereich der öffentlichen Gesundheit, Informationen, mit denen Forscher die Bewegung von Krankheiten wie Grippe verfolgen können in hoher Auflösung und in Echtzeit.
In Kautz 'Projekt SocialHealth wurden Tweets und andere soziale Medien verwendet, um eine Reihe von Problemen im Bereich der öffentlichen Gesundheit zu verfolgen. Vor kurzem haben sie begonnen, mithilfe von Tweets Lebensmittelvergiftungen in New Yorker Restaurants zu überwachen, indem sie alle Personen protokollierten, die Beiträge veröffentlicht hatten Tweets aus einem Restaurant mit Geotags versehen und anschließend die nächsten 72 Stunden auf Erbrechen, Durchfall, Bauchschmerzen, Fieber oder Schüttelfrost hin überprüft. Dabei entdeckten sie 480 wahrscheinliche Fälle von Lebensmittelvergiftungen.
Wenn sich die Jahreszeit ändert, ist es ihre Arbeit, das Influenzavirus zu verfolgen, das am augenöffnendsten ist. In ähnlicher Weise hat Google Flu Trends versucht, mithilfe von Google-Suchern die Grippebewegung zu verfolgen. Das Modell hat jedoch den Ausbruch des letzten Jahres stark überschätzt, möglicherweise weil die Medienberichterstattung über Grippe die Menschen dazu veranlasste, grippebezogene Fragen zu stellen. Die Twitter-Analyse stellt einen neuen Datensatz mit einigen Eigenschaften dar - eine höhere geografische Auflösung und die Fähigkeit, die Bewegung eines Benutzers im Laufe der Zeit zu erfassen -, die bessere Vorhersagen liefern könnten.
Zu Beginn ihres Grippeverfolgungsprojekts untersuchten die SocialHealth-Forscher New York und sammelten drei Monate lang monatlich etwa 16 Millionen öffentliche Tweets mit Geotags von 600.000 Nutzern. Unten sehen Sie einen Zeitraffer eines New Yorker Twitter-Tages mit verschiedenen Farben, die unterschiedliche Frequenzen von Tweets an diesem Ort darstellen (Blau und Grün bedeuten weniger Tweets, Orange und Rot bedeuten mehr):
Um all diese Daten zu nutzen, entwickelte sein Team einen Algorithmus, der feststellt, ob jeder Tweet einen Bericht über grippeähnliche Symptome darstellt. Früher hatten andere Forscher einfach nach Stichwörtern in Tweets gesucht (z. B. „krank“), aber sein Team stellte fest, dass der Ansatz zu falsch positiven Ergebnissen führt: Viel mehr Benutzer twittern, dass sie keine Hausaufgaben mehr haben als sie sich krank fühlen.
Um dies zu berücksichtigen, sucht der Algorithmus seines Teams nach drei Wörtern in einer Reihe (anstatt nach einem) und berücksichtigt, wie oft die jeweilige Sequenz auf eine Krankheit hinweist, basierend auf einer Reihe von Tweets, die manuell gekennzeichnet wurden. Der Ausdruck "krank von Grippe" ist zum Beispiel stark mit Krankheit korreliert, während "krank und müde" dies weniger ist. Einige bestimmte Wörter - Kopfschmerzen, Fieber, Husten - stehen in engem Zusammenhang mit Krankheit, unabhängig davon, in welcher Drei-Wörter-Reihenfolge sie vorkommen.
Sobald diese Millionen von Tweets codiert waren, konnten die Forscher ein paar faszinierende Dinge mit ihnen machen. Zunächst untersuchten sie die Veränderungen bei grippebezogenen Tweets im Zeitverlauf und verglichen sie mit den vom CDC gemeldeten Grippewerten, um zu bestätigen, dass die Tweets den allgemeinen Trend bei den Gripperaten genau wiedergaben. Im Gegensatz zu CDC-Daten sind sie jedoch fast in Echtzeit verfügbar und nicht ein oder zwei Wochen später.
Sie gingen aber auch tiefer und betrachteten die Interaktionen zwischen verschiedenen Benutzern - dargestellt durch zwei Benutzer, die innerhalb derselben Stunde vom selben Ort tweeten (die GPS-Auflösung beträgt etwa einen halben Stadtblock) -, um zu modellieren, wie wahrscheinlich es ist, dass eine gesunde Person ist würde krank werden, wenn ich mit jemandem mit Grippe in Kontakt komme. Offensichtlich haben sich zwei Personen, die aus demselben Block mit einem Abstand von 40 Minuten tweeten, nicht unbedingt persönlich getroffen, aber die Wahrscheinlichkeit, dass sie sich getroffen haben, ist etwas höher als bei zwei zufälligen Benutzern.
Wenn Sie sich einen ausreichend großen Datensatz mit Wechselwirkungen ansehen, entsteht ein Bild der Übertragung. Sie stellten fest, dass sich die Wahrscheinlichkeit, am nächsten Tag an Grippesymptomen zu erkranken, von weniger als einem Prozent auf 20 Prozent erhöht, wenn ein gesunder Benutzer auf 40 andere Benutzer stößt, die sich als an Grippe erkrankt melden. Bei 60 Interaktionen steigt diese Zahl auf 50 Prozent.
Das Team untersuchte auch die Interaktionen auf Twitter selbst, isolierte aufeinanderfolgende Benutzerpaare und nannte sie „Freundschaften“. Auch wenn viele Twitter-Beziehungen nur im Web bestehen, entsprechen einige Interaktionen dem realen Leben, und sie stellten fest, dass es sich um einen Benutzer handelt Wer zehn Freunde hat, die sich als krank melden, erkrankt am nächsten Tag mit 28 Prozent höherer Wahrscheinlichkeit. Insgesamt konnte der Algorithmus unter Verwendung dieser beiden Arten von Interaktionen mit einer Genauigkeit von 90 Prozent vorhersagen, ob eine gesunde Person krank werden würde (und darüber twittern würde).
Wir befinden uns noch im Anfangsstadium dieser Forschung, und es gibt viele Einschränkungen: Die meisten Leute nutzen Twitter immer noch nicht (ja, wirklich), und selbst wenn, twittern sie möglicherweise nicht darüber, krank zu werden.
Könnte ein solches System jedoch weiterentwickelt werden, sind alle möglichen Anwendungen leicht vorstellbar. Ihr Smartphone könnte Sie beispielsweise automatisch warnen, wenn Sie zu viel Zeit an Orten verbracht haben, an denen Menschen mit Grippe leben, und Sie auffordern, nach Hause zu gehen, um sich nicht mehr auf den Infektionsweg zu begeben. Die Bewohner einer ganzen Stadt könnten sogar gewarnt werden, wenn sie kurz vor einem Ausbruch stünden.
Trotz der 150 Jahre, die wir vor dem Durchbruch von John Snow bei der Kartierung von Krankheiten verbracht haben, ist klar, dass es immer noch Aspekte von Krankheitsinformationen gibt, die wir nicht vollständig verstehen. Nach wie vor könnte die Zuordnung der Daten dazu beitragen, die Antworten zu erhalten.