https://frosthead.com

Möglicherweise fehlt jetzt die große Mehrheit der Rohdaten aus alten wissenschaftlichen Studien

Eine der Grundlagen der wissenschaftlichen Methode ist die Reproduzierbarkeit der Ergebnisse. In einem Labor auf der ganzen Welt sollte ein Forscher in der Lage sein, dasselbe Fach wie ein anderer Wissenschaftler zu studieren und dieselben Daten zu reproduzieren oder dieselben Daten zu analysieren und dieselben Muster festzustellen.

Aus diesem Grund sind die Ergebnisse einer heute in Current Biology veröffentlichten Studie so besorgniserregend. Als eine Gruppe von Forschern versuchte, den Autoren von 516 zwischen 1991 und 2011 veröffentlichten biologischen Studien eine E-Mail zu senden und nach den Rohdaten zu fragen, stellte sie bestürzt fest, dass mehr als 90 Prozent der ältesten Daten (aus Papieren, die vor mehr als 20 Jahren verfasst wurden) vorhanden waren nicht zugänglich. Insgesamt konnten sie selbst unter Einbeziehung der erst 2011 veröffentlichten Papiere die Daten nur für 23 Prozent aufspüren.

"Jeder weiß, dass, wenn man einen Forscher nach Daten aus alten Studien fragt, diese säumen und hauen, weil sie nicht wissen, wo sie sich befinden", sagte Timothy Vines, ein Zoologe an der Universität von British Columbia, der leitete der Aufwand. "Es gab jedoch nie systematische Schätzungen, wie schnell die Daten der Autoren tatsächlich verschwinden."

Um ihre Einschätzung zu treffen, wählte seine Gruppe eine Art von Daten aus, die im Laufe der Zeit relativ konsistent waren - anatomische Messungen von Pflanzen und Tieren - und grub in dem Zeitraum, in dem diese Art von Daten verwendet wurde, für jedes ungerade Jahr zwischen 25 und 40 Artikel aus wenn sie die rohen Zahlen jagen könnten.

Eine überraschende Menge ihrer Anfragen wurde bereits im ersten Schritt gestoppt: Für 25 Prozent der Studien konnten keine aktiven E-Mail-Adressen gefunden werden, da ungültige Adressen auf dem Papier selbst aufgeführt waren und bei der Websuche keine aktuellen gefunden wurden. Für weitere 38 Prozent der Studien führten ihre Anfragen zu keiner Antwort. Weitere 7 Prozent der Datensätze gingen verloren oder waren unzugänglich.

"Manchmal wurde es beispielsweise auf dreieinhalb Zoll großen Disketten gespeichert, sodass niemand darauf zugreifen konnte, da sie nicht mehr über die richtigen Laufwerke verfügten", sagt Vines. Da die Grundidee, Daten zu speichern, so ist, dass sie von anderen in der zukünftigen Forschung verwendet werden können, macht diese Art der Überalterung die Daten im Wesentlichen unbrauchbar.

Dies mag wie ein banales Hindernis erscheinen, aber Wissenschaftler sind genauso wie wir alle - sie ändern ihre E-Mail-Adressen, bekommen neue Computer mit unterschiedlichen Laufwerken und verlieren ihre Dateisicherungen -, sodass diese Trends schwerwiegende, systembedingte Probleme in der Wissenschaft widerspiegeln.

Die Aufbewahrung von Daten ist so wichtig, dass man sich daran erinnern sollte, denn es ist unmöglich vorherzusagen, in welche Richtungen sich die Forschung in Zukunft entwickeln wird. Zum Beispiel hat Vines seine eigenen Forschungen an zwei in Osteuropa beheimateten Krötenarten durchgeführt, die im Begriff zu sein scheinen, zu hybridisieren. In den 1980er Jahren habe ein separates Forscherteam an demselben Thema gearbeitet und dabei auf ein altes Papier gestoßen, in dem die Verbreitung dieser Kröten in den 1930er Jahren dokumentiert war. Da die Wissenschaftler wussten, dass sich ihre Verteilung in den vergangenen Jahrzehnten relativ wenig verändert hatte, konnten sie alle Arten von Berechnungen durchführen, die sonst nicht möglich gewesen wären. "Diese ursprünglichen Daten, die aus einer sehr kleinen, in polnischer Sprache verfassten Studie stammen, waren für Forscher, die 70 Jahre später hinzukamen, unglaublich nützlich", sagt er.

Es gibt auch die Tatsache, dass ein Großteil dieser Forschung mit öffentlichen Mitteln finanziert wird, ein Großteil davon durch Zuschüsse, die vorschreiben, dass die resultierenden Daten der Öffentlichkeit frei zugänglich gemacht werden. Darüber hinaus werden Felddaten von den Umständen der Umgebung beeinflusst, in der sie erfasst wurden. Daher ist es unmöglich, sie später zu replizieren, wenn sich die Bedingungen geändert haben.

Was ist die Lösung? Einige Journale - einschließlich Molecular Ecology, für das Vines als Herausgeber zuständig ist - haben Richtlinien erlassen, nach denen Autoren Rohdaten zusammen mit ihren Beiträgen einreichen müssen, damit das Journal selbst die Daten auf Dauer archivieren kann. Obwohl Zeitschriften wie Menschen anfällig für Änderungen von E-Mail-Adressen und technologische Überalterung sind, können diese Probleme auf institutioneller Ebene viel einfacher bewältigt werden.

Möglicherweise fehlt jetzt die große Mehrheit der Rohdaten aus alten wissenschaftlichen Studien