Seit der Geburt moderner englischsprachiger Romane im 18. Jahrhundert haben männliche und weibliche Figuren von Paul Atreides bis Elizabeth Bennet auf ihren Seiten gelacht, gegrinst, gefühlt und gehandelt. Eine neue Studie, die unter Verwendung eines Algorithmus für maschinelles Lernen durchgeführt wurde, hat eine neue Perspektive auf ihre Geschichte geboten. "Die Transformation des Geschlechts in der englischsprachigen Belletristik", veröffentlicht diese Woche in der Zeitschrift Cultural Analytics, analysierte die Darstellung des Geschlechts in mehr als 100.000 Romanen und fand ein Paradoxon, wenn es um Romane des 20. Jahrhunderts ging: als starre Geschlechterrollen schien sich aufzulösen, was darauf hindeutet, dass mehr Gleichheit zwischen den Geschlechtern herrschte, dass die Anzahl der weiblichen Charaktere und der Anteil der weiblichen Autoren zurückgingen.
Der Algorithmus wurde vom Studienautor Ted Underwood, Professor für Anglistik und Informationswissenschaft an der University of Illinois, und seinem Co-Autor, dem Informationswissenschaftler David Bamman von der University of California in Berkeley, entwickelt und analysierte die Charaktere und Autoren von 104.000 Romanen - weit mehr als Sie werde in einem Leben lesen. Underwood und Bamman bauten ursprünglich den Algorithmus für eine frühere Studie zur Charakterisierung auf: Sie wurden von Co-Autorin Sabrina Lee, einer Doktorandin an der Universität von Illinois, in die aktuelle Studie aufgenommen. Die Romane wurden hauptsächlich aus der HathiTrust Digital Library ausgewählt und stellten eine Auswahl von Bestsellern aus den Jahren 1703 bis 2009 dar. Die Liste enthält beliebte Titel wie Pride and Prejudice, Dune und einige der Romane von Raymond Chandler.
Bei der Betrachtung und zeitlichen Unterteilung der Daten konnten die Forscher Trends über bestimmte Zeiträume hinweg feststellen: zwischen etwa 1800 und den 1970er Jahren zum Beispiel einen „stetigen Rückgang“ des Anteils weiblicher Autoren - von etwa 50 Prozent auf weniger als 25 Prozent. Im gleichen Zeitraum war ein Rückgang der Anzahl der genannten weiblichen Charaktere zu verzeichnen. Diese Tendenzen beginnen sich in der zweiten Hälfte des 20. Jahrhunderts umzukehren. Und im Laufe ihres Studiums haben sich die Wörter, die zur Charakterisierung des Geschlechts verwendet werden, dramatisch und schnell verschoben - ebenso wie die Anzahl der spezifisch geschlechtsspezifischen Wörter.
Viele dieser Wörter waren nicht explizit geschlechtsspezifisch, wie "Herz" oder "Haus", obwohl potenziell geschlechtsspezifische Wörter wie "Rock" oder "Schnurrbart" nicht ausgeschlossen wurden. Zum Beispiel wurde im 19. Jahrhundert das Verb „gefühlt“ häufiger mit Frauen in Verbindung gebracht, während das Verb „bekommen“ häufiger mit Männern in Verbindung gebracht wurde. Diese Tendenzen nahmen im Laufe der Zeit ab, bis um 1900 andere Wörter stärker mit Männern und Frauen in Verbindung gebracht wurden. In den 1900er Jahren wurden Wörter, die mit Heiterkeit zu tun hatten, mehr mit Frauen in Verbindung gebracht, und die Verwendung dieser Wörter in Bezug auf Männer nahm entsprechend ab. „Frauen lächeln und lachen“, schreiben die Autoren, „aber Männer in der Mitte des Jahrhunderts können anscheinend nur grinsen und kichern.“ Ähnlich wird im 19. Jahrhundert viel mehr über Gefühle gesprochen, zunächst hauptsächlich in Bezug auf weibliche Charaktere. Im 20. Jahrhundert dreht sich viel mehr um Körper und Kleidung - zum Beispiel stecken Männer in der Mitte des Jahrhunderts ständig Dinge in Taschen oder nehmen sie heraus.
Dies ist ein Ergebnis, das die Notwendigkeit von Ansätzen für maschinelles Lernen demonstriert, sagt Underwood: "Die Realität ist, dass die Kultur nicht klar definiert, was Geschlecht ist oder was sogar ein literarisches Genre ist", sagt er. "Und durch maschinelles Lernen können wir mit unscharfen Konzepten arbeiten."
Die Methode wurde häufiger verwendet, um mit Bankdaten zu arbeiten oder um selbstfahrenden Autos zu helfen, sicher zu bleiben. Daher scheint es seltsam, den Roman zu analysieren. Aber Underwood und andere Wissenschaftler auf dem Gebiet der Digital Humanities sehen großes Potenzial.
Seth Long, ein Englischprofessor an der Universität von Nebraska, der auch auf dem Gebiet der Digital Humanities arbeitet, sagt, dass diese unerwarteten Ergebnisse die Leistungsfähigkeit von Big Data für Geisteswissenschaftler demonstrieren. „Die statistische Modellierung erfordert ein völlig anderes Verständnis der Literaturgeschichte“, sagt er. Ein Algorithmus ist eine leere Tafel, bis ihm Informationen gegeben werden, aber sobald er diese Informationen hat, kann er Dinge herausholen, die Menschen nicht können. In diesem Fall unterbricht dies wissenschaftliche Annahmen darüber, wie die Geschichte der Literatur mit der Geschichte des sozialen Fortschritts von Frauen in Einklang gebracht werden sollte.
„Wenn Sie [die Studie] neben traditionelleren literaturhistorischen Projekten sehen, können Sie Zusammenhänge erkennen, die Sie sonst vielleicht nicht gesehen haben“, sagt Claire Jarvis, Professorin für Englisch an der Stanford University. Dies bestätigt auf quantitative Weise einige ihrer „Vermutungen“ über den Weg der Literatur. Dies schließt den Rückgang des Anteils weiblicher Autoren im gesamten untersuchten Zeitraum ein, der Underwood überraschte.
"Ich hätte einige Fortschritte erwartet, nur in Bezug auf die Gleichstellung der Repräsentation von Frauen in der Fiktion", sagt Underwood. „Vielleicht nicht viel Fortschritt, aber ein bisschen Fortschritt. Und wir sehen wirklich keine. "
Die ersten Romane, die das moderne Englisch verwendeten, galten mehr als Unterhaltung und weniger als legitimes literarisches Unterfangen. "Da der Roman jedoch immer ansehnlicher wird", sagt Jarvis, "wird er weniger mit weiblicher Autorenschaft in Verbindung gebracht."
Laut Underwood haben Literaturhistorikerinnen schon früher über die Abkehr von dem Roman gesprochen, aber niemand hat eine breit angelegte Arbeit geleistet, die kontinuierliche Trends aufzeigt. Hier kommt maschinelles Lernen ins Spiel.
Lee sagt: "Literaturwissenschaftler, wir sind uns sehr bewusst, dass es Stille gibt", dh Orte in der Literaturgeschichte, an denen keine Bücher geschrieben wurden. Eine andere Stille, die sie für wichtig hält, ist das wachsende Fehlen namentlich genannter weiblicher Charaktere in den untersuchten Romanen. Sie ist ein Fan der Romane der pseudonymen italienischen Autorin Elena Ferrante und sagt, dass die Charakterisierung der weiblichen Freundschaft in Ferrantes Büchern das „Schweigen“ der weiblichen Freundschaft in anderen Fiktionen sowohl aus der Vergangenheit als auch aus der Gegenwart hervorhebt. Für sie unterstreicht die Studie dasselbe und hebt die „Bedeutung der Arbeit mit Frauen, die Frauen sehen“ hervor. Die Abwesenheit von Frauen aus dem Roman „hat unsere Einstellung zur Literaturgeschichte in aller Stille geprägt“, sagt Underwood.
Die Autoren stellen fest, dass ihre Studie nicht alle Romane dieser Zeit abdeckt und keine Repräsentation von Genre-Fiction-Romanen wie Romanen und Krimis enthält, die im 20. Jahrhundert populär wurden. Die Forscher haben jedoch Schritte unternommen, um ihre Vorurteile zu korrigieren, indem sie ihre Datenbank mit anderen Datenbanken verglichen haben. Die Bücher, die sie ausgewählt haben, stellen Literatur dar, die von den wissenschaftlichen Bibliotheken als wichtig angesehen wurde, und die Autoren stellen fest, dass weitere Arbeiten zur Genre-Fiktion erforderlich sind. "Literarisches Geschlecht kann in verschiedenen Genres oder in verschiedenen Teilen des literarischen Feldes unterschiedlich konstruiert sein", schreiben die Autoren.
Maschinelles Lernen bietet eine neue Möglichkeit, die Stille und Gegenwart der Vergangenheit zu betrachten - seltsamerweise durch die Linse der Vorhersage. Im Allgemeinen werden Algorithmen verwendet, um Vorhersagen zu treffen oder Muster basierend auf einer Reihe von Informationen zu erkennen. Laut Long besteht ihre Verwendung für die Geschichte jedoch darin, dass sie langfristige Trends in der Vergangenheit sowie in der Gegenwart oder Zukunft erkennen können. "Ich denke, das ist eine so mächtige Methode, um unsere eigenen Interpretationen in Schach zu halten", sagt er.