Ouriginal führte ein Experiment mit Schülern einer Klasse durch, in dem die Schüler einen Aufsatz zu einem vorher genau definierten Thema schreiben mussten. In einem zweiten Schritt wurde dann Ghostwriter R aus dem Internet engagiert, eine Hausarbeit zum exakt selben Thema zu schreiben. Im Rahmen des Auftrags erhielt er genau dieselben akademischen Artikel zur Recherche sowie dieselben Anforderungen bezüglich Schreibstil und Aufgabenstellung. Danach haben wir sowohl die Hausarbeiten der Schüler, als auch das von R verfasste Dokument in die Ouriginal Software geladen, um es mit Author Metrics zu analysieren.
Akademische Auftragsarbeiten von Ghostwritern durch Computerlinguistik erkennen
Bisherige Diskussionen und experimentelle Ergebnisse in der Stilometrie haben ergeben, dass Genre- und Themeninterferenzen eine Unterscheidung zwischen Autoren erschweren. Verursacht wird dieser Einfluss durch die gemeinsame Verwendung von Wörtern und Phrasen, die mit dem Schreiben zum gleichen Thema einhergeht. Darüber hinaus verschleiern Schreibkonventionen für bestimmte Genres eine leicht erkennbare Autorensignatur, die für die Verifizierung verwendet werden kann. Wir haben in unserem Experiment beobachtet, dass R hohe Werte für praktisch jede Metrik in Ouriginal Metrics zeigt. Da wir Thema und Genre vorgegeben haben, ist anzunehmen, dass alle erhöhten Messwerte auf den Bildungs- und Sozialisationshintergrund des professionellen Ghostwriters zurückzuführen sind. Bei einem Kontrollversuch mit dem gleichen Datenset nur ohne R wurden keine Dokumente der Schüler mehr rot markiert.
Lexikalische Originalität unterstützt die ‚Peer Group Similarity‘ Hypothese
Zur Veranschaulichung des Ergebnis betrachten wir nun einen der angewendeten Messwerte: Die Lexikalische Originalität vergleicht die Anzahl der einzigartigen Wörter in einem Dokument mit der ausgewählten Vergleichsgruppe. Basierend auf der ‚Peer Group Similiarity‘ Hypothese, die wir in Teil eins dieser Blogserie vorgestellt haben, gehen wir davon aus, dass eine Gruppe von Schülern derselben Klasse, die die selben Lehrmaterialien benutzen und über das gleiche Thema schreiben, eine geringe Abweichung in Bezug auf die Lexikalische Originalität aufweist. Bis auf das Dokument des Ghostwriters trifft das auf die Gruppe des Experiments auch zu.
Als das von Ghostwriter R geschriebene Dokument Teil der Testgruppe war, stellten wir fest, dass sich Rs Sprache stark von allen anderen Schülern unterschied. Obwohl R die gleichen Ressourcen erhalten hat, wies sein Schreibstil darauf hin, dass R entweder ziemlich begabt, oder aber über ein höheres akademisches Niveau als die anderen Schüler verfügt. Natürlich reicht dieser Messwert allein nicht aus, um einen Gesamteindruck des Autorenprofils zu erhalten. Da sich der Schreibstil von R maßgeblich von den Anderen in seiner Gruppe unterschied, hat Author Metrics ihn rot markiert und dadurch eine weitere Überprüfung durch den Lehrer angeregt.
Die Grenzen der Hypothese: Bilingualität, sozio-ökonomische Faktoren und weniger homogene Klassen
Wir haben ähnliche Experimente mit vergleichbaren Ergebnissen durchgeführt, sodass einiges für unsere Erweiterung der ‚Peer-Group-Similarity‘-Hypothese spricht. Weitere Experimente, die der sprachlichen Vielfalt der Bildung (Klassen mit multikulturellem Hintergrund) Rechnung tragen, unsere Hypothese verfeinern oder widerlegen können müssen jedoch noch durchgeführt werden. Zum Beispiel kann es kulturelle oder sozioökonomische Unterschiede innerhalb des Unterrichts geben, die die Leistung der Schüler über verschiedene Messwerte hinweg beeinflussen. Darüber hinaus gibt es inzwischen viele Diskussionen über neue pädagogische Ansätze, die soziale Unterschiede in unseren immer heterogeneren Klassen anerkennen.
Schon jetzt ist die effektive Plagiatsprävention in Klassen mit multikulturellen Hintergrund die Pädagogik vor die Herausforderung. Pädagogen sind sich der verschiedenen sozio-kulturellen Hintergründe in Klassen bewusst und beziehen sie aktiv in die Lernerfahrung mit ein. Zweifellos wird die multikulturelle Perspektive die Zukunft der Bildungslandschaft und der Pädagogik prägen – und von Ouriginal mit vollster Überzeugung unterstützt.
Wir freuen uns, Ihre Meinung zum Thema Ghostwriter und Computerlinguistik zu hören. Diskutieren Sie mit uns auf Twitter.
Sollten Sie Teil eins der Blogserie verpasst haben, finden Sie ihn hier: Schreibstilanalyse, Ghostwriter-Erkennung und akademische Auftragsarbeiten: Die Grundlagen