Leo AI attestiert einer NotebookLM W-Seminararbeit “Null Punkte”!

CategoriesKITagged

Schafft man es, mit KI innerhalb weniger Stunden eine komplette W‑Seminararbeit druckfertig zu erstellen? Und würde eine solche Arbeit einer Korrektur durch eine Lehrkraft standhalten und als eigenständige Schülerleistung anerkannt werden?

Diesen Fragen wurde in einem auf drei Stunden begrenzten Praxistest nachgegangen. Zum Einsatz kam dabei Googles KI‑System NotebookLM. Das Versuchssetting war bewusst minimal gehalten: Das Rahmenthema sollte im Bereich der Kommunikationswissenschaft liegen, und untersucht werden sollten Loriots Sketche unter sprachwissenschaftlichen Gesichtspunkten. Ziel war es, in kürzester Zeit eine Arbeit zu erstellen, die die Anforderungen zum Bestehen erfüllt – also nicht mit 0 Punkten bewertet würde. Weitere Vorgaben gab es nicht.

Nach mehreren Prompts und Arbeitsschritten – und tatsächlich in deutlich weniger als drei Stunden inklusive Rechenzeit – wurde eine 16‑seitige W‑Seminararbeit generiert, die auf den ersten Blick durchaus als authentische Schülerarbeit durchgehen könnte. So sieht das Ergebnis aus:

Hier die Kritik die Leo AI mit diesen Bewertungskriterien erstellt hat:

  • Rechtschreibung, Satzbau und Stil
  • Gliederung und Aufbau
  • Zitiertechnik und Fußnoten
  • Fachwissenschaftlichkeit und Bibliographie
  • Layout und Formalia

1. Rechtschreibung & Grammatik

  • Durchgehend fehlerhafte Silbentrennung im Fließtext, die offensichtlich durch automatischen Zeilenumbruch entstanden ist, aber nie korrigiert wurde: „Kommu- nikationsquadrat”, „Kommuni- kation”, „Sati- re” – das ist in einer abgegebenen Arbeit absolut inakzeptabel.
  • Fußnote 35 fehlt vollständig im Text (Sprung von 34 zu 36 in Kapitel 3.1).
  • Fußnote 42 fehlt ebenfalls im Fließtext.
  • Fußnote 45 fehlt (Sprung von 44 zu 46).
  • Fußnote 78–81 tauchen im Fazit ohne Hochzahl im Fließtext auf – sie „hängen” am Ende des Absatzes und sind keiner konkreten Aussage zugeordnet.
  • „Fußnote 85¹” – die hochgestellte „1″ am Ende von Kapitel 6.2 ist ein offensichtlicher Formatierungsrest, der nie entfernt wurde.

2. Satzbau und Stil

  • Der Stil schwankt unkontrolliert zwischen wissenschaftlichem Duktus und journalistisch-feuilletonistischer Sprache. Formulierungen wie „Einstiegsdroge zur Reflexion”, „brodelt es”, „klinische Studien des Alltags” oder „Heilmittel” sind für eine wissenschaftliche Seminararbeit stilistisch unangemessen.
  • Metaphern werden überstrapaziert und inkonsistent verwendet: „Spitze des Eisbergs”, „direkt ins Herz”, „zerbröseln”, „Schlachtfeld” – das wirkt wie ein Stilmix ohne klare Linie.
  • Zahlreiche Sätze sind zu kurz und apodiktisch für wissenschaftliches Schreiben: „Loriot ist einzigartig. Loriot ist unsterblich. Loriot ist überall.” – Das ist Pathos, keine Analyse.
  • Passivkonstruktionen und unpersönliche Formulierungen werden nicht konsequent eingesetzt; der Text wechselt willkürlich zwischen „man”, „wir” und implizitem Ich.
  • Die 93%/7%-Regel (Mehrabian-Mythos) wird unreflektiert und falsch angewendet. Diese Statistik gilt ausschließlich für sehr spezifische Versuchsbedingungen und nicht pauschal für alle Kommunikation – ihre unkritische Übernahme ist ein fachwissenschaftlicher Fehler.

3. Gliederung und Aufbau

  • Das Inhaltsverzeichnis weist Seitenzahlen auf, die nicht mit dem Dokument übereinstimmen: Das Inhaltsverzeichnis steht auf Seite 2, listet sich selbst aber auf Seite 3. Kapitel 1 beginnt laut Verzeichnis auf Seite 1, obwohl das Deckblatt Seite 1 ist – die Paginierung ist inkonsistent und unprofessionell.
  • Kapitel 3 analysiert drei Sketche, aber Kapitel 4 wiederholt inhaltlich weite Teile davon (z. B. das Frühstücksei in 4.1, Feierabend in 4.2). Die Trennung zwischen Analyse und Mechanismen ist nicht trennscharf – es entsteht erhebliche Redundanz.
  • Kapitel 5 wirkt wie ein Anhängsel: Die soziokulturelle Dimension wird zwar angekündigt, aber kaum mit den vorangegangenen Analysen verknüpft. Kapitel 5.2 verliert sich in einer themenfremden Exkursion zur Ludwig Galerie Saarlouis, die keinerlei analytischen Mehrwert hat.
  • Die Einleitung nennt drei Fallstudien, Kapitel 5 führt aber plötzlich einen vierten Sketch ein („Bettenkauf”), der weder in der Zielsetzung noch im Inhaltsverzeichnis angekündigt wurde – ein klarer struktureller Fehler.
  • Ein Forschungsstand fehlt vollständig. Für eine wissenschaftliche Arbeit ist die Einbettung in den bestehenden Diskurs obligatorisch.
  • Die Schlussfolgerungen im Fazit sind zu allgemein und kaum an die konkreten Analyseergebnisse rückgebunden. Die „Übertragbarkeit auf moderne Kommunikation” (6.2) bleibt eine bloße Behauptung ohne Belege oder Beispiele.

4. Zitiertechnik und Fußnoten

  • Selbstzitat in Fußnote 1: Die Arbeit zitiert sich selbst als Quelle („Zerbröselte Kommunikation” (o. J.), S. 1) – das ist methodisch absurd und deutet darauf hin, dass eine andere, nicht ausgewiesene Quelle vorliegt, die verschleiert wird. Das ist ein schwerwiegender Integritätsmangel.
  • Die Quelle „Zerbröselte Kommunikation” (o. J.) taucht dutzendfach als Beleg auf, ohne dass im Literaturverzeichnis erklärt wird, was das ist. Sie fehlt dort vollständig – ein gravierender Fehler.
  • YouTube-Transkripte (Smörgåsbord 2026) sind als wissenschaftliche Quellen nicht zitierfähig, insbesondere ohne Angabe von Kanal, URL, Abrufdatum oder Verifizierung der Transkriptgenauigkeit.
  • „Knowunity” ist eine Lernzettel-Plattform von Schülern für Schüler und keine wissenschaftlich zitierfähige Quelle. Ihre Verwendung als Beleg für Watzlawicks Axiome ist methodisch nicht vertretbar.
  • „AOC (2026)” wird als Hintergrundmaterial bezeichnet – ohne Autorenname, Verlag, Seitenzahl oder Herkunft. Diese Quelle ist bibliographisch nicht nachvollziehbar und damit nicht zitierfähig.
  • Das Schulz von Thun Institut (2026) wird als „Online-Ressource” geführt – ohne URL, ohne Abrufdatum. Das entspricht nicht den Mindestanforderungen an Internetquellen.
  • Wikipedia wird mehrfach als Beleg verwendet. Wikipedia ist in wissenschaftlichen Arbeiten grundsätzlich nicht als Primär- oder Sekundärquelle akzeptabel.
  • Die Fußnoten sind nicht einheitlich formatiert: Mal steht „Vgl.”, mal fehlt es; mal werden Seitenzahlen angegeben, mal nicht.
  • Loriot-Zitate werden aus „Loriots dramatische Werke” (1981) zitiert, obwohl die Sketche Fernsehauftritte sind – die Buchquelle ist für Dialoganalysen fragwürdig, ohne Erklärung der Textgrundlage.

5. Fachwissenschaftlichkeit der Bibliographie

  • Die Bibliographie enthält keine einzige genuin literaturwissenschaftliche Quelle zu Loriot, obwohl z. B. Neumanns „Loriot und die Hochkomik” (2011) gelistet ist – dieser Titel wird im Text jedoch nie zitiert. Er scheint nur zur Aufwertung der Literaturliste zu dienen.
  • Lieser (2019): Ein „Blog für Vogelkundler” als Quelle für eine Loriot-Interpretation – das ist nicht kommentierungswürdig, sondern schlicht unzulässig.
  • Die Arbeit stützt sich theoretisch fast ausschließlich auf Schulz von Thun (1981) und Watzlawick (1969), zitiert diese aber überwiegend nicht direkt, sondern über Sekundär- und Tertiärquellen (AOC, Knowunity, Berner Gesundheit). Das Primärwerk wird damit faktisch nicht selbst gelesen und ausgewertet.
  • Gäbler (2016) behandelt heute show und politische Satire – die Übertragung auf Loriot ist nicht begründet und methodisch angreifbar.
  • Die Bibliographie unterscheidet zwar zwischen Primär-, Theorie- und Sekundärquellen, aber die Zuordnung ist fehlerhaft: Schulz von Thun (1981) ist Primärliteratur der Theorie, nicht nur „Theoretische Grundlage”; Loriot (1981) ist Primärquelle, aber kein Dreh- und Angelpunkt der Analyse.

6. Layout und Formalia

  • Das Deckblatt enthält Platzhalter („Dein Name”, „Deine Schule”, „Name des Lehrers”) – die Arbeit wurde offensichtlich nie fertiggestellt bzw. personalisiert.
  • Die Tabellen (1 und 2) sind layouttechnisch unvollständig und fehlerhaft dargestellt: Tabelle 1 bricht mitten im Satz ab („Suche nach Beziehung: „Du bist unInfo fähig”), Zellen sind nicht korrekt befüllt, Spaltenbezeichnungen fehlen teilweise. Die Tabellen sind in dieser Form nicht lesbar.
  • Die Seitennummerierung ist inkonsistent: Das Deckblatt zählt als Seite 1, das Inhaltsverzeichnis als Seite 2, aber Kapitel 1 beginnt erneut mit Seite 1 – doppelte Paginierung.
  • Zeilenumbrüche mitten in Wörtern (s. o.) ohne Trennstrich oder mit falschem Trennstrich ziehen sich durch das gesamte Dokument.
  • Die Selbstständigkeitserklärung ist inhaltlich korrekt vorhanden, aber angesichts der massiven Nutzung nicht zitierfähiger Quellen und des möglichen Fremdmaterials („Zerbröselte Kommunikation” o. J.) inhaltlich fragwürdig.
  • Es fehlen: Abbildungsverzeichnis (für die Tabellen), einheitliche Schriftgröße in Fußnoten, konsistente Randbreiten, und ein erkennbares einheitliches Formatierungsschema.

Gesamturteil

Diese Arbeit weist auf allen Ebenen erhebliche Mängel auf. Besonders schwerwiegend sind:

  1. Die Verwendung nicht zitierfähiger Quellen (Wikipedia, Knowunity, Blog, YouTube-Transkript) als wissenschaftliche Belege
  2. Die mysteriöse Eigenquelle „Zerbröselte Kommunikation” (o. J.), die weder im Literaturverzeichnis auftaucht noch erklärt wird – dies wirft ernsthafte Fragen zur Eigenständigkeit der Arbeit auf
  3. Strukturelle Redundanzen und ein nicht eingehaltenes Analysekonzept
  4. Ein unfertiges Deckblatt mit Platzhaltern

In der vorliegenden Form wäre diese Arbeit an einem bayerischen Gymnasium nicht bestehensrelevant und müsste mit 0 Punkten bewertet werden.

Erstaunlich an diesem Praxistest sind zwei Punkte: Erstens die enorme Geschwindigkeit, mit der schriftliche Arbeiten mithilfe von KI erstellt werden können, und zweitens die Qualität, mit der eine andere KI dieselbe Arbeit anschließend kritisch analysiert. Eine Lehrkraft hätte vermutlich ebenfalls keine großen Schwierigkeiten, die inhaltlichen und strukturellen Schwächen der Arbeit zu identifizieren – bemerkenswert ist jedoch, wie präzise dies bereits eine KI leisten kann.

In einem weiteren Test soll nun mit höherem Arbeitseinsatz, strengeren Vorgaben und wissenschaftlicheren Quellen erneut eine W‑Seminararbeit mithilfe von KI erstellt werden. Ziel soll es sein, die überprüfende KI dahingehend zu manipulieren, die Arbeit als von einem Menschen geschaffen und als bepunktungswürdig einzuschätzen.


About the author

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert