Zum Inhalt springen

Performance statt Fiktion: Drei Wege aus der Vertrauenskrise (Teil 3/4)

Dominik Herrmann

Artikelserie: Prüfungen und KI

In diesem 3. Teil stellen wir drei praktische Ansätze vor: Booklet-System, psi-exam und beaufsichtigte Schreibsessions – Performance statt Fiktion.

→ Ankündigung der Keynote

Bisher erschienen:

  1. Die Illusion der Kontrolle – Symptombekämpfung statt Systemlösung
  2. Die KI-Versuchung – Auch Lehrende sind verführbar

Weiterer Teil:

  1. Die unbequeme Wahrheit – Von der Symptombekämpfung zur Systemfrage

→ Alle Folien zum Vortrag (PDF)

Okay. Genug gejammert. Symptombekämpfung führt nirgendwo hin, und KI-gestützte Lösungen schaffen mehr Probleme als sie lösen. Was bleibt uns also? Ein Perspektivwechsel: Weg von der Fiktion, dass wir kontrollieren können, was zu Hause passiert. Hin zur Performance – zum direkten Nachweis dessen, was jemand tatsächlich kann.

Performance statt Fiktion. Drei Wege aus der Vertrauenskrise.

Nicht perfekt. Aber ehrlicher als das, was wir gerade tun.

Das hier ist ein Booklet. Handschrift. Papier. So analog wie 1823, und das ist Absicht.

Das Konzept ist denkbar einfach, aber in der Wirkung überraschend: Jede Woche schreiben meine Studierenden ihre wichtigsten Lernnotizen auf genau eine A5-Seite. Von Hand. Kein Copy-Paste. Keine KI. Nur sie, ein Stift und ihr Gehirn. Diese eine Seite geben sie wöchentlich ab – über die 15 Wochen des Semesters hinweg.

Da sind manchmal Kaffeeflecken drauf, das Papier ist zerknittert, manche Ecken sind umgeknickt. Die Schrift ist kaum lesbar. Aber genau das ist der Punkt: Das ist IHRE Arbeit. Ihr Schweiß. Ihre Zeit. Ihre Investition.

Und in der Klausur? Dürfen sie das komplette Booklet benutzen. Alles, was drin steht. Jede Notiz, jede Formel, jede Eselsbrücke. Es ist ihr persönlicher Schatz an Wissen, den sie sich über das Semester erarbeitet haben.

Der entscheidende Punkt: Sie müssen dabei denken. Ja, die ursprüngliche Zusammenfassung könnte theoretisch von ChatGPT stammen und von Hand einfach nur abgeschrieben werden. Aber das kann die KI den Studierenden nicht abnehmen. Das Schreiben mit der Hand ist langsam, es begrenzt, wie schnell man denken kann. Man muss lesen, nachdenken, entscheiden: Fasse ich das anders zusammen, damit es noch drauf passt? Was ist wirklich wichtig? Was brauche ich in der Prüfung? Es gibt Studien, die darauf hindeuten, dass handschriftliche Notizen das Lernen fördern.

Aber natürlich gibt es ein praktisches Problem: 200 Studierende, 15 Seiten pro Person, das sind 3000 Seiten Handschrift, die am Ende zu individuellen Booklets zusammengestellt werden müssen. Wer sammelt das ein? Wer sortiert das? Wer erzeugt daraus diese gehefteten A5-Booklets, die dann in der Prüfung verwendet werden?

Unsere Lösung war eine technische: Wir haben ein Booklet-Tool gebaut. Die Studierenden laden ihre handgeschriebenen Seiten wöchentlich als PDF oder Foto über Moodle oder Ilias hoch. Das Tool ordnet automatisch alle Seiten einer Person zu, erzeugt daraus fertige PDF-Dateien für den Druck. Die schicken wir der Hausdruckerei. Am Prüfungstag liegt dann für jeden Studierenden das persönliche Booklet bereit.

#1 BOOKLET-SYSTEM: Wöchentliche handgeschriebene Seiten über 15 Wochen
Das Booklet-System: Wöchentliche Lernnotizen von Hand

Ein selbstreferenzieller Moment: Das Tool haben wir mit KI gebaut – Claude Sonnet 3.7, OpenAI GPT 4.1/4.5/o3 und Google Gemini 2.5 Pro. Aber es ging nur, weil ich genau wusste, was ich wollte. Die KI hat Ideen geliefert, wie man es umsetzen kann, aber ich habe das System entworfen und bei der Umsetzung immer wieder nachgesteuert. KI ist wie ein übermotivierter Praktikant. Erst nützlich, wenn man ihm sagen kann, wohin die Reise gehen soll.

Ist das Klausur-Booklet-System die Lösung aller Probleme? Nein. Manche Studierende verkrampfen sich an den wöchentlichen Deadlines und priorisieren die Booklet-Seiten; die Übungsaufgaben vernachlässigen sie, in der Hoffnung, dass irgendwann vor der Prüfung noch Zeit ist, sich damit zu beschäftigen. Kein Wunder, die Bearbeitung der Übungsaufgaben ist freiwillig und es gibt dafür keine wöchentlichen Abgabefristen. Das ist aber fatal, weil Wissen und Kompetenzen in unseren Kursen aufeinander aufbauen und man leicht den Anschluss verliert, wenn man die Übungen nicht macht. Andere entwickeln FOMO auf Papier und versuchen den Inhalt aller Folien und die Lösungen aller Übungsaufgaben auf die kleine Seite zu quetschen – um dann in der Prüfung festzustellen, dass sie nichts davon finden oder lesen können.

Das System ist alles andere als perfekt, aber: Sie lernen wieder. Wöchentlich. Mit der Hand. Mit dem Kopf. Es ist eine Investition, die sich auszahlt.

Häufige Frage: Formelzettel vs. Booklet-System

„Wir erlauben unseren Prüflingen schon immer, handschriftliche Formelzettel in die Prüfung mitzubringen. Wo ist da der Unterschied zum Booklet?“

Der Unterschied ist: Formelzettel werden oft erst kurz vor der Prüfung erstellt. Ein Klausur-Booklet entsteht stattdessen über 15 Wochen verteilt, weil die Seiten semesterbegleitend abzugeben sind. Wir fanden es ungünstig, dass Studierende 15 Wochen Dämmerschlaf verbringen und dann vor der Prüfung in Aktionismus verfallen. Das Booklet verlagert die Arbeit nach vorne.

Das zweites Experiment: psi-exam, unser selbstentwickeltes E-Prüfungssystem. Damit können bis zu 320 Studierende in einem Raum gleichzeitig digitale Prüfungen schreiben – nicht auf Papier, sondern auf Computern mit den gleichen Werkzeugen wie im echten Leben.

→ Mehr Details zum psi-exam System

#2 PSI-EXAM: Pseudonyme Korrektur mit Tiernamen, Prüfungsraum mit Laptops
psi-exam: Friedrichshafen korrigiert Clever Lion

Das bedeutet: Programmierprüfungen mit vollständiger Entwicklungsumgebung, Debugger und Dokumentation. Statistikprüfungen mit R Studio. Datenbankprüfungen mit einem echten SQL-Server. Prüfungen, die tatsächlich prüfen, ob jemand die Kompetenz beherrscht – nicht, ob er sich an Syntax erinnern kann, die er auf Papier hinkritzelt.

Aber das wirklich Interessante ist etwas anderes: Was Sie auf dem Screenshot sehen, ist eine Korrekturoberfläche. „Friedrichshafen“ korrigiert „Clever Lion“. Die Tiere – das sind meine Studierenden. Das sind keine Fantasienamen, das sind echte Personen, nur sehe ich als Korrektor deren Namen nicht.

Auch ich als Korrektor bin pseudonymisiert – „Friedrichshafen“ ist nicht mein Name, sondern ein zufällig generierter Stadtname. Das ist Datenminimierung konsequent zu Ende gedacht: Die Software speichert nur die minimal notwendigen Informationen. Wer welche Prüfung korrigiert hat, ist für die Bewertung irrelevant – es zählt nur die Qualität der Korrektur. Erst wenn alle Bewertungen abgeschlossen sind, werden die echten Namen wieder zugeordnet.

Pseudonymität wird technisch erzwungen.

Das ist nicht nur ein nettes Gimmick. Die Prüfenden sehen keine Namen und können auch keine Namen sehen – die Software verhindert es technisch. Wenn jemand einwirft: „Das ist doch nur Kosmetik!“, dann antworte ich: Nein, das ist Gerechtigkeit.

Die Namen sieht man erst nach dem Fertigstellen der gesamten Korrektur. Vorher braucht man sie auch nicht. Wenn man nur noch Tiere vor sich sieht, korrigiert man anders. Fairer.

Warum? Weil Clever Fox keine Migrationsgeschichte hat. Weil Brave Elephant kein erkennbares Geschlecht hat. Weil Happy Owl keinen komplizierten Namen hat, den man sich unwillkürlich merkt und der unbewusst Erwartungen weckt. Ich sehe einfach nur Antworten – und bewerte sie nach ihrem Inhalt.

Die Korrektur erfolgt außerdem konsequent aufgabenweise: Erst alle Antworten zu Aufgabe 1a durchgehen, dann alle zu Aufgabe 1b, und so weiter. Das hat mehrere Effekte: Erstens spare ich mentale Energie, weil ich im gleichen gedanklichen Kontext bleibe. Zweitens landen ähnliche oder identische Antworten direkt nacheinander – wenn 20 Studierende das Gleiche schreiben, kann ich das schnell und konsistent bewerten.

Ein großer Vorteil digitaler Prüfungen, den wir konsequent nutzen: Einsicht vor Notenbekanntgabe. Direkt nach der Erstkorrektur, aber noch vor der Zweitkorrektur und lange vor der offiziellen Notenübermittlung, bekommen alle Studierenden individuelle, passwortgeschützte Einsichtslinks. Sie sehen ihre Antworten, die Bewertung und eine Musterlösung.

Das verändert die Dynamik fundamental: Wenn eine Studentin oder ein Student eine überzeugende Argumentation für die abgegebene Lösung liefert – vielleicht war die Aufgabenstellung tatsächlich missverständlich –, können wir sofort reagieren. Mit wenigen Klicks durchsuchen wir alle 350 Prüfungen nach ähnlichen Antworten und passen die Bewertung überall an. Bei Papierklausuren würde niemand den kompletten Stapel nochmal vom Prüfungsamt anfordern, nur weil eine Prüfung nach der Einsicht zwei Punkte mehr bekommen hat.

Die Vision: der Rückkanal. Das wirklich Revolutionäre planen wir noch: Studierende sollen während der Prüfung Rückfragen stellen können. Digital. Anonym. „Ist in Aufgabe 3b mit ‚System' das Betriebssystem oder das verteilte System gemeint? Bei der Aufgabe vorher waren es verteilte Systeme, aber im Kontext macht es keinen Sinn.“ – Boom, Klarstellung für alle, in Echtzeit.

Das wäre wie bei einer mündlichen Prüfung – plötzlich wird es ein Gespräch. Eine völlig andere Prüfungsform, die wir auf Papier gar nicht abbilden können. Natürlich gibt es viele Probleme dabei: Fairness, Gleichberechtigung, technische Herausforderungen. Aber es ist spannend.

Wir haben schon erste Prototypen gebaut und experimentieren mit sofortigem Feedback bei eindeutigen Aufgaben. Wenn jemand unsicher ist und zwei, drei Möglichkeiten infrage kommen, können sie alle durchprobieren. Das senkt Prüfungsangst und ist bei vielen Aufgaben auch völlig okay.

Mein langfristiger Traum ist es, schriftliche Prüfungen zu entwickeln, die die Vorteile mündlicher Prüfungsgespräche haben: Nachfragen, Klarstellungen, echter Dialog – aber trotzdem skalierbar für hunderte Studierende gleichzeitig.

Das dritte und radikalste Experiment wendet sich gegen eine der heiligsten Kühe der universitären Prüfungskultur: die Hausarbeit. Unser Vorschlag ist eine bewusste Provokation gegen das Take-Home-Format, das längst zur Fiktion geworden ist.

#3 SCHREIBEN UNTER AUFSICHT: Prüfungsraum mit Timer 02:59:59
Schreibsessions: 3 Stunden beaufsichtigtes Schreiben

Das Setting unserer „Schreibsessions“ ist bewusst spartanisch: drei Stunden in einem Hörsaal, Laptops, keine Ablenkungen. Die Themenstellung wird zu Beginn ausgeteilt, dann heißt es: zeigen, was man kann. Kein Internet, keine KI, aber dafür kuratierte Literatur, die wir vorher auf den Rechnern bereitgestellt haben. Die Studierenden haben sich schließlich das ganze Semester über mit dem Thema beschäftigt und kennen die Grundlagen – jetzt müssen sie beweisen, dass sie eigenständig denken, argumentieren und schreiben können.

Die Empörung lässt nicht lange auf sich warten: „Das ist doch keine richtige Hausarbeit!“ rufen die Traditionalisten. Und sie haben recht – es ist keine traditionelle Hausarbeit. Aber es ist auch keine Fiktion mehr. Es ist ehrlich.

Denn wissen Sie, was eine „richtige“ Hausarbeit heute tatsächlich ist? Eine perfekt choreografierte Teamleistung verschiedener KI-Systeme: ChatGPT entwickelt die Grundthesen und schreibt den ersten Entwurf, Gemini recherchiert zusätzliche Quellen und Argumente, DeepL übersetzt internationale Literatur, Grammarly poliert Stil und Grammatik. Der Studierende? Koordiniert diesen digitalen Workflow und fügt die Teile zusammen – eine durchaus wichtige Kompetenz, aber ist das wirklich das, was wir bewerten wollen?

Zuhause: KI plus Stack Overflow plus der Kumpel, der es kann. Hier: Sie plus ihr Können.

Natürlich stöhnen die Studierenden auf, wenn sie hören, dass sie drei Stunden am Stück konzentriert arbeiten und schreiben sollen. Das sei anstrengend, die Hände täten weh, das könne man doch nicht verlangen. Als ich diese Beschwerden einer Juristin erzählte, mit der ich über diese Idee sprach, lachte sie nur: „Was wollen die denn im Berufsleben später sagen? Acht Stunden am Stück zu arbeiten und zu schreiben ist völlig normal.“

Das Resultat ist nicht das gleiche wie eine Seminararbeit über drei Monate, in der man sich tief in ein Thema einarbeiten kann. Das gebe ich zu. Aber es ist etwas anderes: Es ist authentisch. Sie sehen, was die Studierenden wirklich können – nicht, wie gut sie verschiedene digitale Werkzeuge koordinieren können. Das mag eine wichtige Kompetenz für die moderne Arbeitswelt sein, aber ich möchte auch andere Kompetenzen beweren können.

Kurz gesagt – Teil 3

Booklet-System: Wöchentliche handschriftliche Lernnotizen verlagern die Arbeit nach vorne und zwingen zum aktiven Denken – analog schlägt digital.

psi-exam: Technisch erzwungene Pseudonymität, aufgabenweise Korrektur und Einsicht vor Notenbekanntgabe schaffen mehr Fairness als Papierklausuren.

Schreibsessions: Drei Stunden beaufsichtigtes Schreiben sind keine traditionelle Hausarbeit – aber sie sind ehrlich statt Fiktion.

Performance statt Fiktion: Alle drei Ansätze fordern den direkten Nachweis dessen, was jemand tatsächlich kann – nicht perfekt, aber ehrlicher.

Im letzten Teil der Serie gehen wir zur unbequemen Wahrheit: Was sagt uns die KI-Krise über unser Bildungssystem?