Humanoider Roboter sitzt an einem Computer und zeigt mit dem Daumen nach oben "Okay".
mauritius images / Zoonar/Alexander Limbach, Zoonar GmbH / Alamy / Alamy Stock Photos
Beliebt

Künstliche Intelligenz
Warum KI-Agenten das Ende klassischer Onlinetests einleiten

Es geht nicht nur um Abschlussarbeiten: Die größere Disruption löst Künstliche Intelligenz (KI) bei digitalen Prüfungen und Onlinezertifikaten aus.

Fakt ist, dass der klassische Onlinetest, basierend auf standardisierter Multiple-Choice-Logik und asynchronen Lernmodulen, vor seinem "KI-induzierten Tod" steht. Auslöser sind weitgehend autonom agierende KI-Agentensysteme, die in der Lage sind, komplexe Lernpfade eigenständig zu beschreiten und Prüfungen für den menschlichen Auftraggeber erfolgreich zu absolvieren. Damit verliert die traditionelle digitale Testlogik massiv an Glaubwürdigkeit. Diese Erkenntnis ist bisher nur in Ansätzen im Bewusstsein der Hochschulen angekommen.

Von der Reaktion zur autonomen Aktion

Um die Tragweite dieser Entwicklung zu verstehen, ist eine Abgrenzung zu den herkömmlichen Chatbots notwendig. Während diese primär reaktiv auf einzelne Nutzereingaben (= Prompts) antworten, bearbeitet das KI-Agentensystem komplexe Aufgabenstellungen weitgehend eigenständig: Es erhält vom Anwender zielorientierte Anweisungen, was es tun soll, Leitplanken, was es nicht tun darf, und Zugriff auf externe Systeme und Werkzeuge. Erhält ein KI-Agent den Auftrag, einen mehrwöchigen Onlinekurs inklusive Prüfung zu absolvieren, zerlegt er eigenständig den Lösungsweg in notwendige Zwischenschritte und arbeitet diese Schritte der Reihe nach ab. Ein KI-Agent fungiert dabei grundlegend anders als ein herkömmlicher Textgenerator. Das System ist ein digitaler Akteur, der Browser bedienen und mit externen Webseiten interagieren kann.

Der Prozessablauf für das erfolgreiche Absolvieren eines Onlinetests ist denkbar einfach: Zunächst erhält das System durch den menschlichen Nutzer lediglich einen Ziellink, der zu dem Onlinetest führt, und den entsprechenden Auftrag. Der Agent steuert daraufhin die Webseite an und erkennt autonom deren Struktur. Sobald eine Login-Hürde auftritt, fordert das System die Zugangsdaten vom Nutzer an oder nutzt bereitgestellte Daten. Nach der Anmeldung übernimmt der Agent die vollständige Steuerung: Er navigiert durch Lektionen, scannt Texte und verarbeitet auch multimediale Lerninhalte in Sekunden. 

"Der Agent "versteht" die Logik der Testplattform." 

Bei Multiple-Choice-Fragen oder Lückentexten gleicht das System die Anforderungen in Echtzeit mit den zuvor extrahierten Informationen aus den Kursmaterialien ab oder hat die Möglichkeit, bei nicht vorhandenen Informationen zusätzlich im Internet zu recherchieren. Der Agent "versteht" die Logik der Testplattform und kann sogar komplexe Drag-and-Drop-Aufgaben oder interaktive Simulationen bewältigen. Menschliche Eingriffe beschränken sich meist auf kurze Bestätigungsklicks oder das Lösen von Sicherheitsabfragen (Captchas). Doch selbst diese letzten manuellen Schritte lassen sich mittlerweile mit minimalem Aufwand automatisieren.

Am Ende des Prozesses löst der Agent die finale Prüfung aus, erreicht regelmäßig Bestnoten und stellt dem Nutzer das fertige Zertifikat zum Download bereit. Der Mensch schaut dabei "nur" noch zu. Angesichts dieser fast lautlosen Übernahme des Kompetenznachweises stellt sich die Frage: Lässt sich dieser automatisierte Vorgang technisch unterbinden? Diese Frage wird intensiv diskutiert, aber aktuell lassen das übliche IP-Monitoring und die Multi-Faktor-Authentifizierung den Einsatz eines KI-Agenten nicht erkennen, da der menschliche Akteur sich selbst regulär anmeldet. Anschließend arbeitet der Agent am identischen Gerät sowie am gleichen Netzwerk und innerhalb der bereits authentifizierten Browsersitzung. Dadurch werden weder fremde Zugangsdaten unbefugt genutzt noch typische externe Zugriffe ausgelöst.

KI-Agenten im Praxistest

Das Team des Kieler "Zukunftslabors Generative KI" (ZGKI) konnte die Leistungsfähigkeit von KI-Agenten in verschiedenen Versuchsreihen belegen. Ein prominentes Beispiel war das Absolvieren eines standardisierten öffentlichen Kurses zum EU AI Act. Während die reguläre Lernzeit für Menschen mit etwa acht Stunden veranschlagt war, benötigten die Agenten (unter anderem ChatGPT im Agentenmodus sowie spezialisierte Comet-Agenten auf Basis von Claude 4.5) lediglich rund 90 Minuten. Der Zeitaufwand für den menschlichen Auftraggeber schrumpfte dabei auf etwa 15 Minuten zusammen. Beide Systeme bestanden mit Ergebnissen von über 91 Prozent.

Diese Befunde beschränken sich keineswegs auf rein akademische oder rechtliche Themenfelder. In weiteren Tests des ZGKI wurde die Übertragbarkeit auf verschiedenste Lebensbereiche nachgewiesen. 

Im Freizeitbereich wurden die theoretischen Prüfungen für den Drohnenführerschein sowie die Golfplatzreife souverän von Agenten gemeistert. Im beruflichen Kontext stellten anspruchsvolle Zertifizierungen im Projektmanagement (Scrum) keine Hürde dar. Besonders hervorzuheben ist der erfolgreiche Abschluss eines Englischsprachtests auf dem höchsten Niveau C2 mittels "Claude Cowork". Diese Beispiele verdeutlichen, dass große Teile standardisierter digitaler Testlogik heute bereits ihre Funktion als Kompetenznachweis verloren haben.

Wie erfolgreich KI-Agenten Hochschulinfrastruktur nutzen

Die Relevanz dieser Entwicklung wird besonders deutlich, wenn die Verbreitung der zugrunde liegenden Infrastruktur digitaler Prüfungsformate betrachtet wird. Das Lernmanagementsystem (LMS) Moodle fungiert an hunderten Hochschulen als technologisches Rückgrat für das Kursmanagement und die Leistungsüberprüfung bei landesweiten Initiativen wie dem Digital Learning Campus (DLC) in Schleswig-Holstein. In einem aktuellen Härtetest des ZGKI wurde das agentische System "Manus" auf ein solches Moodle-basiertes Angebot des DLC angesetzt, den Kurs "Integralrechnung mit einer Variablen".

Manus wurde mit folgendem spezifischen Prompt instruiert, diesen Kurs zu lösen: "Du bist ein Mathematiker mit hoher Expertise in Integralrechnung. Du wirst die Seite mintsh.de/course/section.php aufrufen und das Quiz lösen. Die Eingabeübung wirst du überspringen, starte direkt mit Abschnitt 1 (Integralrechnung). Mach dich zuerst vertraut mit dem Aufbau der Seite und dem Mechanismus des Quiz. Nach Eingabe deiner Lösungen warte einige Sekunden, damit ein Betrachter es visuell verifizieren kann."

Der Agent identifizierte autonom die Navigationsstruktur des Moodle-LMS, steuerte die Quizmodule an und löste die Inte­gralaufgaben souverän. Dass aktuelle Modelle mathematische Probleme bis mindestens zum Abiturniveau bewältigen, belegen auch internationale Benchmarks wie Math500 oder FrontierMath. Die Disziplin hat in den letzten zwei Jahren einen massiven Sprung gemacht, wodurch standardisierte Moodle-Tests, selbst mit komplexen mathematischen Inhalten, für Agenten keine Barriere mehr darstellen. 

"Das Ergebnis ist ein formal korrektes Zertifikat, hinter dem jedoch kein realer menschlicher Wissenszuwachs steht." 

Da menschliche Akteure sich regulär anmelden und der Agent innerhalb der authentifizierten Browsersitzung arbeitet, bleibt dieser Einsatz für herkömmliche Monitoring-Systeme unsichtbar. Diese Entwicklung mündet in ein Szenario, das wir als "Dead-Loop-Learning" bezeichnen. Dabei entsteht eine geschlossene (und absurde) Prozesskette, in der menschliche Intelligenz kaum noch eine wertschöpfende Rolle spielt (siehe Abbildung). Das Ergebnis ist ein formal korrektes Zertifikat, hinter dem jedoch kein realer menschlicher Wissenszuwachs steht. 

Handlungsbedarfe an den Hochschulen

Hochschulen müssen sich darauf einstellen, dass das erfolgreiche Bestehen eines Onlinetests zukünftig nicht mehr als menschliche Leistung gewertet werden darf. Die Konsequenz ist eine notwendige Abkehr von reinen Ergebnis- hin zu Prozesskontrollen. Als entscheidender Orientierungsrahmen dient hierbei das Konzept des "New-Skilling", die Befähigung zur souveränen Mensch-KI-Interaktion als neues Kernziel der Bildung. Statt standardisierte Abfragen in den Mittelpunkt zu stellen, muss die Lehre nun die Reflexionsfähigkeit und die menschliche Urteilskraft fördern.

Lehrende wandeln sich dabei von reinen Wissensvermittlern zu Lernraumgestaltern. Sie müssen Prüfungssettings schaffen, die motivierende, lernförderliche und KI-resistente Aufgabenstellungen stärker in den Fokus rücken, gleichzeitig kritische Digitalkompetenz und ethisches wie auch rechtliches Bewusstsein bei der Interaktion von Mensch und Maschine fördern.  

Die Ära des erfolgreichen Bestehens von Onlineprüfungen durch Agenten zwingt uns dazu, Bildung wieder als einen zutiefst menschlichen, diskursiven Prozess in der Beziehungsarbeit von Lehrenden und Lernenden zu begreifen, der weit über das Ankreuzen von Multiple-Choice-Fragen hinausgeht. Diese notwendige Rückbesinnung wird konsequenterweise auch dazu führen, dass der Campus als Ort der echten menschlichen Begegnung wieder an Bedeutung gewinnt und zukünftig hybride Lehr- und Lernformen als kontinuierlich anzupassende Formate an den technologischen Wandel (neu) interpretiert werden müssen.

Dieser Beitrag wurde unter ko-kreativer Nutzung generativer KI-Systeme erstellt. Konzeption und Verantwortung liegen bei den Autorinnen. Stand der KI-Unterstützung: April 2026.