Auf einem elektronisch wirkenden Untergrund mit Platinen pranken die Buchstaben LLM für Open-Source-Large Language Model.
mauritius images / Nils Ackermann / Alamy / Alamy Stock Photos

Datensicherheit und Datenhoheit
NRW fördert KI-Sprachmodell für Hochschulen

Zwei große NRW-Unis arbeiten an einem Open-Source-Sprachmodell für mehreren Hochschulen. Das Wissenschafts-Ministerium fördert das Vorhaben.

12.04.2024

Die Frage der Datensicherheit und der Datenhoheit spielt bei der Nutzung "Künstlicher Intelligenz" für die Hochschulen Nordrhein-Westfalens eine entscheidende Rolle. Die Ruhr-Universität Bochum und die Universität zu Köln arbeiten jetzt an einem Pilotprojekt, um mittelfristig ein passgenaues Open-Source-Sprachmodell für eine große Hochschule – und perspektivisch mehreren Hochschulen – zu betreiben. Das Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen fördert das Vorhaben mit rund 600.000 Euro.

Ministerin Ina Brandes meint dazu: "Künstliche Intelligenz ist aus unserem Alltag nicht mehr wegzudenken. Ich bin sicher, sie wird uns in vielen Bereichen helfen, das Leben der Menschen sicherer und angenehmer zu machen – etwa bei der digitalen Lehre an unseren Hochschulen, beim autonomen Fahren im Straßenverkehr und bei der Diagnostik von Krankheiten. Die Anwendung Künstlicher Intelligenz muss ethischen Grundsätzen folgen. Dazu gehört auch der Schutz persönlicher Daten. Von der Förderung der Open-Source-KI profitieren alle Menschen, weil wir in dieser wichtigen Zukunftstechnologie Unabhängigkeit von kommerziellen Anbietern gewinnen." 

Kommerzielle Lösungen oft nicht gut geeignet für Hochschulen

ChatGPT ist das wohl bekannteste und eines der leistungsstärksten KI-Sprachmodelle. Die Nutzung dieser kommerziellen Lösung geht für Hochschulen mit Herausforderungen einher. Neben der Frage der Kosten müssen der Datenschutz sowie Schulungsmöglichkeiten von Nutzerinnen und Nutzern geklärt werden. Eine Alternative zur Nutzung von ChatGPT und anderen kommerziellen Anbietern ist die konsequente Weiterentwicklung von Open-Source-Sprachmodellen durch die Hochschulen selbst. 

Als "Open Source" wird Software bezeichnet, deren Quellcode von Dritten eingesehen werden kann. Das Projekt "Open-Source-KI.nrw" wird dazu bis Ende 2025 erstmals den Aufbau einer vollständigen Infrastruktur eines Open-Source-Large Language Models (LLM) anhand eines konkreten Anwendungsfalls erproben. Im Fokus steht der Einsatz von Sprachmodellen in der Lehre: Studierende sollen in ausgewählten Kursen im Lernmanagementsystem über einen virtuellen Ansprechpartner ("Chatbot") mit dem Sprachmodell kommunizieren können. 

Der Chatbot greift für die Formulierung seiner Antworten sowohl auf seine allgemeinen Trainingsdaten zurück als auch auf die konkreten Lerninhalte aus dem Kursus. So sollen seine Antworten möglichst passend und hilfreich für die Lernenden sein. Die für das Projekt benötigten Rechenkapazitäten stellt das ebenfalls vom Ministerium geförderte Hochleistungsrechensystem an der Universität Köln mit dem neuen Hochleistungsrechner RAMSES zur Verfügung. So werden Synergien zwischen Projekten im Land genutzt. 

Gleichzeitig wird so mit dem Projekt für Nordrhein-Westfalen erprobt, inwieweit die landeszentral verfügbare Hochleistungsrechner-Infrastruktur für solche Anwendungsfälle einsetzbar ist. Im Rahmen des Projekts soll außerdem in enger Kooperation mit dem ebenfalls vom Land geförderten KI:edu.nrw ein Kompetenzteam zum Thema Open-Source-Sprachmodelle aufgebaut werden. Die Projektergebnisse stehen allen Hochschulen zur Nachnutzung und Bewertung zur Verfügung. Die Erfahrungen aus dem Betrieb der Software und der Infrastruktur werden über die etablierten Kompetenznetzwerke Moodle.NRW und HPC.NRW weitergegeben.

Themen-Schwerpunkt "Künstliche Intelligenz"

Künstliche Intelligenz greift zunehmend in das alltägliche Leben ein. Welche Chancen und Risiken birgt dies? Woran arbeitet die KI-Forschung? Welche Folgen hat KI in der Lehre? Ausgewählte Artikel zum Thema finden Sie im Schwerpunkt "Künstliche Intelligenz".

cva