Ein Nutzer arbeitet mit der Transkribus-Plattform.
Universität Innsbruck

Handschriftenerkennung
Wenn künstliche Intelligenz Handschriften lesbar macht

Computer können lernen, individuelle Handschriften zu erkennen und zu transkribieren. Tausende Dokumente werden so für die Volltextsuche erschlossen.

15.10.2022

Handschriften sind von Mensch zu Mensch verschieden. Die an der Universität Innsbruck mitentwickelte Transkribus-Plattform kann sie dennoch entziffern. Mit künstlicher Intelligenz werden die Texte maschinenlesbar und Forschenden sowie der interessierten Öffentlichkeit zugänglich gemacht, wie die Hochschule am Dienstag in einer Mitteilung berichtet hat.

In Archiven und Bibliotheken werden zahllose historische Handschriften aufbewahrt. "Die händische Suche in diesen Dokumenten kann eine sehr mühsame Angelegenheit sein", erläutert Dr. Günter Mühlberger von der Arbeitsgruppe Digitalisierung/Archivierung an der Universität Innsbruck. Außerdem seien viele der Quellen in heute nicht mehr lesbaren Schriften verfasst, wie etwa der Kurrentschrift, eine im 16. Jahrhundert entwickelte und bis zur Mitte des 20. Jahrhunderts verbreitete Schreibschrift. Die Transkribus-Plattform könne diese Handschriften automatisiert erkennen, transkribieren und damit für alle lesbar machen, so Mühlberger. Dass die digitalisierten Texte maschinenlesbar sind, erlaube eine Volltextsuche, so dass auch Hunderte oder Tausende Dokumente gleichzeitig auf Stichworte überprüft werden könnten.

Wie die Transkribus-Plattform arbeitet

Transkribus arbeite mit neuronalen Netzen, die nicht mehr speziell für eine bestimmte Handschrift programmiert werden müssten. Gebe es nicht bereits ein gut passendes Modell, könne die Maschine von Nutzerinnen und Nutzer anhand von Beispieltexten lernen, eine Handschrift zu transkribieren und sei dann in der Lage, weiteren Text zuverlässig lesbar zu machen. So sei die verwendete Technologie unabhängig von der Sprache und der eigentlichen Schriftart. Auch mittelalterliche Schriften und sogar Hebräisch, Arabisch oder indische Schriften könnten bearbeitet werden. Experimente mit altem Chinesisch würden gerade durchgeführt.

Transkribus wurde mit Unterstützung der Europäischen Union entwickelt und wird seit 2019 von der von der Universität Innsbruck mitgegründeten europäischen Genossenschaft READ-Coop betrieben, die laut Mitteilung der Hochschule inzwischen mehr als 120 Mitglieder aus 27 Ländern hat. Eine aktuelle Studie der Universität Edinburgh habe zutage gefördert, dass inzwischen über 400 wissenschaftliche Publikationen erschienen seien, die Transkribus verwendeten. Über 90.000 Nutzerinnen und Nutzer zähle die Transkribus-Plattform selbst.

cpy