Planung eines Algorithmus-Konzepts mit Grafiken auf einem virtuellen Bildschirm
mauritius images / Aleksey Funtap / Alamy

Literatursuche
Algorithmus fasst Publikationen zusammen

Forscher haben einen Algorithmus entwickelt, der wissenschaftliche Publikationen in einem Satz zusammenfasst. Das soll die Literatursuche erleichtern.

23.11.2020

Wissenschaftler haben mit Künstlicher Intelligenz ein Werkzeug entwickelt, das Forschenden das Querlesen von Publikationen erleichtern soll. Der Algorithmus fasst den Inhalt der Forschungsergebnisse in einem Satz zusammen und erleichtert den Forschenden so, für sie relevante Publikationen zu identifizieren. Diese Zusammenfassungen nennen die Entwickler einem "Nature"-Artikel zufolge TLDRs, in Anlehnung an das gängige Akronym TLDR – "too long, didn't read".

Die Entwickler vom "Allen Institute for Artificial Intelligence" (AI2) in Seattle, Washington, haben zuvor bereits die wissenschaftliche Suchmaschine "Semantic Scholar" entwickelt. Die neue Gratissoftware wird dem Bericht zufolge seit dieser Woche auf dieser Suchmaschine eingesetzt. Dort generiere sie nun TLDRs für zehn Millionen Publikationen aus den Computerwissenschaften. In den nächsten Wochen soll die Anwendung auf weitere Fachbereiche ausgeweitet werden.

Die Forscher haben ihren Code frei verfügbar gemacht, zusammen mit einer Demo-Webseite, auf der jeder das Tool ausprobieren kann. Die zugehörige Studie werde diesen Monat veröffentlicht.

Von Twitter inspiriert

Zu dem Algorithmus inspiriert haben die Entwickler laut Bericht die knappen Sätze, mit denen Forschende auf Twitter ihre Publikationen teilten. Mittels tiefer neuronaler Netzwerke hätten die Forscher die Sprachgenerierungs-Software so entwickelt, dass sie sich anhand tausender Publikationen selbst verbessere. Den Feinschliff verpassten die Forscher dem KI-Werkzeug dann anhand von Zusammenfassungen, die Menschen geschrieben hatten.

Im Gegensatz zu anderen Algorithmen, die Zusammenfassungen von Publikationen anbieten, generiere das neue Werkzeug mit den TLDRs neue Sätze, anstatt nur bestehende Schlüsselsätze aus den Artikeln zu filtern. Die Software benötige für die Zusammenfassung den Abstract, die Einleitung und die Zusammenfassung einer Publikation. Dadurch entstünden zunächst Sätze, die den Fachjargon des Artikels beibehalten. Künftig soll die Software aber auch Zusammenfassungen schreiben, die auch Laien verstehen können.

ckr