Bert und Ernie bringen den Thesaurus auf Vordermann – dank KI!

Das ZBW – Leibniz-Informationszentrum Wirtschaft hat eine innovative Methode entwickelt, um den hauseigenen Thesaurus auf den neuesten Stand zu bringen: Künstliche Intelligenz (KI) kommt zum Einsatz. Das Forschungsteam der ZBW hat das vortrainierte BERT-Sprachmodell DistilBERT verwendet, um automatisiert Fachbegriffe aus der Wirtschaftswissenschaft zu extrahieren und neue Begriffe vorzuschlagen.

Der Standard-Thesaurus Wirtschaft (STW) der ZBW ist ein umfangreiches Nachschlagewerk mit über 6.000 Schlagwörtern und mehr als 20.000 alternativen Suchbegriffen in Deutsch und Englisch. Um in diesem sich schnell entwickelnden Fachgebiet auf dem Laufenden zu bleiben, hat die ZBW nach innovativen Lösungen gesucht.

In Zusammenarbeit mit Dr. Ralf Krestel und seinem Forschungsteam wurde eine Methode entwickelt, um wichtige Fachbegriffe automatisch aus wissenschaftlichen Artikeln zu extrahieren. Besonders die Titel und Abstracts der Artikel wurden berücksichtigt. Das DistilBERT-Sprachmodell erwies sich bei diesem Vorhaben als äußerst erfolgreich, es konnte nicht nur die spezifischen Schlüsselwörter identifizieren, sondern auch neue Begriffe für den Thesaurus vorschlagen.

Die Daten für diese Untersuchung stammen aus der ECONIS-Datenbank der ZBW. Dabei wurden Titel, Zusammenfassungen und ausgewählte Metadaten von wissenschaftlichen Publikationen analysiert. Die Untersuchung umfasste den Zeitraum von 2009 bis 2021 und insgesamt 575.000 Einträge.

Der Standard-Thesaurus Wirtschaft wird von verschiedenen Organisationen wie wissenschaftlichen Bibliotheken und Forschungsinstituten zur thematischen Erschließung und spezialisierten Recherche verwendet. Die ZBW, die das größte Angebot an wirtschaftswissenschaftlicher Literatur weltweit besitzt, kümmert sich um die Pflege und Aktualisierung dieses Schatzes.

Die vollständige Studie mit dem Namen „Domain-Specific Keyword Extraction using BERT“ von Jill Sammet und Ralf Krestel wurde im Rahmen des TermTrends-Workshops auf der LDK 2023 veröffentlicht und ist online verfügbar.

Die ZBW – Leibniz-Informationszentrum Wirtschaft ist eine bedeutende Institution für wirtschaftswissenschaftliche Informationen. Mit etwa 4 Millionen Medieneinheiten und Zugriff auf eine Vielzahl von Online-Dokumenten ist sie eine wichtige Anlaufstelle für alle, die sich mit Wirtschaft beschäftigen. Im Jahr 2022 wurden über 14 Millionen digitale Volltexte heruntergeladen, und auf dem Publikationsserver EconStor sind 250.000 frei verfügbare Aufsätze und Working Papers zu finden.

Die KI-gestützte Arbeit von Bert und Ernie hat den Thesaurus der ZBW auf den neuesten Stand gebracht. Die ZBW lädt alle Interessierten ein, von diesem aktualisierten und erweiterten Nachschlagewerk zu profitieren.

Schlagwörter: KISprachmodell DistilBERT + Automatische Extraktion von Schlagworten + StandardThesaurus Wirtschaft STW

Wie bewerten Sie den Schreibstil des Artikels?
1 Star2 Stars3 Stars4 Stars5 Stars
  • 17. Oktober 2023