{"id":398,"date":"2023-10-17T16:48:10","date_gmt":"2023-10-17T16:48:10","guid":{"rendered":"https:\/\/byte-bucket.com\/2023\/10\/17\/bert-und-ernie-bringen-den-thesaurus-auf-vordermann-dank-ki\/"},"modified":"2023-10-17T16:48:10","modified_gmt":"2023-10-17T16:48:10","slug":"bert-und-ernie-bringen-den-thesaurus-auf-vordermann-dank-ki","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=398","title":{"rendered":"Bert und Ernie bringen den Thesaurus auf Vordermann &#8211; dank KI!"},"content":{"rendered":"<p>Das ZBW &#8211; Leibniz-Informationszentrum Wirtschaft hat eine innovative Methode entwickelt, um den hauseigenen Thesaurus auf den neuesten Stand zu bringen: K\u00fcnstliche Intelligenz (KI) kommt zum Einsatz. Das Forschungsteam der ZBW hat das vortrainierte BERT-Sprachmodell DistilBERT verwendet, um automatisiert Fachbegriffe aus der Wirtschaftswissenschaft zu extrahieren und neue Begriffe vorzuschlagen.<\/p>\n<p>Der Standard-Thesaurus Wirtschaft (STW) der ZBW ist ein umfangreiches Nachschlagewerk mit \u00fcber 6.000 Schlagw\u00f6rtern und mehr als 20.000 alternativen Suchbegriffen in Deutsch und Englisch. Um in diesem sich schnell entwickelnden Fachgebiet auf dem Laufenden zu bleiben, hat die ZBW nach innovativen L\u00f6sungen gesucht.<\/p>\n<p>In Zusammenarbeit mit Dr. Ralf Krestel und seinem Forschungsteam wurde eine Methode entwickelt, um wichtige Fachbegriffe automatisch aus wissenschaftlichen Artikeln zu extrahieren. Besonders die Titel und Abstracts der Artikel wurden ber\u00fccksichtigt. Das DistilBERT-Sprachmodell erwies sich bei diesem Vorhaben als \u00e4u\u00dferst erfolgreich, es konnte nicht nur die spezifischen Schl\u00fcsselw\u00f6rter identifizieren, sondern auch neue Begriffe f\u00fcr den Thesaurus vorschlagen.<\/p>\n<p>Die Daten f\u00fcr diese Untersuchung stammen aus der ECONIS-Datenbank der ZBW. Dabei wurden Titel, Zusammenfassungen und ausgew\u00e4hlte Metadaten von wissenschaftlichen Publikationen analysiert. Die Untersuchung umfasste den Zeitraum von 2009 bis 2021 und insgesamt 575.000 Eintr\u00e4ge.<\/p>\n<p>Der Standard-Thesaurus Wirtschaft wird von verschiedenen Organisationen wie wissenschaftlichen Bibliotheken und Forschungsinstituten zur thematischen Erschlie\u00dfung und spezialisierten Recherche verwendet. Die ZBW, die das gr\u00f6\u00dfte Angebot an wirtschaftswissenschaftlicher Literatur weltweit besitzt, k\u00fcmmert sich um die Pflege und Aktualisierung dieses Schatzes.<\/p>\n<p>Die vollst\u00e4ndige Studie mit dem Namen &#8222;Domain-Specific Keyword Extraction using BERT&#8220; von Jill Sammet und Ralf Krestel wurde im Rahmen des TermTrends-Workshops auf der LDK 2023 ver\u00f6ffentlicht und ist online verf\u00fcgbar.<\/p>\n<p>Die ZBW &#8211; Leibniz-Informationszentrum Wirtschaft ist eine bedeutende Institution f\u00fcr wirtschaftswissenschaftliche Informationen. Mit etwa 4 Millionen Medieneinheiten und Zugriff auf eine Vielzahl von Online-Dokumenten ist sie eine wichtige Anlaufstelle f\u00fcr alle, die sich mit Wirtschaft besch\u00e4ftigen. Im Jahr 2022 wurden \u00fcber 14 Millionen digitale Volltexte heruntergeladen, und auf dem Publikationsserver EconStor sind 250.000 frei verf\u00fcgbare Aufs\u00e4tze und Working Papers zu finden.<\/p>\n<p>Die KI-gest\u00fctzte Arbeit von Bert und Ernie hat den Thesaurus der ZBW auf den neuesten Stand gebracht. Die ZBW l\u00e4dt alle Interessierten ein, von diesem aktualisierten und erweiterten Nachschlagewerk zu profitieren.<\/p>\n<p>Schlagw\u00f6rter: KISprachmodell DistilBERT + Automatische Extraktion von Schlagworten + StandardThesaurus Wirtschaft STW<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Das ZBW &#8211; Leibniz-Informationszentrum Wirtschaft hat eine innovative Methode entwickelt, um den hauseigenen Thesaurus auf den neuesten Stand zu bringen: K\u00fcnstliche Intelligenz (KI) kommt zum Einsatz. Das Forschungsteam der ZBW hat das vortrainierte BERT-Sprachmodell DistilBERT verwendet, um automatisiert Fachbegriffe aus der Wirtschaftswissenschaft zu extrahieren und neue Begriffe vorzuschlagen. Der Standard-Thesaurus&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":397,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-398","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/398","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=398"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/398\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/397"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=398"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=398"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=398"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}