{"id":14946,"date":"2025-11-11T07:41:32","date_gmt":"2025-11-11T07:41:32","guid":{"rendered":"https:\/\/byte-bucket.com\/2025\/11\/11\/meta-fuehrt-mit-omnilingualer-automatischer-spracherkennung-einen-neuen-open-source-ansatz-in-der-sprachtechnologie-ein\/"},"modified":"2025-11-11T07:41:32","modified_gmt":"2025-11-11T07:41:32","slug":"meta-fuehrt-mit-omnilingualer-automatischer-spracherkennung-einen-neuen-open-source-ansatz-in-der-sprachtechnologie-ein","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=14946","title":{"rendered":"Meta f\u00fchrt mit omnilingualer automatischer Spracherkennung einen neuen Open-Source-Ansatz in der Sprachtechnologie ein"},"content":{"rendered":"<p>Meta vollzieht mit der Einf\u00fchrung seiner neuen omnilingualen automatischen Spracherkennung (ASR) einen Schritt zur\u00fcck zur Open-Source-Kultur im Bereich der Sprachtechnologie. Dieses System revolutioniert die Open-Source-Spracherkennung, indem es native Unterst\u00fctzung f\u00fcr eine nie dagewesene Anzahl von 1.600 Sprachen bietet und gleichzeitig die M\u00f6glichkeit er\u00f6ffnet, \u00fcber 5.400 weitere Sprachen durch Zero-Shot-In-Context-Learning abzudecken. Damit deckt die Technologie effektiv nahezu jede gesprochene Sprache ab, die ein Schriftsystem besitzt. Die Reichweite der omnilingualen ASR basiert auf einer Vielzahl von Modellfamilien, darunter wav2vec 2.0, CTC-basierte Modelle, LLM-ASR und LLM-ZeroShot-ASR. Ein zentraler Bestandteil dieses \u00d6kosystems ist ein umfangreiches mehrsprachiges Modell mit 7 Milliarden Parametern sowie ein reiches Korpus, das 350 bisher wenig beachtete Sprachen umfasst. Eine Schl\u00fcsselkomponente dieser Innovation ist die vollst\u00e4ndige Open-Source-Bereitstellung aller Ressourcen unter der Apache 2.0-Lizenz. Diese liberalen Lizenzbedingungen erm\u00f6glichen sowohl eine kostenlose kommerzielle als auch unternehmerische Nutzung, was die Demokratisierung des Zugangs zu fortschrittlicher Sprachtechnologie f\u00f6rdert. Meta betont in seiner Kommunikation, dass dieser Schritt den Zweck verfolgt, Sprachbarrieren abzubauen, den digitalen Zugang zu erweitern und Gemeinschaften weltweit zu st\u00e4rken. Die omnilinguale ASR wurde auf 4,3 Millionen Stunden mehrsprachiger Audiodaten trainiert und erreicht bemerkenswerte Ergebnisse: Zeichenfehlerquoten von unter 10 % in 78 % der unterst\u00fctzten Sprachen, inklusive 500 Sprachen, die zuvor von keinem anderen ASR-Modell abgedeckt wurden. Die F\u00e4higkeit zur Anpassung an neue Sprachen mit minimalen Daten macht das System sowohl flexibel als auch inklusiv, insbesondere f\u00fcr gef\u00e4hrdete und weniger vertretene Sprachgemeinschaften. Diese Ver\u00f6ffentlichung markiert einen Wandel in Metas Open-Source-Strategie, besonders im Kontext des vorherigen Llama 4 und unter der F\u00fchrung von Alexandr Wang als Chief AI Officer. Durch die Partnerschaft mit Organisationen wie Mozilla Common Voice, African Next Voices und Lanfrica etabliert Meta die omnilinguale ASR nicht mehr als geschlossenes Unternehmensprodukt, sondern als gemeinschaftsgetriebenes Framework f\u00fcr globale sprachliche Inklusion und digitale Zug\u00e4nglichkeit.<\/p>\n<p>Schlagw\u00f6rter: ASR + Meta + wav2vec<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Meta vollzieht mit der Einf\u00fchrung seiner neuen omnilingualen automatischen Spracherkennung (ASR) einen Schritt zur\u00fcck zur Open-Source-Kultur im Bereich der Sprachtechnologie. Dieses System revolutioniert die Open-Source-Spracherkennung, indem es native Unterst\u00fctzung f\u00fcr eine nie dagewesene Anzahl von 1.600 Sprachen bietet und gleichzeitig die M\u00f6glichkeit er\u00f6ffnet, \u00fcber 5.400 weitere Sprachen durch Zero-Shot-In-Context-Learning abzudecken.&#46;&#46;&#46;<\/p>\n","protected":false},"author":6,"featured_media":14945,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-14946","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/14946","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=14946"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/14946\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/14945"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=14946"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=14946"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=14946"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}