{"id":6059,"date":"2024-03-28T00:15:39","date_gmt":"2024-03-28T00:15:39","guid":{"rendered":"https:\/\/byte-bucket.com\/2024\/03\/28\/max-planck-institut-entwickelt-ki-methode-zur-emotionserkennung-in-audioaufnahmen\/"},"modified":"2024-03-28T00:15:39","modified_gmt":"2024-03-28T00:15:39","slug":"max-planck-institut-entwickelt-ki-methode-zur-emotionserkennung-in-audioaufnahmen","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=6059","title":{"rendered":"Max-Planck-Institut entwickelt KI-Methode zur Emotionserkennung in Audioaufnahmen"},"content":{"rendered":"<p>Das Max-Planck-Institut f\u00fcr Bildungsforschung in Berlin hat eine neue Methode entwickelt, um Emotionen anhand von kurzen Audioaufnahmen zu erkennen. Die Entwicklungspsychologen des Instituts setzen dabei auf K\u00fcnstliche Intelligenz (KI), um emotionale Nuancen in Stimmausschnitten zu identifizieren.<\/p>\n<p>Das Forschungsteam unter der Leitung von Hannes Diemerling verglich die Pr\u00e4zision von drei verschiedenen maschinellen Lernmodellen miteinander. Dabei stellten sie fest, dass die Modelle eine vergleichbare Genauigkeit wie menschliche Bewertungen erreichen konnten.<\/p>\n<p>F\u00fcr die Studie wurden Schauspieler engagiert, die nichtssagende S\u00e4tze mit einer emotionalen Komponente versehen haben. Die Wissenschaftler extrahierten diese S\u00e4tze aus zwei verschiedenen Datens\u00e4tzen, einem aus Kanada und einem aus Deutschland. Dadurch konnte \u00fcberpr\u00fcft werden, ob maschinelles Lernen unabh\u00e4ngig von Sprache, kulturellen Feinheiten und semantischem Inhalt in der Lage ist, Gef\u00fchle korrekt zu erkennen.<\/p>\n<p>Jeder Audioausschnitt wurde auf eine Dauer von 1,5 Sekunden reduziert, da dies die Zeit ist, die Menschen ben\u00f6tigen, um das Gef\u00fchl beim Sprechen zu erkennen. Dies ist auch die geringste L\u00e4nge, bei der eine Vermischung von Emotionen vermieden werden kann.<\/p>\n<p>Die Experten analysierten KI-Modelle, die auf drei verschiedenen Arbeitsweisen basieren. Tiefe neuronale Netze (DNNs) analysieren verschiedene Aspekte von Kl\u00e4ngen wie Frequenz oder Tonh\u00f6he, um die zugrundeliegenden Emotionen zu erkennen. Konvolutionale neuronale Netzwerke (CNNs) hingegen suchen nach visuellen Mustern in der Darstellung von Tonspuren, um Emotionen zu identifizieren. Das hybride Modell (C-DNN) kombiniert beide Ans\u00e4tze, um Emotionen vorherzusagen.<\/p>\n<p>Anschlie\u00dfend wurden diese Modelle anhand beider Datens\u00e4tze auf ihre Leistung getestet. Dabei zeigte sich, dass die Genauigkeit der DNNs und C-DNNs h\u00f6her war als die der CNNs. Unabh\u00e4ngig vom verwendeten Modell war die Erkennung von Emotionen mit gr\u00f6\u00dferer Wahrscheinlichkeit korrekt als durch reines Raten, was mit der Genauigkeit des menschlichen Urteils vergleichbar ist.<\/p>\n<p>Die Forscher legten gro\u00dfen Wert darauf, ihre Modelle in einem realistischen Umfeld zu testen und die Vorhersagef\u00e4higkeiten von Menschen als Referenz heranzuziehen. Wenn die Modelle besser abgeschnitten h\u00e4tten als die Menschen, w\u00e4re dies laut Diemerling ein Hinweis darauf gewesen, dass es Muster gibt, die f\u00fcr uns nicht erkennbar sind.<\/p>\n<p>Die Studie wurde in der Fachzeitschrift &#8222;Frontiers in Psychology&#8220; ver\u00f6ffentlicht und zeigt, dass es m\u00f6glich ist, Systeme zu entwickeln, die emotionale Signale sofort interpretieren k\u00f6nnen. Dies k\u00f6nnte in verschiedenen Situationen, wie beispielsweise in der Therapie oder anderen zwischenmenschlichen Kontexten, in denen Kommunikationstechnologien eingesetzt werden, verwendet werden.<\/p>\n<p>Schlagw\u00f6rter: Hannes Diemerling + KI + Kanada<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Das Max-Planck-Institut f\u00fcr Bildungsforschung in Berlin hat eine neue Methode entwickelt, um Emotionen anhand von kurzen Audioaufnahmen zu erkennen. Die Entwicklungspsychologen des Instituts setzen dabei auf K\u00fcnstliche Intelligenz (KI), um emotionale Nuancen in Stimmausschnitten zu identifizieren. Das Forschungsteam unter der Leitung von Hannes Diemerling verglich die Pr\u00e4zision von drei verschiedenen&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":6058,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-6059","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/6059","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6059"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/6059\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/6058"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6059"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6059"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6059"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}