Das Konzept des semantischen Hörens besteht darin, den Inhalt dessen, was jemand sagt, zu erkennen, anstatt sich auf die Art und Weise zu konzentrieren, wie es ausgedrückt wird. Durch diesen Ansatz könnten zukünftige Hörgeräte und Kopfhörer entwickelt werden, die dem Träger ermöglichen, gezielte Geräusche auszublenden und andere zu verstärken. Dadurch könnten intelligente Hörgeräte und Kopfhörer geschaffen werden.
Diese innovativen Kopfhörer hätten die Fähigkeit, Geräusche wie das Weinen von Babys, Vogelgezwitscher oder Weckerklingeln hörbar zu machen, sodass der Träger sie wahrnehmen kann. Kürzlich wurde auf dem ACM Symposium ein Prototyp eines solchen Systems von Forschern der University of Washington vorgestellt.
Die Funktionsweise des Systems besteht darin, dass handelsübliche Kopfhörer mit Geräuschunterdrückung über eine Smartphone-App verbunden werden. Die in diesen Kopfhörern integrierten Mikrofone, die normalerweise zur Unterdrückung von Geräuschen verwendet werden, werden umgewandelt, um auch die Umgebungsgeräusche des Trägers aufzunehmen. Anschließend werden diese Umgebungsgeräusche einem neuronalen Netzwerk auf dem Smartphone vorgespielt. Das Netzwerk ist in der Lage, bestimmte Geräusche in Echtzeit zu verstärken oder zu unterdrücken, basierend auf den individuellen Vorlieben des Nutzers.
Das Team hat das Netzwerk durch das Training mit Tausenden von Audiobeispielen aus Online-Datensätzen und verschiedenen lauten Umgebungen geschult, um es zu optimieren. Nachfolgend wurde ihm beigebracht, 20 gängige Geräusche wie ein Gewitter, eine Toilettenspülung oder das Zerbrechen von Glas zu erkennen.
Um ihren Prototypen zu testen, haben die Forscher neun Teilnehmer in Büros, Parks und auf Straßen platziert. Das System zeigte eine gute Fähigkeit, Geräusche effektiv zu dämpfen und zu verstärken, selbst in untrainierten Situationen. Allerdings hatte es leichte Schwierigkeiten, menschliche Sprache von Hintergrundmusik, insbesondere Rap-Musik, zu unterscheiden.
Seit langer Zeit bemühen sich Forscher darum, das sogenannte Cocktail-Party-Problem zu lösen, bei dem ein Computer in der Lage sein soll, sich wie Menschen auf eine einzelne Stimme in einem überfüllten Raum zu konzentrieren. Marc Delcroix, ein führender Forscher bei NTT Communication Science Laboratories in Kyoto, der sich mit Sprachverbesserung und -erkennung befasst, jedoch nicht an dem Projekt beteiligt war, betont, dass diese neue Methode einen bedeutenden Fortschritt darstellt und das Potenzial der Technologie verdeutlicht.
Diese Errungenschaft ist äußerst vorteilhaft für das Fachgebiet, da sie die ersten sind, die ein vollständiges binaurales Echtzeit-Zielgeräuschextraktionssystem vorschlagen. Zwar gab es bereits ähnliche Ideen, insbesondere im Bereich der Sprachseparation, jedoch stellen sie eine Neuheit dar.
Laut Shyam Gollakota, Assistenzprofessor an der University of Washington und Mitwirkender des Projekts, können heutige Headsets mit Geräuschunterdrückung Musik abspielen, selbst wenn die Geräuschunterdrückung aktiviert ist. In unserem Fall geben wir jedoch mithilfe unserer maschinellen Lernalgorithmen die tatsächlich interessanten Geräusche aus der Umgebung wieder, anstatt Musik abzuspielen.
Gollakota ist begeistert von den Möglichkeiten, die diese Technologie bietet, um Menschen mit Hörverlust zu unterstützen, da herkömmliche Hörgeräte in lauten Umgebungen nur begrenzten Nutzen haben können. Er betont, dass dies eine einzigartige Gelegenheit ist, die Zukunft intelligenter Hörgeräte durch verbessertes Hören zu gestalten.
Diese Fähigkeit, selektiv zu entscheiden, was wir hören möchten und was nicht, könnte auch Menschen in verschiedenen Berufen zugutekommen, beispielsweise im Gesundheitswesen, beim Militär, in der Technik sowie Fabrik- oder Bauarbeitern, die ihr Gehör schützen und dennoch kommunizieren möchten.
Laut Mack Hagood, außerordentlicher Professor für Medien und Kommunikation an der Miami University in Ohio und Autor von „Hush: Media and Sonic Self-Control“, könnte ein solches System uns erstmals eine gewisse Kontrolle über die Geräusche geben, die uns umgeben – sowohl positive als auch negative. Dies sei ein lang ersehnter Traum, so Hagood, der nicht an dem Projekt beteiligt war. Es wäre praktisch, wenn wir einfach ankreuzen könnten, ob wir diese Geräusche hören möchten oder nicht. Diese Einschränkung der Wahrnehmung könnte zu einer verbesserten Kommunikation beitragen und sollte ernsthaft in Betracht gezogen werden. Er erklärt, dass jedes Mal, wenn wir uns für Kontrolle und Wahlmöglichkeiten entscheiden, wir den Zufall und glückliche Zufälle außer Acht lassen. Er betont, dass wir im Voraus festlegen, was wir hören möchten und was nicht. Daher können wir nicht sicher sein, ob wir wirklich etwas gerne gehört hätten.
Schlagwörter: Geräuschunterdrückung + SmartphoneApp + Hörverlust
Wie bewerten Sie den Schreibstil des Artikels?
