{"id":5877,"date":"2024-03-21T19:16:53","date_gmt":"2024-03-21T19:16:53","guid":{"rendered":"https:\/\/byte-bucket.com\/2024\/03\/21\/google-entwickelt-framework-vlogger-zur-erstellung-beeindruckender-videos-mit-einem-bild-und-audioaufnahme\/"},"modified":"2024-03-21T19:16:53","modified_gmt":"2024-03-21T19:16:53","slug":"google-entwickelt-framework-vlogger-zur-erstellung-beeindruckender-videos-mit-einem-bild-und-audioaufnahme","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=5877","title":{"rendered":"Google entwickelt Framework &#8222;Vlogger&#8220; zur Erstellung beeindruckender Videos mit einem Bild und Audioaufnahme"},"content":{"rendered":"<p>Google hat ein neues Framework namens Vlogger entwickelt, das es Forschern erm\u00f6glicht, beeindruckende Videos zu erstellen, indem sie lediglich ein einzelnes Bild und eine Audioaufnahme verwenden. Vlogger nutzt fortschrittliche KI-Technologien, um realistische Videos zu generieren. Das Framework basiert auf fr\u00fcheren generativen Diffusionsmodellen wie der von OpenAI entwickelten KI Sora. Sora war bereits in der Lage, anhand einer Sprachanweisung ein nahezu fotorealistisches Video zu erstellen. Vlogger erweitert diese F\u00e4higkeiten und erm\u00f6glicht unter anderem die \u00dcbersetzung von Videoaufnahmen in verschiedene Sprachen.<\/p>\n<p>Im Herbst 2023 wurde Hey Gen eingef\u00fchrt, eine KI, die Videos in verschiedene Sprachen \u00fcbersetzen kann. Dadurch k\u00f6nnen Menschen weltweit nun mehrsprachige Videos in ihrer bevorzugten Sprache genie\u00dfen. Vlogger nutzt diese \u00dcbersetzungsfunktion und bietet somit eine noch breitere Palette an M\u00f6glichkeiten.<\/p>\n<p>Das Forschungsteam unter der Leitung von Enric Corona von der Universitat Politcnica de Catalunya hat eine Methode entwickelt, die im Vergleich zu fr\u00fcheren Arbeiten erweiterte F\u00e4higkeiten aufweisen soll. Mit einem zweistufigen Prozess k\u00f6nnen realistische Sprechvideos generiert werden. In der ersten Phase analysiert die KI die Audioaufnahme und erzeugt passende K\u00f6rperbewegungen, die mit dem Standbild synchronisiert sind. In der zweiten Phase wird das Ergebnis mit einem Bild-zu-Bild-Modell in Einzelbilder umgewandelt, wodurch ein realistisches Video entsteht, das die generierten K\u00f6rperbewegungen enth\u00e4lt.<\/p>\n<p>Die Forscher sind zuversichtlich, dass Vlogger eine Vielzahl von Anwendungsm\u00f6glichkeiten bieten kann, von der Filmindustrie bis hin zur Unterhaltungsbranche. Die F\u00e4higkeit, hochwertige Videos aus einem einzigen Bild und einer Audioaufnahme zu erstellen, k\u00f6nnte eine Revolution in der Erstellung und dem Konsum von Videos darstellen.<\/p>\n<p>Google hat das Framework Vlogger als Open-Source ver\u00f6ffentlicht, um die weitere Forschung und Entwicklung in diesem Bereich zu f\u00f6rdern. Es wird erwartet, dass Vlogger in den kommenden Jahren weiter verbessert und verfeinert wird, um noch mehr M\u00f6glichkeiten f\u00fcr die Erstellung von hochwertigen Videos zu bieten.<\/p>\n<p>Schlagw\u00f6rter: Vlogger + Google + OpenAI<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google hat ein neues Framework namens Vlogger entwickelt, das es Forschern erm\u00f6glicht, beeindruckende Videos zu erstellen, indem sie lediglich ein einzelnes Bild und eine Audioaufnahme verwenden. Vlogger nutzt fortschrittliche KI-Technologien, um realistische Videos zu generieren. Das Framework basiert auf fr\u00fcheren generativen Diffusionsmodellen wie der von OpenAI entwickelten KI Sora. Sora&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":5876,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-5877","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/5877","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5877"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/5877\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/5876"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5877"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5877"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=5877"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}