Google I/O – Künstliche Intelligenz im Rampenlicht

Die diesjährige Google Entwicklerkonferenz I/O stand ganz im Zeichen der künstlichen Intelligenz. CEO Sundar Pichai betonte stolz, dass Google seit über zehn Jahren in KI investiert und damit zahlreiche Innovationen hervorgebracht hat. Auf der I/O-Konferenz wurde besonders viel über das KI-Modell Gemini und seine Nachfolger diskutiert.

Mit Gemini 1.5 Flash will Google das KI-Modell noch leistungsstärker machen. Das Highlight war jedoch die Vorstellung der Video-KI Veo, die sich mit Sora von OpenAI messen kann. Damit können nun auch Videos in Full-HD erstellt werden, die länger als eine Minute sind. Endlich können wir unseren alltäglichen Vlogger-Ambitionen nachgehen, ohne uns mit Sora herumärgern zu müssen.

Aber das war noch längst nicht alles! Die Suchmaschine erhält eine AI Overview-Funktion, die automatisch Zusammenfassungen der Suchanfragen oberhalb der Suchergebnisse anzeigt. Damit sparen wir uns Zeit und können direkt zur besten Katzenvideo-Ergebnisseite gelangen.

Und als wäre das nicht genug, arbeitet Google auch an Project Astra, einer Funktion, die in den ChatGPT von OpenAI integriert wurde. Damit können wir bald über Kamera und Sprache mit dem Chatbot Gemini interagieren. Endlich können wir unsere tiefsten Geheimnisse einem KI-Chatbot anvertrauen – was könnte schiefgehen?

Aber Moment mal, was ist denn ein Gemini? Keine Sorge, Google hat das KI-Modell in verschiedenen Versionen veröffentlicht. Die neueste Version, Gemini 1.5 Pro, steht den Kunden von Vertex AI und Google AI Studio zur Verfügung. Entwickler können die Kontextlänge sogar auf bis zu zwei Millionen Token erweitern. Klingt nach einer Menge Spaß für alle Tech-Nerds da draußen!

Doch Google wäre nicht Google, wenn sie nicht noch ein paar weitere Überraschungen in petto hätten. Mit der Gemini-App können wir Veranstaltungshinweise per Foto aufnehmen und direkt in den Kalender übertragen. Außerdem können wir personalisierte KI-Chatbots namens Gems erstellen, ähnlich wie Metas AI Personas. Wer braucht schon Freunde, wenn man einen KI-Chatbot haben kann, der einem beim Laufen Tipps gibt?

Aber auch die Konkurrenz schläft nicht. OpenAI hat bereits mit Omnimodel GPT-4o vorgelegt, das Text, Audio und Vision simultan verarbeiten kann. Damit können wir sogar mit dem Modell über die Kamera oder per Sprache interagieren. Da kann Google mit Gemini Live wohl nicht ganz mithalten.

Trotzdem, Google lässt sich nicht unterkriegen. Sie präsentierten auch eine Video-KI namens Sora, die noch nicht verfügbar ist. Veo hat die Fähigkeit, Videos in Full-HD zu erstellen und Kameraeinstellungen zu erkennen. Aber ob die Videos wirklich konsistent und kohärent sind, müssen wir wohl erst noch selbst herausfinden. Ein Künstler berichtete jedoch, dass er bei Sora erheblichen Zeitaufwand für die Nachbearbeitung aufbringen musste. Hoffen wir, dass Google hier die Nase vorn hat.

Alles in allem war die Google I/O-Konferenz ein beeindruckendes Spektakel der künstlichen Intelligenz. Wir können uns auf spannende Neuerungen in den kommenden Monaten freuen und vielleicht schon bald unsere eigenen KI-Chatbot-Freunde haben. Bis dahin lassen wir uns von Google weiter mit ihren innovativen KI-Diensten und -Produkten überraschen – und hoffen darauf, dass sie nicht die Weltherrschaft übernehmen.

Schlagwörter: Google I/O + Gemini Live + OpenAIs ChatGPT

Wie bewerten Sie den Schreibstil des Artikels?
1 Star2 Stars3 Stars4 Stars5 Stars
  • 14. Mai 2024