Von Text zu Diskussion: Geminis neue Funktion verwandelt Berichte in Sekundenschnelle in Podcasts

Google hat zwei Schlüsseltechnologien zusammengeführt — Deep Research und Audio Overviews — um dynamische Audio-Podcasts zu erstellen. Jetzt können Nutzer komplexe analytische Berichte in fesselnde Gespräche zwischen virtuellen Gastgebern verwandeln, was neue Möglichkeiten für das Lernen und den Umgang mit Informationen eröffnet.
Die zuvor eingeführte Deep Research-Funktion ermöglicht es Gemini, riesige Datenmengen aus dem Internet zu analysieren und detaillierte Berichte zu einem bestimmten Thema zu erstellen. Ab heute umfasst dieses Tool nun die Option Generate Audio Overview, die trockene Fakten in einen interaktiven Podcast verwandelt. Sobald die Forschung abgeschlossen ist, wählt der Nutzer die entsprechende Schaltfläche, und Gemini generiert einen Dialog zwischen zwei KI-"Hosts", die die wichtigsten Erkenntnisse in einem lebhaften Gesprächsformat diskutieren.
Die Technologie für die sprachliche Zusammenfassung wurde erstmals im September 2023 in der NotebookLM-App eingeführt, die für die Dokumentenanalyse entwickelt wurde. Im vergangenen Jahr und einem halben Jahr hat Google die Funktion erheblich verbessert: Nutzer können nun das Skript des Dialogs beeinflussen, virtuelle Sprecher Fragen stellen und sogar den Stil der Inhaltsübermittlung ändern. Im März 2025 wurde der Dienst für alle — sowohl für kostenlose Nutzer als auch für Abonnenten — in Gemini verfügbar.
Während das System zuvor nur mit kurzen Texten und Präsentationen arbeitete, ermöglicht die Integration mit Deep Research nun die Verarbeitung von umfassenden Forschungsarbeiten — von Klimaberichten bis hin zu Marktanalysen. Experten weisen darauf hin, dass der Übergang von monotonen textlichen Zusammenfassungen zu interaktiven Podcasts das Problem der „Informationsüberlastung“ löst. Die beiden KI-Gesprächspartner simulieren eine Diskussion, heben Widersprüche hervor, untermauern Argumente mit Beispielen und fügen sogar erzählerische Elemente hinzu. Laut Google-Vertretern verbessert dieses Format die Datenbehaltung um 40 % im Vergleich zu traditionellen Methoden.
Bis Ende 2025 plant Google, die Möglichkeit hinzuzufügen, die Stimmen der Gastgeber auszuwählen, die Episodenlängen anzupassen und in Echtzeit benutzergenerierte Fragen einzufügen. Die neue Ära personalisierter Audioinhalte, in der jede Anfrage zu einer einzigartigen Show wird, hat bereits begonnen.
-
Die KI von Google lernt, die Welt durch eine Smartphone-Kamera zu analysieren
-
US-Justizministerium fordert weiterhin, dass Google den Chrome-Webbrowser verkauft
-
Chat Statt Photoshop: Googles Gemini 2.0 Flash Lernt Bilder Durch Dialog Zu Bearbeiten
-
Mobile Gaming auf dem Desktop: Google startet automatisches Portieren von Spielen auf den PC
-
Google beginnt mit dem weltweiten Ausstieg aus dem Assistant zugunsten von Gemini