Google hat zwei Schlüsseltechnologien zusammengeführt — Deep Research und Audio Overviews — um dynamische Audio-Podcasts zu erstellen. Jetzt können Nutzer komplexe analytische Berichte in fesselnde Gespräche zwischen virtuellen Gastgebern verwandeln, was neue Möglichkeiten für das Lernen und den Umgang mit Informationen eröffnet.
Die zuvor eingeführte Deep Research-Funktion ermöglicht es Gemini, riesige Datenmengen aus dem Internet zu analysieren und detaillierte Berichte zu einem bestimmten Thema zu erstellen. Ab heute umfasst dieses Tool nun die Option Generate Audio Overview, die trockene Fakten in einen interaktiven Podcast verwandelt. Sobald die Forschung abgeschlossen ist, wählt der Nutzer die entsprechende Schaltfläche, und Gemini generiert einen Dialog zwischen zwei KI-"Hosts", die die wichtigsten Erkenntnisse in einem lebhaften Gesprächsformat diskutieren.
Die Technologie für die sprachliche Zusammenfassung wurde erstmals im September 2023 in der NotebookLM-App eingeführt, die für die Dokumentenanalyse entwickelt wurde. Im vergangenen Jahr und einem halben Jahr hat Google die Funktion erheblich verbessert: Nutzer können nun das Skript des Dialogs beeinflussen, virtuelle Sprecher Fragen stellen und sogar den Stil der Inhaltsübermittlung ändern. Im März 2025 wurde der Dienst für alle — sowohl für kostenlose Nutzer als auch für Abonnenten — in Gemini verfügbar.
Während das System zuvor nur mit kurzen Texten und Präsentationen arbeitete, ermöglicht die Integration mit Deep Research nun die Verarbeitung von umfassenden Forschungsarbeiten — von Klimaberichten bis hin zu Marktanalysen. Experten weisen darauf hin, dass der Übergang von monotonen textlichen Zusammenfassungen zu interaktiven Podcasts das Problem der „Informationsüberlastung“ löst. Die beiden KI-Gesprächspartner simulieren eine Diskussion, heben Widersprüche hervor, untermauern Argumente mit Beispielen und fügen sogar erzählerische Elemente hinzu. Laut Google-Vertretern verbessert dieses Format die Datenbehaltung um 40 % im Vergleich zu traditionellen Methoden.
Bis Ende 2025 plant Google, die Möglichkeit hinzuzufügen, die Stimmen der Gastgeber auszuwählen, die Episodenlängen anzupassen und in Echtzeit benutzergenerierte Fragen einzufügen. Die neue Ära personalisierter Audioinhalte, in der jede Anfrage zu einer einzigartigen Show wird, hat bereits begonnen.