Nachrichten Von Text zu Diskussion: Geminis neue Funktion verwandelt Berichte in Sekundenschnelle in Podcasts

Von Text zu Diskussion: Geminis neue Funktion verwandelt Berichte in Sekundenschnelle in Podcasts

24 März 2025, 13:36

Google hat zwei Schlüsseltechnologien zusammengeführt — Deep Research und Audio Overviews — um dynamische Audio-Podcasts zu erstellen. Jetzt können Nutzer komplexe analytische Berichte in fesselnde Gespräche zwischen virtuellen Gastgebern verwandeln, was neue Möglichkeiten für das Lernen und den Umgang mit Informationen eröffnet.

Die zuvor eingeführte Deep Research-Funktion ermöglicht es Gemini, riesige Datenmengen aus dem Internet zu analysieren und detaillierte Berichte zu einem bestimmten Thema zu erstellen. Ab heute umfasst dieses Tool nun die Option Generate Audio Overview, die trockene Fakten in einen interaktiven Podcast verwandelt. Sobald die Forschung abgeschlossen ist, wählt der Nutzer die entsprechende Schaltfläche, und Gemini generiert einen Dialog zwischen zwei KI-"Hosts", die die wichtigsten Erkenntnisse in einem lebhaften Gesprächsformat diskutieren.

Die Technologie für die sprachliche Zusammenfassung wurde erstmals im September 2023 in der NotebookLM-App eingeführt, die für die Dokumentenanalyse entwickelt wurde. Im vergangenen Jahr und einem halben Jahr hat Google die Funktion erheblich verbessert: Nutzer können nun das Skript des Dialogs beeinflussen, virtuelle Sprecher Fragen stellen und sogar den Stil der Inhaltsübermittlung ändern. Im März 2025 wurde der Dienst für alle — sowohl für kostenlose Nutzer als auch für Abonnenten — in Gemini verfügbar.

Während das System zuvor nur mit kurzen Texten und Präsentationen arbeitete, ermöglicht die Integration mit Deep Research nun die Verarbeitung von umfassenden Forschungsarbeiten — von Klimaberichten bis hin zu Marktanalysen. Experten weisen darauf hin, dass der Übergang von monotonen textlichen Zusammenfassungen zu interaktiven Podcasts das Problem der „Informationsüberlastung“ löst. Die beiden KI-Gesprächspartner simulieren eine Diskussion, heben Widersprüche hervor, untermauern Argumente mit Beispielen und fügen sogar erzählerische Elemente hinzu. Laut Google-Vertretern verbessert dieses Format die Datenbehaltung um 40 % im Vergleich zu traditionellen Methoden.

Bis Ende 2025 plant Google, die Möglichkeit hinzuzufügen, die Stimmen der Gastgeber auszuwählen, die Episodenlängen anzupassen und in Echtzeit benutzergenerierte Fragen einzufügen. Die neue Ära personalisierter Audioinhalte, in der jede Anfrage zu einer einzigartigen Show wird, hat bereits begonnen.

Der Beitrag wurde übersetzt. Original anzeigen (EN)

Arkadiy Andrienko

Nachrichtenautor

As a tech journalist at VGTimes, I'm equally comfortable discussing the latest GPUs and diving deep into the intricacies of classic RPGs. Writing about games and hardware since 2018, my background in sound engineering has given me a keen ear for the nuances of audio technology, and I'm always on the lookout for the next groundbreaking innovation in gaming hardware. When I'm not writing about tech, you'll likely find me exploring the post-apocalyptic wasteland of Fallout, managing a colony in RimWorld, or commanding armies in Hearts of Iron IV. For me, gaming is more than just a hobby; it's a passion that fuels my creativity and keeps me connected to the ever-evolving world of technology.

Nachrichten Hardware und Technologien Google

Kommentare 0