Audio Overview: Aus einem PDF einen interessanten Podcast mit “KI-Hosts” erstellen lassen

Ein Forschungspapier hochladen, nur einen Button drücken und nach wenigen Minuten wird daraus automatisch ein englischsprachiger Podcast mit süffisant-kritischer Diskussion etwa zum Thema “Custom Chatbots in der Hochschullehre” generiert? Und das alles kostenlos? Ja, dies geht aktuell über NotebookLM basierend auf dem Language Model Gemini von Google und dem neuen Feature Audio Overview und zwar unglaublich einfach! Auch der Input einer simplen Website-URL, Text oder Slides ist möglich.

Das obere Audio wurde aus der Veröffentlichung Tailoring Chatbots for Higher Education: Some Insights and Experiences von Gerd Kortemeyer generiert, dem “AI-Chef-Designer” der ETH Zürich und Verantwortlicher für die Custom Bots, die über Microsoft Azure laufen und über die Technik RAG kontextbezogenen Inhalt für Studierende ausgeben können.

Die beiden “Hosts” des Podcasts, eine weibliche und männliche Stimme, erfassen die Thematik gleich zu Beginn recht gut, starten korrekt in das Thema und stellen auch direkt einen kritischen Bezug zu Generativer KI im Rahmen der Hochschullehre her. Eine Diskussion auf der Grundlage von KI-generierten Moderatoren beginnt und diese regt definitiv zum Nachdenken, da sie interessant aufgebaut ist, auch bezüglich der Tonlagen der beiden Hosts. Ebenfalls wird nach ein paar Minuten der Verfasser des Papers Gerd Kortemeyer kurz präsentiert. Die Angaben etwa zu den Tätigkeiten des “Chef Designers” hinsichtlich der “Swiss Al Alliance” sind korrekt und ich finde diesen spontanen Wechsel hin zur Vorstellung des Publishers und auch der kurzen Präsentation dieser Schweizer Initiative mehr als gelungen. Die neue Funktion Audio Overviews scheint zu überzeugen.

Oben rechts den Button “Generieren” klicken und schon wird eine fiktive Unterhaltung erzeugt

Und so geht es:

1) Die Webseite https://notebooklm.google.com/ aufrufen, über ein Google-Konto anmelden, ein neues Notebook anlegen und dann ein PDF in den Workspace hochladen. 
2) Falls noch nicht geöffnet, dann rechts unten auf Notebook Leitfaden klicken. 
3) Oben rechts im Feld “Detaillierte Unterhaltung” auf “Generieren” klicken. Das war’s!
4) Audio abspielen und herunterladen in MP3-Format.

Es ist wirklich sehr einfach und zudem kostenlos, solch eine KI-generierte Unterhaltung auf der Grundlage eines Forschungspapiers zu erstellen. Mit einer Länge von knapp 15 Minuten finde ich den Output schon sehr üppig, was mir in diesem Zusammenhang richtig gut gefällt. 1-2 Minuten wären zu wenig, um diese Thematik vernünftig zu diskutieren.

Nach wenigen Miunten kann das Audio dann in NotebookLM abgespielt werden

Im oberen Screenshot aus NotebookLM ist sichtbar, wie User nun einfach den Play-Button klicken können, um ihren ganz eigenen und einzigartigen Podcast abspielen zu können. Es gab via Audio Overview keine Möglichkeiten, den Output mittels Prompteingabe zu steuern, sondern ausschließlich diesen einen Button-Klick, womit Google wohl auch schädliche Outputs vermeiden möchte, denn Forschungspapiere ließen sich dann auch “zerreißen”, falls Nutzer potenziell alles generieren könnten. 

Podcast auch über mehrere Quellen generieren

Es lässt sich nicht nur eine einzige Quelle für den Input verwenden, die als Grundlage dient und dann von den Hosts diskutiert wird, sondern gleiche mehrere. Als Beispiel habe ich die URLs von drei Blogbeiträgen auf Unidigital.news eingefügt, die dann wie im unteren Screenshot auf der linken Seite in der Navigation sichtbar sind.

notebook
Aus mehreren Beiträgen einen Podcast erstellen lassen

Nachdem die Inhalte von der Google-KI Gemini erkannt wurden, reicht es auch hier aus, einfach den Button generieren zu klicken und schon wird die Sendung nach wenigen Minuten auf der Basis von drei Blogbeiträgen erzeugt. Dies läuft alles sehr reibungsfrei, insbesondere hinsichtlich der Übergänge. Theoretisch ließen sich so etwa aus Online-Zeitungen z.B. zum Themenbereich Wirtschaft oder Außenpolitik 4-5 oder mehrere Artikel einfügen und im Rahmen eines Podcasts anhören, ebenfalls in unterschiedlichen Geschwindigkeiten. Jedoch sollte hierbei der Copyright-Schutz beachtet werden. Bei eigenen Beiträgen wie bei Unidigital ist dies natürlich kein Problem, denn die Erlaubnis habe ich mir überraschenderweise selber erteilt. Genehmigt! 😉

Empfohlenes Video der “Digitalen Profis”

Ein Beitrag erstellt von

Ähnliche Beiträge