Voice2Voice-Kommunikation mithilfe der Browser-Erweiterung Talk-2-ChatGPT ermöglichen

Rund um ChatGPT gibt es mittlerweile eine große Auswahl an Anwendungen wie etwa Plugins oder auch Browser-Extensions, die bestimmte Funktionen nutzen, um den Chatbot immer kreativer zu gebrauchen. Vor allem Audio2Audio, also die Kommunikation der Künstlichen Intelligenz ausschließlich über beidseitige Sprachausgabe ist mehr als interessant und bietet so einige Möglichkeiten. Dazu gehört nicht nur der inklusive Bereich. Die Browser-Extension Talk-to-ChatGPT ermöglicht nun diesen Zugang.

screen talk to chatgpt
Die Anwendung bietet dem User im Backend diverse Features

Es geht ein klein wenig in Richtung Hollywood, wenn man morgens mit seinem Espresso im Schaukelstuhl sitzt und sich entspannt mit einer Künstlichen Intelligenz wie ChatGPT unterhält. Anstatt direkt vorm Bildschirm zu sitzen, lässt sich die KI auch komplett über Spracheingaben bedienen und der User erhält in Kürze eine passende Sprachausgabe zurück. Doch wie richtet ich dies bei mir auf dem Computer oder Tablet ein? So gehts:

1) Browser-Extension Talk-2-ChatGPT über die Erweiterungen im Browser installieren
2) Login bei ChatGPT oder Neuladen der Seite des Chatbots
3) Fertig! Das Interface taucht nun automatisch im Fenster auf. Siehe Screenshot oben
 
talk to
Die obere Anwendung auswählen und installieren

Es ist wirklich sehr einfach das Tool zu aktivieren, da es nach der Installation automatisch im Browser sichtbar ist. Es lässt sich übrigens auch überall hin verschieben. Dafür die Maus gedrückt halten. Klickt nun auf den Start-Button und sprecht euren Audio-Prompt aus. Kurz darauf schreibt ChatGPT den Text runter und gibt auch danach das zugehörige Audio aus. Dies ist es dann eigentlich auch schon. So könnt Ihr immer weiter hin und her kommunizieren, ob im Bürostuhl oder beim Gang durchs Wohnzimmer. Jedoch läuft wie bei vielen ChatGPT-Anwendungen auch dieses Programm nicht zu 100 % rund, sondern hat gelegentlich Bugs. Es kann z.B. sein, dass es einfach mittendrin in der Konversation stoppt und man muss daraufhin die Audioanweisung geben, dass es doch bitte weiter machen möchte. Sehr cool ist, dass Ihr jederzeit von Audio zu Text wechseln könnt und umgekehrt. Es lässt sich also beliebig kombinieren.

Es ist wichtig zu beachten, dass Ihr oben im sichtbaren Menü das Mikrofon ausmacht, um eine nicht gewünschte Spracheingabe Eurerseits zu vermeiden. Ich selber habe das Tool anfangs genutzt, war mit meiner KI-Audiodiskussion fertig und habe mich einer anderen Aufgabe zugewandt, wo etwas nicht ganz geklappt hat und ich laut vor mir her dachte “Wieso geht denn das nicht”. ChatGPT hatte dann unmittelbar geantwortet “Das kann ich Ihnen leider auch nicht sagen. Ich benötige dafür mehr Informationen”. Dies kam auf jeden Fall überraschend für mich, aber zeigte mir dann auch direkt wie solch ein KI-Helferlein, dass zu 100 % funktionsfähig ist, mir doch bei meinen Arbeiten helfen könnte, indem man es spontan anspricht und Support einholt. Also Mikrofon aus, damit keine sensiblen Gespräche zu OpenAI in die USA transferiert werden! Dies wird schnell vergessen!

talk to
Ausdio ausschalten, um keine wichtigen Gespräche an ChatGPT zu vermitteln!

Neben den Chatbots ChatGPT-3.5/-4 lassen sich auch Plugins wie Wolfram, Link Reader oder Klarna und vor allem der Webbrowser verwenden. Es ist schon sehr einfach per Spracheingabe die gestrigen Ergebnisse aus der Welt des Sports, Börse oder eben Außenpolitik einzuholen, ohne dabei am Bildschirm zu sitzen. Diese Kombination, also von ChatGPT-Browserplugin und Talk-to-ChatGPT finde ich persönlich schon sehr sinnvoll und auch zeitsparend. Ein morgendliches Routine-Navigieren durch diverse Webseiten/Apps entfällt.

talk to
Ereignisse zu drei völlig verschiednenen Themenbereichen kurz zusammengefasst

Der obige Screenshot zeigt, wie per Audioeingabe Infos zu drei komplett verschiedenen Themenbereichen erfragt und vom Browsing-Plugin per Audioausgabe kurz zusammengefasst wurden. Ein umständliches Aufrufen von mindestens drei Webseiten würde hierbei entfallen.

Talk-to-ChatGPT inklusiv nutzen

Unglaublich spannend ist bei dieser Thematik der inklusive Bereich, insbesondere für Personen mit Sehbeeinträchtigungen, die auf Hilfsmittel angewiesen sind und sehr gerne am Boom der Sprach-KIs partizipieren möchten. Hier ergeben sich sehr viele Chancen. Natürlich alles vor dem Hintergrund, dass die aktuellen Anwendungen aus der Beta-Phase herauswachsen und zu sehr zuverlässig bedienbar sind! Mit solchen Erweiterungen ließen sich Künstliche Intelligenzen komplett per Audio steuern, was wiederum erhebliche Barrieren unter anderem auch im Bildungsbereich abbauen könnte.

Fazit

Die Beta-Phase von Talk-to-KI ist definitiv eingeläutet und es werden sich in Zukunft diverse Anbieter auf diesem Markt tummeln, wobei die große Konkurrenz insbesondere der US-Techkonzerne zu einer hohen Qualität solche Programme führen wird. Nur wenn diese Anwendungen auch zuverlässig laufen, ohne einen Gesprächsabbruch oder eine “Vergesslichkeit” oder fehlerhafte Ausgaben werden sie für eine höhere Arbeitseffizienz sorgen und das Leben des einen oder anderen Menschen erheblich erleichtern. Aktuell sind noch Pannen im System, wie dies auch insgesamt bei OpenAI und den Produkten GPT-x und ChatGPT-Plugins der Fall ist. 

 
Es lohnt sich auf jeden Fall in diesem Bereich am Ball zu bleiben, um die Nützlichkeit dieser Tools für sich verwenden zu können. Also, ich bin gespannt 👍
 
autor Matthias Kindt

Ähnliche Beiträge