DeepL Voice: Sprachen in Echtzeit in Text übersetzen lassen
Das in Köln ansässige Top-Startup DeepL ermöglicht nun eine Live-Übersetzung in Videokonferenzen einer Sprache in eine weitere Sprache in Form von Untertiteln. Auch für Smartphones gibt es eine Lösung. Dieser neue Service nennt sich DeepL Voice. Bei solchen Anwendungen steht immer die Frage im Raum: “Wann kommt denn nun der Babelfisch?”
Live-Übersetzung ohne Latenz (Verzögerung)
1) DeepL Voice für Meetings beseitigt Sprachbarrieren bei internen und externen virtuellen Meetings. Alle Teilnehmenden können in ihrer bevorzugten Sprache sprechen. Alle anderen können das Gesagte in ihrer eigenen Sprache dank der als Untertitel angezeigten Übersetzungen mitlesen und sich dann in ihrer eigenen Sprache beteiligen.
2) DeepL Voice für Gespräche steht auf mobilen Geräten zur Verfügung und dient dazu, mehrsprachige persönliche Gespräche unter vier Augen zu ermöglichen. Mitarbeitende können mit Kunden, Kollegen oder anderen Gesprächspartnern so einfach und direkt in der jeweils bevorzugten Sprache kommunizieren.
Fazit
Hinsichtlich der Entwicklungen von Echtzeit-Übersetzungen auf der Grundlage von künstlicher Intelligenz im Rahmen von geeigneten Anwendungen wie DeepL Voice oder auch Seamless Streaming von Meta scheint es wohl eine Frage der Zeit zu sein, bis wir den im Roman “Per Anhalter durch die Galaxis von Douglas Adams” beschriebenen Babelfisch erreichen, der als Synonym für eine bestmögliche und sehr einfache Übersetzung ohne Latenz beschrieben werden kann. Mithilfe dieses Fabeltiers können zwei Personen in unterschiedlichen Sprachen direkt kommunizieren und die Übersetzung übernimmt das kleine Tierchen im Ohr des jeweiligen Gesprächspartners. Aktuell ist die Übersetzung noch auf “Voice2Text” beschränkt, aber potenziell ließe sich der Text natürlich auch direkt mit einer KI-generierten Stimme vorlesen. Dies könnte man dann als “Voice2Audio” oder gerne auch “Voice2Voice” bezeichnen. Passende Audio-Tools wie ElevenLabs sind in diesem Bereich zu erwähnen.
Es ist natürlich mehr als sinnvoll, solche Anwendungen vor allem auch mit Blick auf einen dauerhaften Einsatz im Bildungsbereich auf dem Schirm zu haben, nicht nur, da in unseren westlichen Gesellschaften wie insbesondere Deutschland immer mehr Schülerinnen und Schüler die offizielle Amtssprache schlecht oder eher nicht so gut sprechen. Eine simultane Übersetzung könnte da unmittelbar als Verständigungshilfe eingesetzt werden. Ein Übersetzer in Form eines Menschen, der nicht selten je nach Sprache schwierig zu finden ist und auch eine Rechnung stellt, wäre somit nicht mehr zwingend notwendig, da die Technik solch eine Tätigkeit übernehmen könnte, zumindest vorübergehend, aber wohl auch langfristig. Dies müsse im Rahmen von Forschungsprojekten getestet werden. DeepL ist im Bereich der Übersetzungen Marktführer und daher besonders zu beachten, auch wenn wie beim Konkurrenten Google nicht alle Sprachen abgedeckt werden.