Universalübersetzer: Wie weit ist der “Babelfisch” noch entfernt?

Spiegel Online hat neulich (18.02.204) einen Beitrag zur KI-gestützten Kommunikation veröffentlicht, in dem es um eine Kommunikation “ohne Hemmnisse” ginge und dass die Welt in diesem Bereich vor einer “Revolution” steht. Im Rahmen solcher Entwicklungen wird gerne der “Babelfisch” als Beispiel angeführt, der über den Roman “Per Anhalter durch die Galaxie” und darauf basierenden Verfilmungen als “Universal Translator” weltweit Bekanntheit erlangte.

Der Babelfisch (englisch Babel Fish) ist ein fiktives Lebewesen aus dem Roman Per Anhalter durch die Galaxis von Douglas Adams, das inzwischen zu einem bekannten Symbol für maschinenbasierte Übersetzungssysteme geworden ist. Der Internet-Übersetzungsdienst Babel Fish benannte sich nach dem Vorbild aus Adams’ Roman. Der Babelfisch wird in dem Roman als kleine Kreatur beschrieben, die sich ins Ohr einführen lässt und dem Träger ein Verständnis aller gesprochenen Sprachen ermöglicht.

Quelle: Wikipedia

So lautet die Definition des fiktiven Tierchens, das eine universelle Übersetzung in Echtzeit ermöglicht. Eine Sprache wie etwa Englisch als “Mittler”, auf die man sich etwa als Weltsprache einigt und auf dieser Grundlage verständlich macht, wodurch Menschen aus allen Regionen der Welt potenziell miteinander kommunizieren könnten, würde demnach entfallen bzw. wäre nicht mehr notwendig. Ließe sich dieses Konzept auf heutige Technologien übertragen, auf der Basis von künstlicher Intelligenz? Ist das überhaupt schon möglich oder (noch) reine Fantasie?

babelfisch

Potenzielle Funktionen einer KI-Anwendung im “Babelfisch-Stil”

Folgende Übersicht spekuliert bezüglich geeigneter Funktionen solch einer “Babelfisch-Anwendung”. Neben der Echtzeit-Übersetzung würde es wohl noch weitere Features geben, die User im Rahmen ihrer Kommunikation untereinander nutzen könnten.

  • Erkennung der von einer Person gesprochenen Sprache
  • Automatische Übersetzung der erkannten Sprache
  • Ausgabe (Audio) dieser Übersetzung in einer vorab ausgewählten Sprache
  • Aufzeichnung der Konversation bzw. Speichern dieser etwa in der Cloud. “Babelfisch” hat also Internet-Zugang
  • Zusammenfassung von Gesprächen etwa mittels Künstlichen Intelligenzen wie ChatGPT
  • Übersetzung gespeicherter Konversationen auch in weitere Sprachen mittels KI-Anwendung möglich
  • Nachbearbeitung von Konversationen. Stimmanpassungen, Einfügen von Audio oder Geräuschen

Das Smartphone als Hardware würde hierbei wohl eine zentrale Rolle spielen, da fast jeder Erdenbürger eines besitzt und so fix eine App abrufen könnte, um per Audioinput und -output zu kommunizieren. Bei einer schlanken Open-Source-Variante wäre eine Installation des Tools lokal auf dem Endgerät und so eine Bedienung ohne einen stabilen Internetzugang möglich, der leider in einigen Ländern noch nicht Standard ist.

translator

Seamless Streaming mit Echtzeitübersetzung

Das US-Unternehmen Meta hat mit seiner Anwendung Seamless Streaming schon gezeigt, was aktuell hinsichtlich einer Übersetzung in Echtzeit möglich ist. Bei diesem Tool wird vorab eine Sprache, wie in dem gezeigten Video Englisch festgelegt. Beide Gesprächspartner kommunizieren in ihrer Muttersprache, in diesem Fall Spanisch und Französisch, und die Anwendung Seamless Streaming übersetzt diese automatisch mit kurzer Verzögerung ins Englisch, das wiederum beide Personen verstehen. Der nächste Schritt in Richtung Babelfisch wäre die Echtzeit-Übersetzung ohne Englisch, in diesem Fall direkt ins Spanische & Französische.

 

Fazit: Deskilling oder Upskilling?

Weltweit arbeiten Menschen an Hochschulen und anderen Forschungseinrichtungen und natürlich auch in Unternehmen daran, die bereits existierenden Babelfisch-Maschinen immer besser zu machen. Quelle: Spiegel Online

Natürlich kann ich mir an dieser Stelle nur eine Meinung hinsichtlich veröffentlichter Anwendungen wie Seamless Streaming bilden, da ich kein Mitarbeiter in einem der “Top AI Labs” im Silicon Valley von Meta, Microsoft & Co bin. Aber ich kann mir gut vorstellen, dass die Technologie insgesamt noch weiter entwickelt ist, als dies öffentlich z.B. via Open-Source-Tools zur Schau gestellt wird. Aus meiner Sicht ist es eine Frage der Zeit, bis wir etwa mittels Knopf im Ohr, integriert in eine Brille oder in einem Headset in Echtzeit, ohne große Latenz sprachübergreifend und ohne eine gemeinsame Sprachgrundlage wie Englisch fließend kommunizieren können. Wann? Das kann wohl keiner genau prognostizieren. Dies ist abhängig davon, wie der Stand der Technologie ist, wie einfach man diese bedienen kann und ganz wichtig, wie hoch die Anschaffungskosten sind, um dieses auch nachhaltig im Mainstream zu etablieren. Eine Frage bleibt: Müssen wir in entfernter Zukunft überhaupt noch Sprachen lernen bzw. macht dies im Rahmen solcher technologischen Möglichkeiten überhaupt noch Sinn?`Deskilling oder Upskilling? 😉

 

“BBC Babel Fish” on YouTube 🙂

 

Autor des Beitrags vorgestellt von

Ähnliche Beiträge