Voxtral 2: Transkriptionstool von Mistral im AI Studio testen
Ein Audio wie einen Podcast mit einem Tool automatisch in Text umwandeln, dies nennt sich Transkription. Mistral hat mit Voxtral Transcribe 2 nun eine neue Version an den Start gebracht, die in zwei AusfĂŒhrungen auf Top-Niveau transkribiert. Dies lĂ€sst sich gut kostenlos im AI Studio testen, da Usern monatlich ein freies Kontingent an API-Anfragen zur VerfĂŒgung steht.Â
Der obere Screenshot zeigt das Modell Voxtral-Mini auf Hugging Face, wo Mistral dies allen Nutzern frei zugĂ€nglich macht, wie so einige weitere Modelle. Unten ist die OberflĂ€che des Audio-Tools ElevenLabs dargestellt, denn das zu transkribierende Audio lasse ich im Vorfeld kostenfrei ĂŒber die Creative Platform generieren. ElevenLabs bietet allen Usern jeden Monat eine bestimmte Anzahl an Credits an, die man zum Beispiel ĂŒber Text-2-Speech nutzen kann. Der Input ist eine Ăbersetzung aus dem Mistral-Blogbeitrag mit kleinen Anpassungen.Â
Nun loggt man sich in das AI Studio von Mistral ein und auf der linken Seite befindet sich der Punkt âAudio“. Dort klicken und im Anschluss dann auf âSpracherkennung“. Nun lassen sich Audios hochladen oder direkt im AI Studio erstellen und zudem können diverse Settings gesetzt werden.
Bei einem Klick rechts unten auf die drei Striche mit der Bezeichnung âModelleinstellungenâ lĂ€sst sich unter anderem das Modell wechseln und eine Diarisierung aktivieren und deaktivieren. Mit diesem Feature erkennt Voxtral unterschiedliche Sprecher im Audio und gibt diese dann auch so geordnet in Textform aus. So kann man z.B. Dialogen besser folgen.
Ich hab alle Einstellungen im AI Studio so gelassen und direkt meinen Download aus dem Browser in das AI Studio rĂŒbergezogen. Nun startet sofort die Ăbertragung in Textform. Das klappt sehr schnell und wird ĂŒbersichtlich prĂ€sentiert, unterteilt in unterschiedliche Abschnitte, die man direkt im AI Studio jederzeit wieder abspielen kann.Â
Nun wird der Output mit dem vorigen Input via ElevenLabs ĂŒberprĂŒft und er stimmt zu 100 %, wenn ich dies so korrekt ĂŒberblickt habe. Rechts oben befindet sich der orangene Button âHerunterladen“ und genau diesen klicke ich mit der Format-Auswahl âTXT“ an. Das transkribierte Audio wird nun in Textform in einer simplen Textdatei heruntergeladen, die ich dann gezielt bearbeiten oder direkt weiterleiten kann. Das wĂ€re der Standard-Workflow in Mistral’s AI Studio.
Mistral hat Voxtral 2 auch offiziell ĂŒber ein YouTube-Video vorgestellt und genau dieses ist unten ĂŒber einen Screenshot direkt verlinkt. Es lohnt sich generell, das AI Studio mit der Möglichkeit einer kostenlosen Transkription zu testen und ganz allgemein das Angebot des französischen Startups Mistral weiter auf dem Schirm zu haben. Dort entwickelt man step by step und sehr unaufgeregt neue Features. Viel SpaĂ!
Â









