LTX Studio: All-in-One-Lösung für zeiteffizientes KI-Storytelling

LTX Studio ist eine All-in-One-Lösung rund um das beliebte KI-Storytelling, also der Darstellung einer Geschichte mit unterschiedlichen Formaten wie Text und Bildern, die von einer künstlichen Intelligenz “erzählt” wurden. Bislang waren User auf eine Kombination diverser Tools wie zum Beispiel ChatGPT (Text) + Midjourney (Bild) + Runway (Video) angewiesen, um alle Formate abzudecken. Dies ändert sich nun mit nur einem Login und spart Zeit.

ltx
Zu Beginn nur eine Idee oder auch einen ganzen Text als Prompt setzen

User können nach der Anmeldung bei LTX Studio über ein Google-Konto zwischen einer kurzen Idee-Eingabe oder einem kompletten Text als fertiges Skript, u.a. als File-Upload, auswählen. Auch Importe über die Anwendung Scratch sind möglich. Die in diesem Beitrag skizzierte Story, die kostenlos ausgegeben wurde, begann mit dem simplen Prompt:

***two female researchers doing research in a laboratory***
 
ltx
Nach der Eingabe eines Prompts werden automatisch die Szenen generiert
Nach nur kurzer Zeit sind dann auch schon alle Szenen mit Bildern in einzelnen Spalten ausgegeben. Oben ist ein Screenshot der ersten Szene und unten der 8. und letzten Szene dargestellt. Ich habe nur diesen Versuch mit diesem einem Prompt durchgeführt und finde die Ergebnisse schon recht gut, insbesondere hinsichtlich der Bilder, die kaum Imperfektionen aufweisen und die innerhalb einer Geschichte stets als zentrale Elemente anzusehen sind.
 
Die letzte Szene 8 ist hier dargestellt

Vielfältige Funktionen für ein umfangreiches KI-Storytelling

In den einzelnen Szenen wird nun eine Geschichte von zwei Forscherinnen erzählt, die an einem neuen Medikament arbeiten, aber so genau möchte ich gar nicht auf den Inhalt eingehen, sondern eher auf die Funktionen der Anwendung LTX Studio.

Folgende Formate gibt die Anwendung aus:

1) Text
2) Bilder
3) Audio
4) Video

In jeder Szene können Nutzer verschiedene Einstellungen tätigen, wie etwa die Beschreibung dieser, auch hinsichtlich Wetter und dem Einfügen von Text für die Sprachausgabe der Figuren und ebenfalls das Einfügen von Text für Soundeffekte, die sich dann direkt abspielen lassen. Übrigens lassen sich ganze Spalten auch duplizieren. Gerne mal genauer bei LTX Studio umsehen, denn auch diese Anwendung befindet sich noch in der Beta-Phase und erweitert regelmäßig ihre Features und bindet diese etwa per API über externe Tools ein. 

Auswahl einzelner Szenen, um etwa aus dem Bild ein ein Video zu erstellen

Bilder animieren lassen und “character motion”

Der obere Screenshot zeigt, wie ein Bild ausgewählt wurde, um dies nun im Rahmen eines kurzen Videos mit wenigen Sekunden zu animieren. In der linken Sidebar können dazu die Einstellungen getätigt werden. Hat man sich entschieden, werden 4 Beispielvideos erzeugt, die Nutzer nun für ihre KI-Story verwenden können. Diese Prozesse habe ich komplett kostenfrei generiert. Der Output ist recht gut bzw. keines der Videos verzieht stark oder ist komplett unbrauchbar. In der unteren Abbildung sind die Videos dargestellt, in einem gesplitteten Bildschirm.

ltx
Erstellung von 4 Beispielvideos, aus denen nun eines ausgewählt werden kann

LTX Studio bietet zudem die Funktion “character motion” an, um einzelne Darsteller hinsichtlich emotionalem Verhalten und lippensynchronem Sprechen zu animieren. Dieses Feature kennt man von Avatar-Tools wie Synthesia. und macht die Story dann recht persönlich. wie ich finde.

ltx
Mit der Funktion “character motion” lasssen sich die Hauptakteure bezüglich Emotionen und lippensynchronen Dialogen animieren

Fazit

Schlussendlich wird es wohl aus meiner Sicht auf All-in-one-Lösungen wie LTX Studio hinauslaufen, sodass User nur einen Login benötigen und innerhalb ihrer Geschichte alle brauchbaren Formate wie Bilder, Videos und auch Avatare generieren können und das auf einem Top-Niveau. Dadurch ist es viel einfacher auch für den Durchschnitts-Nutzer solche Storys auf der Grundlage von künstlicher Intelligenz zu erzeugen, anstatt diese eher mühsam über diverse Logins und auch Credits auf mehrere Tools zu verteilen. Die Einfachheit wird sich da wohl durchsetzen, unter der Voraussetzung, dass auch Top-Anwendungen via API verfügbar sind, um dann Top-Output zu generieren. Als Beispiel kann hier etwa die angesagte Bilder-KI Flux verwendet werden, dessen Top-Modell Flux [Pro] über eine API eingebunden werden kann.

Offizielles Video von LTX Studio

Ein Beitrag erstellt von

Ähnliche Beiträge