Video-KI: Wesentliche Funktionen (Grafik)

Die folgende Abbildung zeigt die wesentlichen Features von Video-KIs wie Pika, Runway oder OpenAIs Neuveröffentlichung Sora, mit denen etwa per Textprompt Videos erzeugen lassen. Die Grafik ist unter der Lizenz CC BY 4.0 International frei verwendbar.

Der weiterführende Text bzw. die Beschreibung mit Beispielen stammt von ChatGPT-4, nachdem die Grafik über die Upload-Funktion hochgeladen und im Anschluss mit folgendem Prompt versehen wurde:

Prompt

schreibe zu den funktionen einen umfassenden bericht mit aufzählungen und überschriften und gib auch jeweils beispiele an

 

Start Output ChatGPT-4

Video-KI-Technologien revolutionieren die Art und Weise, wie wir mit audiovisuellem Material arbeiten. Hier ist ein umfassender Bericht über die auf der Grafik genannten Funktionen.

1. Text to Video

Beschreibung: Diese Funktion ermöglicht es, aus geschriebenem Text automatisch ein Video zu erstellen. Die KI analysiert den Text und generiert entsprechende visuelle Inhalte und Szenen.

Beispiel: Ein Nutzer gibt den Text “Ein Hund spielt im Park” ein. Die KI erstellt ein Video, das einen Hund zeigt, der in einem sonnigen Park fröhlich herumtollt.

 

2. Image to Video

Beschreibung: Diese Funktion nimmt ein statisches Bild und animiert es auf Grundlage eines Prompts zu einem Video.

Beispiel: Ein Bild einer Landschaft wird in ein Video umgewandelt, in dem man die Sonne auf- oder untergehen sieht und Vögel am Himmel fliegen.

Screenshot aus ChatGPT

 

3. Expand Video

Beschreibung: Mit Expand Video kann ein vorhandenes Videoformat, beispielsweise Quadrat (1:1), zu einem breiteren Format wie Breitbild (16:9) geändert werden, ohne dass dabei wichtige Inhalte verloren gehen.

Beispiel: Ein Instagram-Video im Quadratformat wird in ein Format umgewandelt, das für YouTube geeignet ist, wobei die KI sinnvoll Raum füllt oder beschneidet, um das neue Seitenverhältnis zu erreichen.

 

4. Modify Video

Beschreibung: Diese Funktion ermöglicht das Hinzufügen oder Austauschen von Elementen innerhalb eines Videos. Benutzer können bestimmte Bereiche markieren, die dann von der KI bearbeitet werden.

Beispiel: Ein Unternehmenslogo in der Ecke eines Videos wird durch ein aktualisiertes Logo ersetzt.

 

Fazit (ChatGPT-4)

Diese fortschrittlichen KI-Funktionen bieten enorme Möglichkeiten für Content-Ersteller, Werbeagenturen und Medienunternehmen, um schnell und kosteneffizient hochwertige Videoinhalte zu erstellen. Mit der kontinuierlichen Verbesserung der KI-Technologien wird dieser Bereich sicherlich weiter wachsen und sich entwickeln.

Ende Outout ChatGPT-4

 

Eigenes Fazit

Die Entwicklung bei KI-Tools mit Fokus auf die Erstellung von Videos per Text oder Bild ist rasant und wird wohl durch die Veröffentlichung von OpenAIs Top-Anwendung Sora noch verstärkt. Es lohnt sich definitiv, mit den einzelnen Features der jeweiligen Video-KIs auseinanderzusetzen bzw. diese auch einfach mal zu testen. KI-Videos ließen sich vielfältig in Lehre und Unterricht einsetzen, um u.a. den Lernenden zu demonstrieren, was denn nun mit KI alles so möglich sei. Insbesondere der Einsatz von synthetischen Daten als Grundlage für das Training von Video-KI-Modellen kann eine ganz eigene Dynamik annehmen und den Prozess hin zu fehlerfreien Anwendungen beschleunigen.

 

Release-Video von OpenAI zu Sora (Best of)

 

Erklärvideo zu Sora von den “Digitalen Profis”

Die Video-KI Sora ist noch nicht für alle User frei zugänglich, sondern steht ausschließlich ausgewählten Nutzern zur Verfügung. Schlussendlich lässt sich erst ein Urteil über die Qualität dieser Video-KI fällen, wenn diese auch getestet wurde. Ein wenig Geduld müssen wir da noch haben 😉

Ähnliche Beiträge