Wie lassen sich Bilder-KIs sinnvoll verwenden? Einige Beispiele im Überblick

KI-Bildgeneratoren (kurz: Bilder-KIs) wie Midjourney, DALL-E3 oder Stable Diffusion sind mit die beliebtesten Tools im Rahmen von Anwendungen auf der Grundlage von künstlicher Intelligenz. Doch wie lassen sich diese Programme sinnvoll etwa auch in Lehre und Unterricht einsetzen?

Bild über DALL-E3 erstellt & Animation über D-ID

Anwendungsbeispiele von Bilder-KIs

1) KI-Bilder lassen sich sehr gut für eigene Blogbeiträge z.B. als Beitragsbild oder zwischen den Texten verwenden. Auch für Social Media Aktivitäten eignen sich die Images ganz hervorragend, um mit Top-Bildern womöglich den einen oder anderen Follower mehr zu bekommen.

2) Animationen über Video-KIs (nach Bild-Upload) etwa mit Pika oder Runway. Die Images lassen sich dann per Textprompt “zum Leben erwecken” Auch eine gezielte Animation wie etwa bei Runway über das Feature “Multi-Brush” ist möglich. Videos sind im Anschluss als MP4 frei verfügbar.

3) Animation von KI-Avataren (nach Bild-Upload) etwa mit D-ID oder HeyGen. Vorab etwa über Stable Diffusion ein Image erstellen und dies dann auf die Webseite eines KI-Tools hochladen. Dort dann die Sprache, Stimme und den Text auswählen und den großen Button “Generate” drücken. Und schon wurde ein simples KI-Bild zu einem KI-Avatar animiert. Bilder lassen sich zusätzlich auch innerhalb der Avatar-Tools erstellen.

screen
Screenshot aus der Anwendung D-ID

4) Für “kleine Bildchen” innerhalb von Grafiken. Häufig werden Grafiken zu diversen Themen selber gebastelt und nicht selten mit schicken Icons versehen, die etwas ausdrücken sollen, wie zum Beispiel einen kleinen Chart. Dies geht auch über Bildgeneratoren wie DALL-E3, in dem man vorab im Prompt einfach die Bezeichnung “Icon-Stil” mit eingibt.

5) Zur bildlichen Darstellung von (KI-)Thematiken. Beispiel: Person balanciert auf einem Seil, mit Text “Deskllling” (unterhalb) & “Upskilling” (oberhalb). Zusätzlich ist noch die Bezeichnung “AI” im Bild sichtbar. Können nicht alle Textteile von der künstlichen Intelligenz generiert werden, so lassen sich etwa über Canva oder Power fehlender Text ergänzen.

6) Bild-Upload etwa in DALL-E3 und Ausgabe von ähnlichen Bildern auf genau dieser Grundlage. Es kommt durchaus vor, dass man ein tolles Bild erstellt hat und dieses ohne nochmalige Prompt-Versuche in einem abgeänderten Stil nutzen möchte. Dazu die Upload-Funktion einer Bilder-KI verwenden, falls diese wie bei DALL-E3 vorhanden ist. Dann noch einen Prompt wie “Erstelle ein ähnliches Bild setzen”. Und Button drücken 😉

7) Erzählen ganzer (futuristischer) Bilderstorys etwa über DALL-E zusammen mit ChatGPT-4. Im unteren Screenshot ist eine Kurzgeschichte zu sehen, die Technikerinnen zeigt, die an einem wasserstoffbetriebenen Auto arbeiten. Werdet ruhig genau im Prompt. es lassen sich auch mehr Bilder und eine umfangreiche Story erzählen. Dies lässt sich über ChatGPT-4 durchführen, das als “Super-Model” fungiert und in dem ebenfalls in einem Chatverlauf die Bilder-KI DALL-E3 mit integriert ist. Gerne im Anschluss per “Copy & Paste” als Blogbeitrag verwenden.

dalle3
Screenshot aus dem “Super-Model” ChatGPT-4 mit DALL-E3 integriert

 

8) Allgemein zum Testen von Stilrichtungen wie “Futurismaus”, “Kubismus”, “Origami” oder “Neon Punk”. Das untere Image wurde im Stile des “Futurismus” erstellt, welcher aus dem Jahr 1909 stammt und in Italien entwickelt wurde. Wir sehen hier klar, wie das “Alte” auf die “Moderne” trifft, in dem in eine ältere Stilrichtung ein sportlicher Katamaran integriert wurde und so eine Art “Kreuzung” entsteht. Sehr cool! Ich persönlich hätte nie gedacht, dass ich mich fernab der Schule mal freiwillig mit Kunst-Stilrichtungen auseinandersetzen würde, aber wir leben scheinbar wirklich in (sehr) “wilden Zeiten”! Für mich definitiv ein “Upskilling” und es ist auch nicht ausgeschlossen, mich womöglich auf der nächsten Vernisage anzutreffen. Das untere Bild bringe ich dann auf jeden Fall mit (Selfmade) 😉

futurismus
Stilrichtung Futurismus aus dem Jahr 1909 (Italien) mit modernen Elementen kombiniert

9) Bildanpassung (nach Upload: Bildgeneratoren wie Stable Diffusion über Clipdrop oder Midjourney und Leonardo bieten auch die Möglichkeit, eigene Bilder, die ganz klassisch per Kamera aufgenommen wurden, divers anzupassen. Veränderungen innerhalb (Inpainting) des Bildes und Erweiterung außerhalb (Outpainting) sowie Neubelichtung oder auch Cleanup von Fehlern und Upscaling (höhere Auflösung) sind z.B. über die Clipdrop-Tools (z.T. auch kostenlos) durchführbar

10) Echzeit.Prompting: Mit Tools wie Stable Diffusion XL Turbo oder Krea.ai lassen sich Bilder auch live erzeugen, in dem unmittelbar nach der Texteingabe und ohne Button-Klick, direkt eine Vorschau des Images angezeigt wird. So ließe sich z.B. auch ein Kurzfilm draus machen. Einfach per Screencast-Tool die gesamte Bildstrecke in Echtzeit als Video (MP4) aufnehmen.

11) Faktor Begeisterung: Insgesamt haben hochwertige und aussagekräftige Bilder das Potenzial, etwa im Rahmen einer Präsentation alle Beteiligten zu begeistern. Dadurch steigt dann die Aufmerksamkeit insgesamt im Rahmen solch einer Veranstaltung. Zudem sind Bilder-KIs ein toller Einstieg in den Bereich der künstlichen Intelligenz und der Vielzahl an KI-Anwendungen. Bilder-KIs sind zusätzlich recht einfach zu bedienen und generieren im Verhältnis dazu super Output.

 

Fazit

Aus meiner Sicht ist der Umgang mit KI-Bildgeneratoren von großer Bedeutung, da ein Bild potenziell der Ursprung von so vielen kreativen Prozessen sein könnte. Die Nutzung solcher Tools ist zudem recht einfach und bietet einen hervorragenden Einstieg in die Welt der KI-Anwendungen.

 

Autor des Beitrags vorgestellt von einer KI-Avatarin (Bild vorab generiert über Ideogram.ai)

 

 

Ähnliche Beiträge