Kreativer Workflow: Eine wissenschaftliche Bilderstory fehlerfrei in ein beschreibendes PDF übertragen (Teil 1)
✅ Freie Nutzung von Text & Abbildungen & Prompts & PDF für Premium-User
Seit der Einführung von ChatGPT Images 2.0 bieten sich immer mehr Möglichkeiten, komplexe Gestaltungsprozesse auf der Grundlage einer Bild-KI auszuführen. Die korrekte Darstellung von (deutschen) Texten und eine zuverlässige Übertragung der Abbildungen in Formate wie ein PDF sind hierbei von zentraler Bedeutung.
Use Case: Erstellung einer naturwissenschaftlichen Bilderstory im Comic-Stil. Und so kann der Workflow aussehen:
- Bilderstory über ChatGPT Images 2.0 im Thinking-Modus mit detailliertem Prompt erstellen
- Anschließend einen Prompt von ChatGPT formulieren lassen, um aus der Bilderstory ein geeignetes PDF zu generieren
- PDF herunterladen und auf Fehler kontrollieren. Das PDF wieder hochladen und ChatGPT soll nun selber die Fehler erkennen und einen verbesserten Prompt ausgeben
- Den verfeinerten Prompt direkt im Chat ausführen lassen und ein weiteres PDF erstellen
- Verbessertes PDF wird im Chat bereitgestellt und kann wieder heruntergeladen werden
Der obere Screenshot zeigt sechs generierten Abbildungen, die in einer Reihenfolge in 9 Minuten und 43 Sekunden generiert wurden. Wichtig ist immer, den Thinking-Modus zu aktivieren, denn sonst klappt es nicht mit der Ausgabe einer ganzen Reihe von Abbildungen mit konsistenten Charakteren.
Für diesen Use-Case tüfteln zwei Wissenschaftlerinnen an einem sehr futuristischen Luftmotor, der die Umgebung von Schadstoffen reinigen soll und gleichzeitig davon angetrieben wird. Dies mag zu diesem Zeitpunkt „etwas“ ambitioniert wirken, aber es ist gar nicht so verkehrt, mögliche Zukunftsvisionen zu skizzieren und dies mithilfe von KI-Anwendungen.
Detaillierter Prompt zur Bilderstellung (Thinking-Modus)
Erstelle eine 6-teilige, spannende Bildergeschichte im modernen Comic-Stil im Hochformat 3:4.
Die Geschichte handelt von zwei Wissenschaftlerinnen mit Brille, die einen futuristischen Motor entwickeln, der vollständig mit Luft betrieben wird. Gleichzeitig filtert der Motor schädliche Partikel, Feinstaub, Ruß, Pollen und Schadstoffe aus der Luft und macht dadurch die Umwelt sauberer.
Gesamter Stil:
Ein hochwertiger, detailreicher europäischer Graphic-Novel-/Comic-Stil mit klarer Linienführung, ausdrucksstarken Gesichtern, dynamischem Licht, kräftigen, aber realistischen Farben, filmischen Bildkompositionen, gut lesbaren deutschen Sprechblasen, Titelkästen, technischen Details und einer hoffnungsvollen Science-Adventure-Stimmung. Jede Szene soll wie ein Panel derselben Comic-Serie wirken.
Wichtige Figuren-Kontinuität:
Die gleichen zwei Wissenschaftlerinnen erscheinen in allen sechs Bildern.
Wissenschaftlerin 1: Dr. Lena.
Sie hat schulterlanges, lockiges dunkelbraunes Haar, eine runde Brille, einen blauen Laborkittel über einem gelben Shirt und wirkt neugierig, energiegeladen und erfinderisch. Sie ist emotional, mutig und arbeitet gerne direkt an der Maschine.
Wissenschaftlerin 2: Dr. Mira.
Sie hat rote Haare zu einem Pferdeschwanz gebunden, eine rechteckige Brille, einen grünen Laborkittel über einer weißen Bluse und wirkt konzentriert, analytisch und lösungsorientiert. Sie bleibt auch unter Druck ruhig und denkt schnell.
Beide Figuren müssen in allen sechs Bildern klar wiedererkennbar und visuell konsistent bleiben.
Sehr wichtige Bildkomposition:
Alle sechs Szenen sollen deutlich unterschiedlich dargestellt werden. Die Wissenschaftlerinnen sollen nicht immer nur vor dem Motor stehen und ihn anschauen. Variiere Kameraperspektiven, Bildausschnitte, Posen, Lichtstimmungen, Emotionen, Orte und Aktionen. Nutze Nahaufnahmen, Totale, Seitenansichten, Über-die-Schulter-Perspektiven, dramatische Untersichten, Laboraufnahmen, Außenaufnahmen, Testfahrten und Präsentationsszenen.
Der Motor soll in verschiedenen Entwicklungsstufen gezeigt werden:
als Skizze, als erster Prototyp, als fehlerhafte Maschine, als verbesserte Lösung, als mobiler Testaufbau und als fertige Erfindung bei einer öffentlichen Präsentation.
Design des Motors:
Der luftbetriebene Motor ist eine futuristische, kompakte Maschine mit metallischen Turbinen, transparenten Röhren, blau leuchtendem Luftstrom, grünen Öko-Anzeigen, einem sichtbaren zylindrischen Filtergehäuse, mehreren Filterschichten sowie Einlass- und Auslassrohren.
Verschmutzte Luft tritt auf einer Seite ein, sichtbar mit grauen Schwaden und dunklen Partikeln. Saubere Luft tritt auf der anderen Seite aus, dargestellt durch helle blaue Luftströme, kleine Blätter und eine frische Atmosphäre. Die Maschine soll glaubwürdig, technisch detailliert, modern und visuell spannend wirken.
Textgestaltung:
Verwende deutsche Texte in Sprechblasen und Titelkästen. Alle Texte sollen groß, sauber, korrekt geschrieben und gut lesbar sein. Die Sprechblasen sollen natürlich und comicartig wirken. Jedes Panel braucht einen klaren Titelkasten.
Bild 1 – Die Idee
Titelkasten: „Teil 1: Die Idee“
Szene:
In einem lebendigen Erfinderlabor stehen Dr. Lena und Dr. Mira an einem Arbeitstisch voller Blaupausen, Notizbücher, Werkzeuge und erster Skizzen. Der Motor existiert hier noch hauptsächlich als Konzept: Zeichnungen, kleine Bauteile und ein unfertiger Mini-Prototyp sind zu sehen. Die Stimmung ist neugierig, kreativ und aufregend.
Bildkomposition:
Halbtotale leicht von oben, damit der Tisch mit Plänen und Ideen gut sichtbar ist.
Sprechblase Dr. Lena:
„Wenn wir einen Motor nur mit Luft antreiben könnten...“
Sprechblase Dr. Mira:
„...und dabei schädliche Partikel aus der Luft filtern!“
Bild 2 – Der erste Prototyp
Titelkasten: „Teil 2: Der erste Prototyp“
Szene:
Nachts im Labor bauen und testen die beiden Wissenschaftlerinnen den ersten funktionierenden Prototyp. Eine zieht eine Schraube oder ein Ventil fest, die andere prüft Messwerte auf einem Bildschirm. Verschmutzte Luft wird in die Maschine gezogen, und erste dunkle Partikel sammeln sich sichtbar im transparenten Filter.
Bildkomposition:
Dynamische Seitenperspektive mit Werkzeugen, Funken, Monitoren und leuchtenden Anzeigen.
Sprechblase Dr. Mira:
„Der Luftstrom treibt schon die Turbine an!“
Sprechblase Dr. Lena:
„Aber der Filter muss noch stärker werden!“
Bild 3 – Rückschlag und Geistesblitz
Titelkasten: „Teil 3: Rückschlag und Geistesblitz“
Szene:
Der Prototyp gerät plötzlich in Schwierigkeiten. Warnlichter blinken, Funken sprühen, der Druck fällt ab, und der Filter ist mit dunklen Partikeln überladen. Dr. Lena reagiert erschrocken, während Dr. Mira auf ein Notizbuch zeigt, in dem eine neue Lösung skizziert ist: eine Kombination aus Wirbelkammer und Feinfilter.
Bildkomposition:
Dramatische Nahaufnahme oder leichte Untersicht mit Rauch, Warnanzeigen, Funken und angespannten Gesichtsausdrücken. Diese Szene soll sich deutlich dramatischer anfühlen als die vorherigen.
Sprechblase Dr. Lena:
„Oh nein, der Druck bricht zusammen!“
Sprechblase Dr. Mira:
„Warte – wir kombinieren Wirbelkammer und Feinfilter!“
Bild 4 – Der Durchbruch
Titelkasten: „Teil 4: Der Durchbruch“
Szene:
Der verbesserte Motor läuft erfolgreich. Eine leuchtende Wirbelkammer und ein Mehrschichtfilter sind gut sichtbar. Der Luftstrom ist stabil, die Druckanzeigen stehen auf Grün, und die Partikel werden klar von der Luft getrennt. Die Wissenschaftlerinnen feiern den Erfolg, arbeiten aber gleichzeitig noch konzentriert an den letzten Einstellungen.
Bildkomposition:
Technische Heldenaufnahme des verbesserten Motors, aber mit den Wissenschaftlerinnen in aktiven, unterschiedlichen Posen: eine justiert ein Bauteil, die andere liest Messwerte ab oder zeigt auf die Wirbelkammer.
Sprechblase Dr. Lena:
„Und der Motor läuft nur mit komprimierter Luft!“
Sprechblase Dr. Mira:
„Jetzt trennt der Mehrschichtfilter selbst Feinstaub!“
Bild 5 – Der Test
Titelkasten: „Teil 5: Der Test“
Szene:
Außenaufnahme in einem industriellen Hof. Der Motor ist auf einem kleinen mobilen Testfahrzeug oder Demonstrationswagen montiert. Links ist die Luft noch grau und verschmutzt, mit dunklen Partikeln. Diese Luft wird in den Motor gezogen. Rechts verlässt saubere, blau leuchtende Luft die Maschine; dort wirken Pflanzen grüner, der Himmel klarer und Menschen begeistert. Der Vorher-Nachher-Kontrast muss deutlich sichtbar sein.
Bildkomposition:
Starke Vorher-Nachher-Komposition: links verschmutzt und grau, rechts sauber, hell und grün. Die Wissenschaftlerinnen laufen neben dem Testfahrzeug, zeigen auf den sauberen Luftstrom oder jubeln.
Sprechblase Dr. Lena:
„Er läuft! Ganz ohne schädliche Emissionen!“
Sprechblase Dr. Mira:
„Sieh nur – die Luft wird sogar sauberer!“
Bild 6 – Eine saubere Zukunft
Titelkasten: „Teil 6: Eine saubere Zukunft“
Szene:
Große öffentliche Präsentation in einem hellen Stadtpark oder auf einem sauberen, futuristischen Stadtplatz. Die fertige Erfindung wird stolz vorgestellt. Bäume, Blumen, klarer Himmel, Familien, Kinder, Journalistinnen, Bürgerinnen und Bürger versammeln sich begeistert um die Maschine. Die Wissenschaftlerinnen stehen selbstbewusst daneben, während saubere Luft mit blauem Leuchten und grünen Blättern ausströmt.
Bildkomposition:
Upliftende Weitwinkel-Finalszene mit jubelnder Menge, sonnigem Himmel, sauberer Stadt und der fertigen Erfindung als Mittelpunkt. Diese Szene soll wie der hoffnungsvolle Abschluss der Geschichte wirken.
Sprechblase Dr. Lena:
„Unser Luftmotor schützt Klima und Gesundheit!“
Sprechblase Dr. Mira:
„Saubere Energie kann die Zukunft verändern!“
Zusätzliche visuelle Details:
Füge kleine technische Beschriftungen und Anzeigen ein, zum Beispiel:
„Einlass: verschmutzte Luft“
„Auslass: saubere Luft“
„Feinstaubfilter“
„Wirbelkammer“
„0 % Emissionen“
„Systemstatus: stabil“
„Saubere Luft. Starke Zukunft.“
Füge im Hintergrund passende Details ein:
Haftnotizen, technische Skizzen, Diagramme, Kaffeebecher, Umweltposter, Warnbildschirme, Test-Checklisten, Stadtbanner und kleine Motivationssprüche.
Diese Details sollen die Geschichte unterstützen, aber die Bilder nicht überladen.
Unbedingt vermeiden:
Die Szenen dürfen nicht alle gleich aussehen. Die Wissenschaftlerinnen dürfen nicht in jedem Bild einfach nur frontal vor dem Motor stehen. Nicht immer dieselbe Kameraperspektive verwenden. Keine unlesbaren oder falsch geschriebenen Texte. Der Motor soll nicht wie ein normaler Benzinmotor aussehen. Aus dem Auslass darf kein Rauch kommen, sondern saubere Luft. Die Erfindung darf nicht umweltschädlich wirken.
Ziel:
Erstelle eine zusammenhängende 6-teilige Comic-Bildergeschichte über Erfindungsgeist, Rückschläge, Teamarbeit, wissenschaftliches Denken, einen technischen Durchbruch, einen erfolgreichen Test und eine hoffnungsvolle saubere Zukunft.
Im oberen Code-Block habe ich den kompletten Prompt reinkopiert, auf dessen Grundlage die Bilderstory entstanden ist. Es lohnt sich hierbei, detailliertere Anweisungen zu geben. Ein Skript lässt sich problemlos im Vorfeld über ChatGPT & Co. erstellen und über Copy & Paste als Bild-Prompt in ChatGPT Images 2.0 einfügen.
Der untere Code-Block zeigt den Prompt zur Übertragung der Bilderstory in ein PDF mit den Angaben zum Design und dem genauen Format. Ich habe mich für das Querformat entschieden, da die Abbildungen im Hochformat erstellt wurden und daneben auch noch beschreibender Text hinzugefügt werden soll. Aber dies kann jeder individuell auswählen. Da gäbe es insgesamt vielfältige Gestaltungsmöglichkeiten.
Prompt zur Übertragung der Bilderstory in ein PDF
Erstelle aus der vorhandenen 6-teiligen Comic-Bildergeschichte ein hochwertiges, abwechslungsreich gestaltetes PDF mit genau 6 Seiten im Querformat.
Format:
- PDF im Querformat, idealerweise DIN A4 quer oder 16:9.
- Genau 6 Seiten.
- Jede Seite zeigt einen Teil der Bildergeschichte.
- Die Gestaltung soll modern, professionell, druckfähig und gut lesbar sein.
- Die sechs Seiten sollen zusammenhängend wirken, aber jede Seite soll ein eigenes, abwechslungsreiches Layout haben.
Wichtig zum Umgang mit den Bildern:
- Verwende die sechs vorhandenen Comicbilder in der richtigen Reihenfolge.
- Verzerre die Bilder nicht.
- Skaliere sie proportional.
- Schneide sie nur behutsam zu, wenn es für das Querformat sinnvoll ist.
- Nutze bei Bedarf eine vergrößerte, weichgezeichnete Version des jeweiligen Bildes als Hintergrund.
- Lege darüber das scharfe Hauptbild in einem klaren Comicrahmen.
- Achte darauf, dass wichtige Figuren, Sprechblasen und Titelkästen nicht abgeschnitten werden.
Gesamtstil:
Ein hochwertiges europäisches Graphic-Novel-/Comic-PDF mit klarer Linienführung, kräftigen aber realistischen Farben, technischen Details, sauberen Rahmen, moderner Typografie, dynamischen Layouts und einer hoffnungsvollen Science-Adventure-Stimmung.
Layout-Idee:
Jede Seite soll anders komponiert sein. Verwende unterschiedliche Anordnungen, Bildgrößen, Hintergrundflächen, Zoom-Ausschnitte, Infoboxen, technische Callouts, Notizzettel, Pfeile, kleine Diagramme, Monitor-Elemente und Comicrahmen. Das PDF darf nicht wie sechs identische Bildseiten wirken.
Seite 1: Die Idee
Gestalte die Seite wie eine kreative Labor-Blueprint-Seite.
- Großes Hauptbild leicht versetzt platzieren.
- Hintergrund mit Blaupausen, Skizzenlinien, Notizzetteln und Werkzeugdetails.
- Ergänze eine kurze Ideenbox:
„Aus einer verrückten Idee entsteht ein neuer Weg zu sauberer Luft.“
- Farbgefühl: neugierig, warm, kreativ, hoffnungsvoll.
Seite 2: Der erste Prototyp
Gestalte die Seite wie ein nächtliches Laborprotokoll.
- Dunkler technischer Hintergrund mit grünen Monitorlinien und Messwerten.
- Hauptbild groß platzieren, gern rechts oder zentral.
- Ergänze kleine Testdaten-Boxen:
„Luftstrom aktiv“
„Turbine läuft“
„Filterleistung: ausbaufähig“
- Farbgefühl: Nachtlabor, konzentriert, technisch, spannend.
Seite 3: Rückschlag und Geistesblitz
Gestalte die Seite dramatisch.
- Rote Warnrahmen, schräge Kanten, Alarm-Icons, Fehleranalyse-Felder.
- Hauptbild intensiv und groß einsetzen.
- Ergänze eine Notizbox:
„Fehler sind keine Niederlagen – sie zeigen den nächsten Schritt.“
- Farbgefühl: kritisch, dynamisch, angespannt, aber lösungsorientiert.
Seite 4: Der Durchbruch
Gestalte die Seite wie eine technische Heldenseite.
- Blau-grüne Leuchtelemente, klare Linien, technische Detail-Zooms.
- Ergänze Callouts:
„Wirbelkammer“
„Mehrschichtfilter“
„0 % Emissionen“
„Systemstatus: stabil“
- Farbgefühl: triumphierend, präzise, sauber, innovativ.
Seite 5: Der Test
Gestalte die Seite als starke Vorher-Nachher-Komposition.
- Linke Seitenseite grau, industriell und verschmutzt.
- Rechte Seitenseite hell, grün und sauber.
- Das Hauptbild darf groß über die Seite wirken.
- Ergänze eine Kontrastzeile:
„Links: verschmutzte Luft. Rechts: sichtbare Veränderung.“
- Farbgefühl: Transformation, Bewegung, Erfolg, Hoffnung.
Seite 6: Eine saubere Zukunft
Gestalte die Seite als helles, optimistisches Finale.
- Großzügiges, freundliches Layout mit viel Licht, Grünflächen, Publikum, Banner-Elementen.
- Hauptbild zentral und prominent platzieren.
- Ergänze den Abschluss-Slogan groß und gut lesbar:
„Saubere Luft. Starke Zukunft.“
- Farbgefühl: Zukunft, Gemeinschaft, Erfolg, saubere Umwelt.
Pflichtüberschriften:
Füge auf jeder Seite gut sichtbar die jeweilige Überschrift ein:
- „Teil 1: Die Idee“
- „Teil 2: Der erste Prototyp“
- „Teil 3: Rückschlag und Geistesblitz“
- „Teil 4: Der Durchbruch“
- „Teil 5: Der Test“
- „Teil 6: Eine saubere Zukunft“
Zusätzliche Gestaltung:
- Füge dezente Seitenzahlen hinzu.
- Verwende passende Comicrahmen, technische Linien, kleine Icons, Pfeile, Panels, Notizzettel, Diagramme und Infoboxen.
- Achte auf ausreichend Weißraum bzw. ruhige Flächen.
- Keine Seite überladen.
- Alle Texte müssen groß, korrekt geschrieben und gut lesbar sein.
- Keine Fantasiewörter oder fehlerhafte deutsche Begriffe.
- Die Figuren und die Geschichte sollen klar im Mittelpunkt bleiben.
Ziel:
Das Ergebnis soll wie eine professionelle, abwechslungsreiche 6-seitige Comic-Präsentation im Querformat wirken: spannend, visuell stark, technisch glaubwürdig, emotional erzählend, hochwertig gestaltet und geeignet zum Teilen, Präsentieren oder Ausdrucken.
Solch eine tiefergehende Anweisung kann man sich schnell von einem Chatbot schreiben und direkt im Chat ausgeben lassen. Beim User-Prompt wie ***führe den Prompt aus*** halte ich mich dann wieder kurz. Der untere Screenshot zeigt die bereitgestellte Datei. Der Vorgang im Thinking-Modus hat exakt 3 Minuten und 2 Sekunden gedauert. Nach einem Klick auf „PDF herunterladen“ startet der Download.
Nun schaue ich mir das PDF mit dem Text und dem Design genauer an und bemerke, dass es einige Ungenauigkeiten im Layout gibt. In der 3. Szene mit dem treffenden Titel „Rückschlag“ zeigt sich, dass die Überschrift nicht gut ins Design eingefügt wurde bzw. die Innenabstände uneinheitlich ausgegeben wurden. Das passt einfach noch nicht.
Da Sprachmodelle wie ChatGPT mittlerweile sehr gut PDFs analysieren können, ganz egal ob Text oder einzelne Bilder, lade ich die noch holprige Bilderstory einfach direkt in den Chat hoch und frage das LLM, ob es selber Fehler findet, die man über einen präziseren Prompt im Vorfeld hätte vermeiden können.
„Titel brechen unschön“ wird gleich als Erstes als Fehler präsentiert, also genau die Thematik aus der 3. Szene, die ich oben kurz beschrieben habe. Auch designtechnisch eher ungünstige Leerflächen werden erkannt. Die Fehleranalyse des eigenen PDFs scheint zu funktionieren und ich erspare mir eine langwierige Kommunikation mit ChatGPT. Direkt unter den Stichpunkten wird ein verbesserter Prompt ausgegeben, den ich gleich im Chat ausführen lasse, um zu testen, ob der Output nun zufriedenstellend ist.
Die obere Abbildung präsentiert das bereitgestellte Dokument mit der Bezeichnung „Optimiertes PDF im Querformat herunterladen“. Hier zeigt sich ganz klar die Stärke von ChatGPT, denn das Sprachmodell analysiert nicht nur schonungslos den eigenen PDF-Output und gibt zügig einen verfeinerten Prompt aus, sondern beschreibt auch sehr genau eher Kleinigkeiten wie einen Download-Link mit einer Bezeichnung wie „optimiert“ sehr zutreffend. So kann man sich im Chat besser zurechtfinden, falls es mehrere Dateien und ein mögliches „Hin und Her scrollen“ gibt.
Die Bewertung solcher Bilderstorys im Comic-Stil mit sehr futuristischen Themen wie einem Luftmotor ist selbstverständlich Geschmackssache. Es ließen sich auch andere Themen verwenden, um die Fähigkeiten von ChatGPT Images 2.0 zu demonstrieren.
Ich habe insgesamt für die Präsentation dieses Workflows zwei Versuche benötigt und aus meiner Sicht ist das finale PDF mit den beiden Wissenschaftlerinnen und einer spannenden Tech-Story wirklich gut gelungen und in einem modernen Design gestaltet. Viel Erfolg beim Testen!









