ChatGPT Images 2.0: Neue Bild-KI von OpenAI mit „Thinking-Modus“ und Internetzugang setzt neue Maßstäbe
✅ Freie Nutzung von Text & Abbildungen & Video für Premium-User
OpenAI hat mit ChatGPT Images 2.0 sein neuestes Bildmodell veröffentlicht, das sehr starke Outputs generiert und mindestens auf einem Niveau mit Google Top-KI Nano Banana 2 liegt. Vor allem Texte in Bildern wie im Rahmen von komplexen Infografiken können nach dem Update problemlos dargestellt werden. Die Bild-KI Images 2.0 ist tief in ChatGPT integriert und lässt sich nun auch in einem Thinking-Modus mit Internet-Suche verwenden.
Falls das Update innerhalb von ChatGPT ausgerollt wurde, taucht automatisch eine Benachrichtigung auf, wie dies im oberen Screenshot angezeigt wird. Das Chamäleon in einem technischen Infografik-Stil mit Textbeschreibungen verdeutlicht gut, in welche Richtung ChatGPT Images 2.0 weiterentwickelt wurde
Um die Top-Bild-KI nutzen zu können, gilt es zu Beginn, ein paar kleinere Einstellungen vorzunehmen. In der oberen Abbildung habe ich über das Plus-Symbol die Bilderstellung aktiviert und der untere Screenshot zeigt, wie ich links oben über das Drop-Down-Menü in den Thinking-Modus wechsele, der sich bei der Bildgenerierung mehr Zeit lässt, den Prozess überwacht und selbstständig korrigiert. An der Promptleiste werden die Settings übersichtlich mit den Bezeichnungen „Länger“ und „Erstelle ein Bild“ angeführt. Hieran kann man sich gut orientieren.
Zusätzlich ist es nun möglich über ChatGPT Images 2.0, an der Promptleiste ein Bildformat festzulegen, also zum Beispiel Querformat, Hochformat oder Quadratisch. Dies muss man nicht mehr im Prompt formulieren und vereinfacht den Prozess der Bilderstellung. Es läuft immer mehr über simple Button-Klicks und weniger über komplexe Promptstrukturen. Super!
Da jetzt alle Einstellungen festgelegt sind, beginnt die Bilderstellung über einen geeigneten Textprompt. Ich möchte gerne Anregungen für neue Blogbeiträge zu dieser Webseite Unidigital.news über insgesamt 4 Bilder mit Text und Grafiken generieren. Da ChatGPT Images 2.0 auch das Internet durchsuchen kann, habe ich zusätzlich die offizielle Domain von Unidigital.news am Schluss hinzugefügt. Die KI sollte gleich die Webseite crawlen, die Thematik erfassen und auf dieser Grundlage Vorschläge präsentieren und zwar im Thinking-Modus.
Use Case: Vorschläge für 4 „KI-Blogbeiträge“ (Thinking + Internet)
Nach einem Klick auf den Button rechts unten in der Promptleiste startet die Bilderstellung und dieser Prozess kann einige Minuten dauern. Um live zu überprüfen, was ChatGPT Images 2.0 aktuell tut, klickt man oberhalb des KI-generierten Bildes auf den Text „Denke nach“ und im Anschluss öffnet sich auf der rechten Seite eine Sidebar. Dort lässt sich der gesamte Thinking-Prozess step by step transparent nachlesen und jederzeit wieder aufrufen.
Nach exakt 3 Minuten und 18 Sekunden ist der Vorgang der Bilderstellung vollständig beendet und wie im Prompt beschrieben, kann ich nun insgesamt 4 Bilder durchgehen. Diese lassen sich rechts neben dem angeklickten Bild auswählen. Das ist sehr übersichtlich gehalten. Die Bilder enthalten eine Überschrift, einen beschreibenden Text und geeignete Grafiken. Ganz oben wurde zusätzlich die Bezeichnung Unidigital.news | KI & Bildung übernommen.
Der erste Vorschlag, der mir in einem Bild präsentiert wird, passt sehr gut zur Webseite mit Schwerpunkt auf KI & Bildung. Ich hatte die Verschiebung der „Website-Traffic-Marktanteile“ seitens der Top-KI-Chatbots in einem der Artikel veröffentlicht und ChatGPT Images 2.0 hat dies erfolgreich über den Internetzugang analysiert und in einem neuen Themenvorschlag für einen potenziellen Blogbeitrag ausgegeben.
Auch der weitere Themenvorschlag (oben) zu NotebookLM passt gut für einen möglichen Artikel mit KI-Bildungsbezug. Insgesamt sind alle 4 Vorschläge in Form von 4 Bildern gut gelungen. Dies war der erste Versuch, den ich vorgenommen habe. Das Handling ist sehr einfach und auch gut für Einsteiger geeignet. Simpel beschreibender Textinput als Prompt ist völlig ausreichend.
Der Text in den Bildern ist, soweit ich dies richtig überblickt habe, fehlerfrei, aber ich bin nicht im Detail jedes der einzelnen Wortes durchgegangen. Kommt es zu einer fehlerhaften Darstellung, dann kann man dies in einem Folgeprompt ganz genauso mitteilen und die Bild-KI ändert dies umgehend.
Mir gefällt die Thematik rund um den „Website-Traffic-Marktanteil“ am besten und daher weise ich ChatGPT Images 2.0 an, auf dieser Grundlage einen Post für LinkedIn im Hochformat zu erstellen. Generell gibt es nach einer Bildgenerierung viele Möglichkeiten der Weiterverarbeitung, um zum Beispiel gezielt einen Output für Social Media & Co anzupassen.
Der Output wirkt auf den ersten Blick übersichtlich und kann aus meiner Sicht gut für LinkedIn im Rahmen einer Infografik als Bildanhang verwendet werden. Oben links ist zudem mit „UD“ ein Logo eingefügt, das zu „Unidigital“ passen soll. Was mir nun als Fehler auffiel, ist der hinzugefügte blaue Punkt über dem „U“ von „Unidigital“.
Der Punkt war vorher nicht vorhanden, ist somit als Fehler anzusehen und genau diesen möchte ich gerne entfernen und setze einen simpel beschreibenden Folgeprompt. Wichtig ist es, aus meinen Erfahrungen stets genau den Ort im Bild anzugeben und dann kurz das Problem zu schildern. Bild-KIs wie ChatGPT Images 2.0 und Nano Banana 2 können dies sehr zuverlässig erfassen und korrigieren. Man muss das Bild also nicht noch einmal generieren, sondern eben nur gezielt mit einem Prompt anpassen, mehr nicht.
Solche Kleinigkeiten ließen sich wohl auch im „Fast-Modus“ von Images 2.0 ändern, aber in diesem Beitrag bleiben wir im „Thinking-Modus“. Ein Wechsel wäre oben links über einen Klick auf „Instant“ möglich.
Im Anschluss habe ich das Bild oben rechts über das Download-Icon und „Bild herunterladen“ gespeichert und in die WordPress-Mediathek hochgeladen. Es ließen sich zusätzlich alle 4 Bilder auf einmal downloaden. Im Beispiel wäre dies über den Button „4 Bilder in dieser Serie herunterladen“ möglich.
Für mehr „Design-Vielfalt“ bekommt ChatGPT Images 2.0 die Aufgabe, dieses Bild in vier sehr unterschiedlichen Stilrichtungen auszugeben, aus denen ich dann auswählen kann. Bild-KIs sind stark im Präsentieren von neuen Stilen, auf die man selber häufig nicht gekommen wäre. Hier lohnt es sich breit zu testen. Der untere Screenshot zeigt, dass Prompts nicht nur in Text, sondern auch über Audio bzw. Spracheingabe verfasst werden können. Hierzu auf das Mikrofon klicken, die Änderungswünsche über die eigene Stimme beschreiben und über den Haken bestätigen.
Da ich nicht genau weiß, welche Stile generiert wurden, frage ich einfach bei ChatGPT nach und bekomme direkt eine Auflistung. Der Stil „Art Nouveau“ ist ganz schick. Hier wird der Vorteil einer Kombination aus Bildgenerator und Top-Sprachmodell erkennbar. Es lässt sich hinsichtlich des Outputs problemlos von Bild zu Text wechseln, falls eine Frage auftauchen sollte.
Falls ein Chat wirklich tolle Ergebnisse bringt und zu diesem Thema noch weitere Chatverläufe hinzukommen sollten, dann kann es sinnvoll sein, innerhalb von ChatGPT links in der Navigation (Desktop) über „Projekte“ ein „Neues Projekt“ zu starten und alle geeigneten Chats dort zu sammeln, um nicht stets hin und her switchen zu müssen. Dies spart Zeit!
Ich habe das Projekt „Linkedin-Post“ angelegt und dieses lässt sich nun im Chat rechts oben über die drei Punkte und „Projekt verschieben“ auswählen. In einer Liste werden historisch alle gesammelten Chatverläufe aufgeführt. Zudem können Dateien hochgeladen werden, etwa von alten Social-Media-Kampagnen (PDF) oder Ähnlichem. Hierzu auf den Reiter „Quellen“ wechseln.
Zum Schluss noch die Empfehlung, sich das offizielle Video von OpenAI anzuschauen, das noch viele weitere Top-Use-Cases für ChatGPT Images 2.0 präsentiert. Wird (deutscher) Text so zuverlässig in Top-Bildern dargestellt, dann ergeben sich (sehr) viele Gestaltungsmöglichkeiten. Viel Erfolg!

Da OpenAI die Video-KI Sora „ausgeschaltet“ und sich zudem von einigen Projekten zurückgezogen hat, ist davon auszugehen, dass auch die weiteren Updates von ChatGPT Images die eine oder andere positive Überraschung mit sich bringen, da so mehr Ressourcen für die Bild-KI genutzt werden können. Wie gut war Nano Banana noch gleich? 😉





















