Neues Bildmodell „4o“von OpenAI mit tollem Fotorealismus und guter Darstellung von Text

OpenAI hat mit 4o sein bislang bestes Bildmodell vorgestellt, das nun auch wirklich guten Fotorealismus und sehr gut mit Text in Bildern umgehen kann. Auch ein nachträgliches Hinzufügen/Ändern von Gegenständen oder Ähnlichen kann nun simpel per Prompt durchgeführt werden. Dies ging so mit DALL-E3 nicht und zeigt insgesamt eine tolle Entwicklung von Bild-KIs.

marx

Die obere Abbildung wurde aus dem ausführlichen Prompt (Copy & Paste) von OpenAI erstellt, der auf dem offiziellen Blogbeitrag zu finden ist. Hier ist gut erkennen, wie viel Fotorealismus nun über 4o möglich ist. Im rechten Bild wurde dann per Prompt „füge einen Hut hinzu“ zudem ein Hut hinzugefügt. Dies ging alles sehr einfach. Das Bildmodell ist innerhalb von ChatGPT-4o integriert und kann unten in der Promptleiste aktiviert werden oder User schreiben in den Prompt etwa zu Beginn „Erstelle ein Bild„. Die Nutzung ist übrigens auch für Free User möglich.

Insgesamt kann 4o wohl recht viel, wenn man sich etwas tiefergehender mit der Bild-KI beschäftigt und einfach mal diverse Dinge testet. Aus meinen Erfahrungen kann 4o nicht nur englischen Text gut darstellen, sondern auch deutschen Text. Das obere Bild zeigt dies recht gut. Es lassen sich zum Beispiel auch farbenfrohe Infografiken generieren, wie in diesem Beispiel zur Entwicklung der Europäischen Union. Natürlich muss auch hier stets der Output auf Fehler kontrolliert werden.

Vor allem erklärende Darstellungen mit Text finde ich persönlich sehr interessant, wie im Beispiel zum Training eines KI-Algorithmus. Jeder, der eigenständig versucht hat, über Power Point & Co solche Grafiken zu erstellen, der weiß, dass dies durchaus so einiges an Zeit in Anspruch nehmen kann. Dies könnte sich nun durch Modelle wie 4o ändern, falls sie sehr zuverlässig arbeiten würden. Bin gespannt, wie es weitergeht.

Ein Beitrag erstellt von

matthias kindt

Matthias Kindt auf Linkedin

 

Ähnliche Beiträge