Grosses UpgradeMit ChatGPT kannst du jetzt solch realistische Fotos erstellen
Martin Abgottspon
27.3.2025
Ob hyperrealistisch oder in einem bestimmten Stil: Mit dem neuen Bildgenerator von ChatGPT ist viel mehr möglich als zuvor mit Dall-E.
OpenAI @blueNews
Hyperrealistische Bilder, konsistente Variationen und präzise Texteinbindung. Mit dem neusten Bildgenerator von OpenAI ist all das möglich. Einige Beispiele.
OpenAI hebt die künstliche Bildgenerierung auf ein neues Level. Mit der Integration des Modells 4o in GPT-4o präsentiert das kalifornische Unternehmen eine KI, deren Ergebnisse durch erstaunlichen Realismus und Detailtreue bestechen. Das neuartige Tool stellt die Vorgänger der DALL-E-Serie deutlich in den Schatten, sowohl bei der Qualität als auch der Vielseitigkeit der generierten Bilder.
Bereits jetzt steht das Modell Nutzern mit Plus-, Pro-, Teams- und sogar kostenlosen Plänen zur Verfügung. Zudem findet die Bildgenerierung auch im Video-KI-Dienst Sora Anwendung.
Die entscheidenden Neuerungen umfassen vor allem die Fähigkeit, Bilder realitätsnah zu gestalten und Texte fehlerfrei zu integrieren. «Wir trainieren unsere Modelle anhand von Bild- und Textkombinationen aus dem Netz. Das Ergebnis ist ein verblüffend flüssiger visueller Stil, der Bilder in einem sinnvollen, konsistenten und kontextuellen Zusammenhang erzeugen kann», erklärt das Entwicklerteam.
Realistisch und trotzdem erfinderisch
Die Bedienung bleibt simpel. Nutzer formulieren einfach ihre Wünsche oder Anpassungen im Chat, während das Modell in einem komplexeren Denkprozess die Anforderungen umsetzt. Dies verlängert zwar die Generierungszeit auf bis zu eine Minute, steigert jedoch signifikant die Genauigkeit der Ergebnisse.
Besonders beeindruckend sind die fotorealistischen Qualitäten des 4o-Modells. Selbst komplexe Stilanfragen, wie beispielsweise ein Mountainbiker auf einer Downhill-Abfahrt, meistert die KI mühelos.
OpenAI @blueNews
Perfekt für Einladungen
Ein weiterer Meilenstein ist die verbesserte Texteinbindung. Während der Vorgänger häufig an kryptischen Schriftzügen scheiterte, punktet GPT-4o mit präziser und fehlerfreier Darstellung von Texten, wie etwa bei individuell gestalteten Geburtstagseinladungen.
OpenAI @blueNews
Ebenfalls bemerkenswert ist die Fähigkeit des Modells, komplexe Anweisungen mit bis zu 20 verschiedenen Objekten gleichzeitig präzise umzusetzen. Ein Test von «Marketing4eCommerce» mit 16 klar definierten Sticker-Elementen zeigt, wie exakt das System arbeitet. Eine Herausforderung, an der bisherige Modelle scheiterten.
Open AI @Marketing4eCommerce
OpenAI räumt dennoch gewisse Limitierungen ein, darunter gelegentliche Fehler bei Grafiken und fremdsprachigen Texten. Dennoch setzt das GPT-4o Modell aktuell einen neuen Massstab in der KI-gestützten Bildgenerierung und dürfte weitreichende Anwendungsmöglichkeiten eröffnen.