Grosses Upgrade Mit ChatGPT kannst du jetzt solch realistische Fotos erstellen

Martin Abgottspon

27.3.2025

Ob hyperrealistisch oder in einem bestimmten Stil: Mit dem neuen Bildgenerator von ChatGPT ist viel mehr möglich als zuvor mit Dall-E.
Ob hyperrealistisch oder in einem bestimmten Stil: Mit dem neuen Bildgenerator von ChatGPT ist viel mehr möglich als zuvor mit Dall-E.
OpenAI @blueNews

Hyperrealistische Bilder, konsistente Variationen und präzise Texteinbindung. Mit dem neusten Bildgenerator von OpenAI ist all das möglich. Einige Beispiele.

Martin Abgottspon

Keine Zeit? blue News fasst für dich zusammen

  • OpenAI integriert mit GPT-4o ein KI-Modell, das hyperrealistische und detailreiche Bilder erzeugt sowie präzise Texte einfügen kann.
  • Das Modell bietet vielfältige stilistische Variationen und erlaubt komplexe Anpassungen mit bis zu 20 Objekten .
  • Trotz einiger verbleibender Limitierungen setzt GPT-4o neue Massstäbe bei der Qualität und Vielseitigkeit KI-generierter Bilder.

OpenAI hebt die künstliche Bildgenerierung auf ein neues Level. Mit der Integration des Modells 4o in GPT-4o präsentiert das kalifornische Unternehmen eine KI, deren Ergebnisse durch erstaunlichen Realismus und Detailtreue bestechen. Das neuartige Tool stellt die Vorgänger der DALL-E-Serie deutlich in den Schatten, sowohl bei der Qualität als auch der Vielseitigkeit der generierten Bilder.

Bereits jetzt steht das Modell Nutzern mit Plus-, Pro-, Teams- und sogar kostenlosen Plänen zur Verfügung. Zudem findet die Bildgenerierung auch im Video-KI-Dienst Sora Anwendung.

Die entscheidenden Neuerungen umfassen vor allem die Fähigkeit, Bilder realitätsnah zu gestalten und Texte fehlerfrei zu integrieren. «Wir trainieren unsere Modelle anhand von Bild- und Textkombinationen aus dem Netz. Das Ergebnis ist ein verblüffend flüssiger visueller Stil, der Bilder in einem sinnvollen, konsistenten und kontextuellen Zusammenhang erzeugen kann», erklärt das Entwicklerteam.

Realistisch und trotzdem erfinderisch

Die Bedienung bleibt simpel. Nutzer formulieren einfach ihre Wünsche oder Anpassungen im Chat, während das Modell in einem komplexeren Denkprozess die Anforderungen umsetzt. Dies verlängert zwar die Generierungszeit auf bis zu eine Minute, steigert jedoch signifikant die Genauigkeit der Ergebnisse.

Besonders beeindruckend sind die fotorealistischen Qualitäten des 4o-Modells. Selbst komplexe Stilanfragen, wie beispielsweise ein Mountainbiker auf einer Downhill-Abfahrt, meistert die KI mühelos.

OpenAI @blueNews

Perfekt für Einladungen

Ein weiterer Meilenstein ist die verbesserte Texteinbindung. Während der Vorgänger häufig an kryptischen Schriftzügen scheiterte, punktet GPT-4o mit präziser und fehlerfreier Darstellung von Texten, wie etwa bei individuell gestalteten Geburtstagseinladungen.

OpenAI @blueNews

Ebenfalls bemerkenswert ist die Fähigkeit des Modells, komplexe Anweisungen mit bis zu 20 verschiedenen Objekten gleichzeitig präzise umzusetzen. Ein Test von «Marketing4eCommerce» mit 16 klar definierten Sticker-Elementen zeigt, wie exakt das System arbeitet. Eine Herausforderung, an der bisherige Modelle scheiterten.

Open AI @Marketing4eCommerce

OpenAI räumt dennoch gewisse Limitierungen ein, darunter gelegentliche Fehler bei Grafiken und fremdsprachigen Texten. Dennoch setzt das GPT-4o Modell aktuell einen neuen Massstab in der KI-gestützten Bildgenerierung und dürfte weitreichende Anwendungsmöglichkeiten eröffnen.