Zum Dahinschmelzen
Alles Käse? Im Gegenteil! OpenAIs neue KI überrascht

Google schockte mit Nano Banana Pro die Konkurrenz. OpenAI rief intern den Notstand aus und schlägt jetzt mit GPT Image 1.5 zurück. Blick hat die Bild-KIs getestet. Das Ergebnis überrascht.
Kommentieren
1/6
OpenAI hat in der Nacht auf Mittwoch GPT Image 1.5 lanciert. Die Bild-KI hat nun eine neue Oberfläche erhalten und neu gibt es direkt Vorschläge, das eigene Konterfei zu verwandeln.
Foto: Tobias Bolzern KI generiert

Darum gehts

  • Nach Google-Schock: OpenAI zieht Lancierung vor und schlägt zurück
  • Blick-Test zeigt: Google führt noch immer bei Licht, Text und Realismus
  • ChatGPT holt auf, ist aber nur etwa halb so schnell wie Googles Modell
Die künstliche Intelligenz von Blick lernt noch und macht vielleicht Fehler.
nnnnnnn.jpg
Tobias BolzernRedaktor Digital

Google lancierte Ende November seine neue Bild-KI Nano Banana Pro und schockte damit das Internet und die Konkurrenz. Allen voran OpenAI. Intern rief CEO Sam Altman «Code Red» aus, wie ein geleaktes Memo zeigt. Der Grund: Google hatte mit Gemini 3 Pro und Nano Banana Pro die Spitze der KI-Ranglisten erobert. OpenAI drohte, den Anschluss zu verlieren.

Jetzt schlägt der ChatGPT-Entwickler zurück. Vergangene Woche kam GPT-5.2, diese Woche folgt der neue Bildgenerator GPT Image 1.5. Das Update erscheint in der neuen Seitenleiste unter dem Punkt: Bilder. Die Lancierung war ursprünglich für Januar geplant, wurde aber vorgezogen. OpenAI verspricht bessere Detailtreue, präzisere Bearbeitung und bis zu viermal schnellere Bildgenerierung. Blick hat die KI-Modelle gegeneinander antreten lassen.

OpenAI vs. Google: Test

Die Test-Prompts sind präzise strukturiert (siehe Box unten). Statt Fliesstext verwenden wir JSON-Prompts: ein Format, das Anweisungen gliedert wie eine Liste. Für KI-Modelle wird die Aufgabe damit klarer, die Ergebnisse besser. Jedes Element im Bild ist gezielt verlangt, nichts dem Zufall überlassen. Das setzt die Modelle unter Stress.

Objekte und Physik

Vier Objekte auf einem Holztisch: Zitronenscheibe, Schlüssel, Origami-Kranich, brennende Kerze. Nur schon vor einem Jahr wäre das eine schwierige Aufgabe für KI-Modelle gewesen. Heute liefern beide KI-Modelle fotorealistische Ergebnisse. Im Detail zeigen sich aber Unterschiede: ChatGPT produziert einen kompakteren Kranich, doch die Objekte wirken verzerrt, die Beleuchtung stimmt nicht, das Licht der Kerze z. B. erhellt die Umgebung kaum. Nano Banana Pro liefert realistischere Schatten und stimmigeres Licht.

1/2
OpenAI GPT Image 1.5
Foto: Tobias Bolzern KI generiert

Käsebrille

Prompt für die Käsebrille

{
«subject»: {
«description»: «A stoic high-fashion supermodel in a haute couture editorial shoot",
«age»: «ageless",
«expression»: «deadpan, severe, icy stare straight into camera",
«hair»: {
«style»: «slicked back architectural bun",
«color»: «platinum blonde»
},
«clothing»: {
«top»: {
«type»: «avant-garde structured blazer",
«color»: «cream wool",
«details»: «exaggerated shoulders, minimalist design»
}
},
«face»: {
«makeup»: «minimalist, dewy skin, bleached eyebrows»
},
«key_feature»: {
«type»: «eyewear",
«details»: «Spectacles with frames carved entirely out of Emmentaler cheese, complete with large, realistic cheese holes (eyes visible through the holes), slightly greasy texture»
}
},
«accessories»: {
«jewelry»: {
«earrings»: «minimalist gold hoops meant to look like cow bells",
«neck»: «a delicate gold chain with a small Edelweiss pendant»
}
},
«photography»: {
«camera_style»: «editorial fashion photography, medium format film",
«shot_type»: «medium close-up portrait",
«aspect_ratio»: «4:5 vertical magazine cover format",
«texture»: «fine art print grain, muted color grading, sharp focus on the cheese texture",
«vibe»: «Vogue Italia aesthetic, serious fashion, absurd subject»
},
«background»: {
«setting»: «brutalist concrete photo studio in the Swiss Alps",
«elements»: [
«raw concrete walls",
«large industrial window overlooking snowy peaks",
«minimalist geometric furniture»
],
«atmosphere»: «cold, expensive, silent",
«lighting»: «soft, diffused natural light from a large north-facing window, highlighting the oily sheen of the cheese»
}
}

{
«subject»: {
«description»: «A stoic high-fashion supermodel in a haute couture editorial shoot",
«age»: «ageless",
«expression»: «deadpan, severe, icy stare straight into camera",
«hair»: {
«style»: «slicked back architectural bun",
«color»: «platinum blonde»
},
«clothing»: {
«top»: {
«type»: «avant-garde structured blazer",
«color»: «cream wool",
«details»: «exaggerated shoulders, minimalist design»
}
},
«face»: {
«makeup»: «minimalist, dewy skin, bleached eyebrows»
},
«key_feature»: {
«type»: «eyewear",
«details»: «Spectacles with frames carved entirely out of Emmentaler cheese, complete with large, realistic cheese holes (eyes visible through the holes), slightly greasy texture»
}
},
«accessories»: {
«jewelry»: {
«earrings»: «minimalist gold hoops meant to look like cow bells",
«neck»: «a delicate gold chain with a small Edelweiss pendant»
}
},
«photography»: {
«camera_style»: «editorial fashion photography, medium format film",
«shot_type»: «medium close-up portrait",
«aspect_ratio»: «4:5 vertical magazine cover format",
«texture»: «fine art print grain, muted color grading, sharp focus on the cheese texture",
«vibe»: «Vogue Italia aesthetic, serious fashion, absurd subject»
},
«background»: {
«setting»: «brutalist concrete photo studio in the Swiss Alps",
«elements»: [
«raw concrete walls",
«large industrial window overlooking snowy peaks",
«minimalist geometric furniture»
],
«atmosphere»: «cold, expensive, silent",
«lighting»: «soft, diffused natural light from a large north-facing window, highlighting the oily sheen of the cheese»
}
}

1/2
OpenAI GPT Image 1.5
Foto: Tobias Bolzern KI generiert

Fotoshoot im «Vogue»-Stil. Nano Banana Pro trifft die Aufgabe perfekt. Der Schatten unter der Brille aus Käse ist realistisch, das Licht auch. Die Struktur im Stoff des Jacketts ist deutlich zu erkennen. OpenAI hingegen hat mehr Mühe. Das verlangte Enzian-Amulett ist kein Enzian. Die Glöckchen-Ohrringe wirken absurd gross, die Käsebrille nicht glaubhaft.

Text ausgeben

2023 ging der Schweizer Autor und Komiker Patrick «Karpi» Karpiczenko mit einem Video viral: Seine KI-Horror-Heidi eroberte das Netz. Können die neuen Bildgeneratoren von Google und OpenAI dazu ein Filmplakat erstellen? Beide geben den verlangten Text korrekt aus. ChatGPT scheitert auch hier an Details: Der Filmtitel sollte wie verbranntes Holz aussehen, stattdessen liefert es eine generische Horrorschrift. Googles Nano Banana Pro trifft den Grusel-Look besser, inklusive Schweizerkreuz aus Tierknochen.

1/2
OpenAI GPT Image 1.5
Foto: Tobias Bolzern KI generiert

Person einfügen

Paul Accola und Franz Heinzer enthüllten 1992 das coolste Schweizer Ski-Tenue: Das Käsedress ist bis heute Kult. Für den Test liessen wir beide Modelle ein ähnliches Bild generieren, dann luden wir ein Selfie des Autors hoch, um ihn einzufügen. Kurz: Ich erkenne mich auf beiden Bildern wieder. Nano Banana Pro wirkt allerdings realistischer, brauchte aber mehrere Anläufe. ChatGPT patzt bei den Proportionen: Mein Kopf ist zu gross, der Emmentaler übersät mit Löchern, als hätte die KI «Käse» zu wörtlich genommen. Das Wappen auf dem Stirnband treffen beide gut, ebenso die Sponsoren-Logos. Die Käse-Textur auf den Anzügen gelingt Google besser. Bei ChatGPT wirken die Anzüge wie aus Latex. Dennoch hat OpenAI hier die Nase vorne.

1/5
OpenAI GPT Image 1.5
Foto: Tobias Bolzern KI generiert

Bild Kolorieren

1/4
Die Vorlage: Eröffnung der Gotthardbahnlinie 1882.
Foto: Verkehrshaus Luzern

Die Eröffnung des Gotthard-Bahntunnels 1882: ein historisches Schwarzweissfoto, das beide KI-Modelle kolorieren sollten. ChatGPT taucht das Bild in warmes Sepia, Nano Banana Pro wählt kühlere Töne. Beide Varianten verlieren sich in Details: verzerrte Gesichter, verschrobene Beine, veränderte Silhouetten. Das ist kein Fehler, sondern Prinzip. KI koloriert nicht – sie erfindet neu. Personen stehen anders, Details an der Lok verändern sich. Wer historische Fotos so bearbeitet, erhält kein aufgewertetes Original. Er erhält ein neues Bild, das mit der Vorlage nur noch das Motiv teilt.

Datenschutz

OpenAI verwendet hochgeladene Bilder standardmässig zum Training seiner Modelle. Wer das nicht will, muss es abschalten: in den Einstellungen unter «Datenkontrollen». Für Geschäftskunden gilt dies nicht.

OpenAI vs. Google: Fazit

OpenAI hat mit seinem neuen Bildgenerator deutlich aufgeholt. Doch Google liegt mit Nano Banana Pro noch immer vorn, etwa bei der Textdarstellung, Lichtsetzung und fotorealistischen Details. ChatGPT ist jetzt zwar schneller geworden, doch während es ein Bild ausspuckt, liefert Nano Banana Pro fast schon zwei Bilder. Der Abstand zwischen den Rivalen ist geschrumpft. Verschwunden ist er nicht.

Disclaimer: Blick setzt KI-basierte Tools wie ChatGPT, Nano Banana, Midjourney und Co. nicht für die Erstellung von fotorealistischen News-Bildern ein. Die Bilder in diesem Artikel dienen nur der Illustration, wie weit diese KI-Tools in den vergangenen Monaten gekommen sind. Der Einsatz von KI für illustrationsähnliche Bilder ist bei Blick gestattet. 

Was sagst du dazu?
Heiss diskutiert
    Meistgelesen