Darum gehts
- Google stellt Gemini 3 vor: KI generiert jetzt interaktive Benutzeroberflächen
- Neue Generative UI erfindet sich für jede Anfrage neu
- Gemini 3 Pro erreicht 72,1 Prozent im Simple Q&A Verified Test – ein Rekord
Du fragst den KI-Chatbot nach Tipps für einen Trip nach Rom. Sekunden später erhältst du eine interaktive Karte mit eingezeichneten Wegen, Öffnungszeiten und Kostenrechner. Die KI hat das gleich selbst programmiert. Das ist Gemini 3.
Google hat am Dienstag sein neues KI-Flaggschiff vorgestellt. Was das Rom-Beispiel zeigt, ist mehr als eine clevere Demo. Es ist ein neues Prinzip: «Generative UI» nennt Google die Technologie. Eine Benutzeroberfläche (graphical user interface, kurz GUI), die sich für jede Anfrage neu erfindet. Bei der Präsentation zeigte der Hersteller eine weitere Demo. Bei einer Anfrage zu Vincent van Gogh erscheint eine interaktive Visualisierung seines Lebenswerks, komplett mit animierten Elementen und einer Zeitachse. Auch kleine Widgets kann die KI: Für Währungen gibt es Live-Umrechner, für Hypotheken Kalkulatoren, für Physik-Aufgaben interaktive Simulationen, alles selbst generiert.
Manche Antworten sehen aus «wie ein Magazin», sagt Josh Woodward, Produktchef bei Google. Das ist eine neue Richtung: Bisher mussten Entwickler jede Funktion einer App von Hand programmieren. Mit Generative UI schreibt die KI den Code selbst, je nachdem, was der Nutzer gerade braucht. Das macht die Interaktionen flexibler und mächtiger, aber auch unberechenbarer.
Was Gemini 3 noch kann
Das Modell selbst schlägt laut Google alle bisherigen Versionen beim Programmieren, beim logischen Denken und bei der Genauigkeit. Die Google-Managerin Tulsee Doshi nennt es das «faktischste Modell aller Zeiten». Gemeint ist: Es erfindet weniger Dinge, sondern stützt sich stärker auf überprüfbare Fakten. Um das zu messen, nutzt Google den Simple Q&A Verified Test: 1000 Fragen, jede mit einer eindeutig überprüfbaren Antwort. Gemini 3 Pro erreicht 72,1 Prozent. Das ist Rekord unter den KI-Modellen. Heisst aber auch: Bei drei von zehn Fragen liegt die KI daneben oder halluziniert.
Zusätzlich nutzen Googles-Forscher den sogenannten ELO-Score. Das System stammt ursprünglich vom Schach: Zwei Modelle treten gegeneinander an, User bewerten die Antworten blind. Wer öfter gewinnt, steigt im Ranking auf der Website LMArena.com auf. Bei den neuen Tests setzte sich Gemini 3 Pro mit einem Wert von 1501 gegen die Konkurrenz durch. Zum Vergleich: Grok 4.1 Thinking kommt auf 1483, Gemini 2.5 Pro auf 1452, Claude Sonnet auf 1451 und ChatGPT 5 high auf 1437 (Stand 18.11.2025). Allerdings ist die Methode umstritten: Denn sie misst vor allem, welches KI-Modell die glatteren, überzeugender klingenden Antworten liefert.
Geminis neuer Grübel-Modus
Zusätzlich bringt Google einen neuen Modus namens «Deep Think». Dieser ist jedoch noch in der Testphase und wird erst später für zahlende Nutzer verfügbar sein. Die KI nimmt sich dabei mehr Zeit, entwickelt mehrere Hypothesen parallel und prüft diese gegeneinander. Das Ergebnis: bessere Antworten bei komplexen Problemen, aber deutlich höhere Rechenkosten.
Google verspricht, dass Gemini 3 sicherer ist als die Vorgänger. Das Modell soll besser gegen Prompt Injections geschützt sein, also gegen Versuche, KI mit manipulativen Befehlen auszutricksen. Und es soll weniger «schleimen», ein Seitenhieb auf OpenAI, dessen ChatGPT dazu neigt, Nutzer übermässig zu loben.
Antischwerkraft für Programmierer
Parallel lanciert Google «Antigravity» (Antischwerkraft), eine Entwicklerplattform, auf der KI-Agenten autonom Software entwickeln sollen. Die Agenten arbeiten nicht mehr nur als Hilfstools, sondern als eigenständige Entwickler: Sie planen Apps, schreiben Code, testen ihn und beheben Fehler, während menschliche Entwickler überwachen und Feedback geben.
Gemini 3 und Gemini 3 Pro wird momentan ausgerollt – im «Google AI Studio» ist es aber sicher schon verfügbar. Die neue Generative UI wird als Experiment lanciert. Erstmals kommt das neue KI-Modell parallel direkt in der Google-Suche zum Einsatz: dies im sogenannten AI Mode. Allerdings beginnt hier die Lancierung in den USA. Wann dies auf weitere Regionen ausgeweitet wird, ist unklar.