Darum gehts
- Google lanciert Omni Flash: KI verwandelt einfache Skizzen in realistische Videos
- Die KI kennt Schwerkraft und Physik. Filter schützen vor Deepfakes realer Personen
- OpenAIs Videogenerator Sora ist gescheitert. Google profitiert mit Omni jetzt davon
Ein ganz normaler Dienstag im Google-Büro: Fünf Angestellte sitzen auf einer Couch und sprechen über KI. Dann krault plötzlich ein Affe auf der Schulter eines Mannes sein Haar. Einem anderen hängt gerade ein Faultier um den Hals. Die Szene wird noch absurder: Papageien landen auf dem Tisch, alle schlürfen Spaghetti, zum Schluss läuft ein Rudel afrikanischer Wildhunde durchs Bild.
Was wie ein bizarrer Trip klingt, ist die neueste Demo von Google Deepmind. Die Köpfe hinter Gemini Omni Flash – Nicole Brichtova, Dumitru Erhan, Gabe Barth-Maron und Shlomi Fruchter – zeigen: Die Grenze zwischen Realität und Pixeln verschwimmt immer weiter.
Alles wird zum Prompt
Hinter der Spielerei steckt viel Rechnerei. «Wenn ein Affe auf eine Schulter springt, muss das Modell verstehen, wie er sich bewegt, das nennen wir Weltverständnis», sagt Fruchter. Bisherige KI-Modelle hatten Probleme mit der Realität: Finger verschwanden, Objekte bewegten sich unnatürlich. Omni soll das besser machen – trainiert auf Text, Audio, Bild und Video, versteht es laut Google Konzepte wie Schwerkraft, Kinetik und Fluiddynamik.
Das Besondere: Omni ist «multimodal». Die KI muss Videos oder Ton nicht erst in Text übersetzen, sie verarbeitet alles gleichzeitig. In einer Demo zeichnet jemand einen Kreis auf Papier, gibt den Befehl «Mach daraus ein schwarzes Loch» und die KI verwandelt ihn in einen dunklen Schlund, der die Dinge auf dem Tisch einsaugt. Man kann auch ein Foto eines Charakters, eine Bewegungsskizze und einen Stilbefehl kombinieren; Omni mischt daraus ein stimmiges Video. Bisher brauchte man dafür teure Software, viel Know-how und stundenlange Pröbelei. Omni erledigt es mit einem Prompt. Der Name ist Programm: Omni kommt aus dem Lateinischen und bedeutet «alles» – alles rein, alles raus. Zu Beginn spuckt Omni allerdings nur Videos aus. Audio könnte als Nächstes folgen.
Moral der Maschine
Doch die neue Technik hat ihre Tücken. Wenn Befehle zu vage sind, entstehen oft Artefakte: Dinge im Hintergrund bewegen sich, obwohl sie stillstehen müssten, Texturen verschwimmen. Das zeigte sich auch in unserem Test. Wichtig zu verstehen: Omni Flash ist keine Physik-Engine. Das Modell berechnet keine Schwerkraft – es hat nur gelernt, wie physikalisch plausible Ergebnisse aussehen, und ahmt diese nach.
Die Demos aus der Keynote sind hochgradig kuratiert. Im Alltag landet man daher oft eher im Bereich «gut genug» als im Bereich «absolut verblüffend». Zudem ist das Erstellen langsam: Zehn Sekunden Video brauchen bis zu zwei Minuten Generierungszeit. Mit den günstigen Abos lassen sich zum Start des Dienstes ausserdem nur ein paar Videos pro Tag ausspucken.
Zudem wirft die generative Freiheit Fragen zum Urheberrecht auf. Wie der Test zeigt, wurde Omni Flash mit geschütztem Material trainiert. Es gelang problemlos, Clips mit Figuren aus der Serie «South Park» zu erstellen. Auch Pikachu, der sich selbst grilliert, oder Spongebob in brauner Uniform waren möglich. Es sind genau die Beispiele, die bereits beim Start von OpenAIs Sora für Schlagzeilen sorgten. Doch während die KI bei Comicfiguren locker ist, greifen bei echten Menschen harte Filter. Prompts wie «Zeig mir Promi X, der Y macht» wurden strikt blockiert.
Das hat einen ernsten Grund: Ein Tool, das die Realität so einfach verbiegen kann, öffnet Tür und Tor für gefährliche Manipulationen, sogenannte Deepfakes. Was, wenn der CEO eines grossen Konzerns in einem täuschend echten Video den Konkurs verkündet? Das könnte schnell Panik an der Börse auslösen. Dabei kann Omni theoretisch auch Speech-Editing, also Lippenbewegungen und Stimmen manipulieren. In der ersten öffentlichen Version ist diese Funktion gesperrt. Entwickler Dumitru Erhan sagt: «Das Modell kann viel mehr, als wir gerade veröffentlichen.» Eine Aussage, die ebenso ehrlich wie beunruhigend ist.
Ein unsichtbarer Stempel
Eine Ausnahme macht Google beim sogenannten Avatar: User nehmen Gesicht und Stimme auf, die KI erstellt dann die digitale Kopie. Zur Verifikation muss man eine Reihe von Zahlen laut vorlesen. In der Schweiz und der EU ist diese Funktion allerdings nicht verfügbar, wohl aus rechtlichen Gründen, da die Stimme und das Gesicht als sensible biometrische Daten gelten.
Zur Kennzeichnung der KI-Videos nutzt Google SynthID: ein unsichtbares Wasserzeichen direkt in den generierten Pixeln. Künftig soll man in Suche und Chrome per Rechtsklick prüfen können, ob ein Video echt ist; auf Android hilft «Circle to Search». OpenAI, Elevenlabs und Kakao haben die Technik ebenfalls übernommen. Noch erkennen die Prüf-Tools nur Inhalte innerhalb der eigenen Mauern. Längerfristig soll dies plattformübergreifend sein. Der Haken: Open-Source-Modelle ausserhalb dieser Partnerschaften produzieren weiterhin Inhalte ohne diesen unsichtbaren Stempel. Und auch SynthID ist nicht absolut fälschungssicher.
OpenAI killte Sora
Dass Google sein Tool jetzt so offensiv pusht, hat auch mit dem Scheitern der Konkurrenz zu tun. OpenAI hat den Videogenerator Sora im März 2026 überraschend gekillt. Die App ist bereits abgeschaltet, und ein geplanter Milliarden-Deal mit Disney platzte. Die Gründe waren wirtschaftlich: Die Generierung der Clips verschlang gigantische Rechenleistung und viel Geld. Zudem sorgten Deepfakes von Prominenten nach dem Start des Tools für schlechte PR. Während Sora jetzt im Giftschrank verschwindet, ist Google mit seinem Ansatz der lachende Dritte.
Google hat Omni Flash direkt nach der Entwicklerkonferenz I/O lanciert, integriert in die Gemini-App und die Kreativ-Suite «Flow». Hier haben nur zahlende Nutzer Zugriff. Auf Youtube ist Omni Flash im Bereich Shorts kostenlos nutzbar. Später soll eine leistungsstärkere Pro-Version folgen. Diese wird bereits intern getestet. Das neue Modell kann mehr, als lustige Affenvideos auszuspucken: Das Weltverständnis von Omni fliesst laut Brichtova auch in andere Produkte: etwa Waymo, den Robotaxidienst des Anbieters.