Darum gehts
- Google präsentiert am 20. Mai KI-Agenten für alltägliche Aufgaben
- Forschungsstudie zeigt erhebliche Mängel bei KI-Agenten in der Praxis
- Bestes KI-Modell erreichte nur 25 Prozent Erfolgsquote bei Aufgaben
Google rief am Dienstag auf seiner Entwicklerkonferenz I/O die Ära der «handelnden KI» aus. Die neue KI-Suchmaschine soll nicht mehr nur Antworten liefern, sondern gleich selbst aktiv werden: Tickets buchen, Preise überwachen, Einkäufe abwickeln.
«Wir formen Gemini zum Weltmodell, das planen und Neues ersinnen kann», sagte Googles-DeepMind-Chef Demis Hassabis. Ziel: Universal-Agenten auf allen Geräten.
Hype im Echo-Raum
Was Google zelebriert, kennt man bereits von der Konkurrenz. OpenAI testet seit Januar Operator in den USA. Dieser KI-Agent füllt Formulare aus, navigiert Websites und soll eines Tages als KI-Angestellter Tausende Dollar im Monat kosten. Der OpenAI-Chef Sam Altman frohlockt: «Der nächste Durchbruch sind KI-Agenten.»
Ein Team der Carnegie-Mellon-Universität nahm die Marketing-Rhetorik wörtlich. Die Forschenden gründeten eine fiktive Firma, besetzten alle Posten mit KI-Agenten – vom Projektleiter bis zum Entwickler. Ergebnis: vernichtend. Die Agenten logen, verirrten sich in Ordnern, kapitulierten vor simplen Pop-ups. Das beste Modell, Claude 3.5, traf nur in jedem vierten Fall ins Ziel. Gemini kam auf elf Prozent, ChatGPT gar nur auf einstellige Werte.
Kurz: Solche Aussetzer machen den digitalen KI-Butler zur potenziellen Gefahrenquelle, besonders bei Geld oder persönlichen Daten. Wer blind vertraut, riskiert Chaos statt Komfort.
Beta-Ware KI-Agent
Die Tech-Riesen wissen das. Darum starten sie ihre Agenten in stark begrenzten Tests, Englisch zuerst, USA zuerst. Auch bei Google bleibt vieles noch Beta, wie die I/O gezeigt hat. Bis also Schweizer Firmen einem KI-Assistenten komplexe Aufgaben anvertrauen, vergeht wohl noch viel Zeit und es braucht Beweise, dass die Systeme verlässlich, sicher und transparent arbeiten.
Fazit: Das Marketing verkauft eine Zeitenwende, die Firmen liefern zu oft Baustellen. Kritische Nutzer sollten den Hype von der Handlungsfähigkeit trennen und die KI-Bots erst dann für sie arbeiten lassen, wenn sie das Einmaleins des Alltags beherrschen.