Nvidia GTC 2026
Warum dein ChatGPT bald viel schneller antworten könnte

Nvidia kontrolliert 80 Prozent des KI-Chip-Markts und hat seinen Umsatz in vier Jahren verachtfacht. Am Montag zeigte Konzernchef Jensen Huang in San Jose, wohin die Reise geht.
Kommentieren
1/6
Ganz in Schwarz, mit Turnschuhen und Lederjacke: Das Lieblingstenue von Jensen Huang, CEO der wertvollsten Firma der Welt, Nvidia.
Foto: AP

Darum gehts

KI-generiert, redaktionell geprüft
  • Nvidia stellt neue Chip-Plattform Vera Rubin für Rechenzentren vor
  • Der KI-Markt verschiebt sich: Anwendung wird wichtiger als Training
  • Nvidias grösste Kunden bauen längst eigene Konkurrenz-Chips
War diese Zusammenfassung hilfreich?
Externe Inhalte
Möchtest du diesen ergänzenden Inhalt (Tweet, Instagram etc.) sehen? Falls du damit einverstanden bist, dass Cookies gesetzt und dadurch Daten an externe Anbieter übermittelt werden, kannst du alle Cookies zulassen und externe Inhalte direkt anzeigen lassen.
nnnnnnn.jpg
Tobias BolzernRedaktor Digital

Der mächtigste Chipkonzern der Welt hat an seiner Entwicklerkonferenz die nächste Generation seiner KI-Technik vorgestellt. Die wichtigste Botschaft des dreistündigen Events: KI-Antworten sollen schneller und günstiger werden.

Nvidia-Chef Jensen Huang (63) sprach am Montag vor Tausenden Entwicklern in San Jose, Kalifornien. Huang ist der Mitgründer und Chef von Nvidia, dem wertvollsten börsenkotierten Unternehmen der Welt. Seine jährliche Keynote an der GTC-Konferenz gilt in der Techbranche als wichtiger Termin. Wieso? Nvidia stellt die Chips her, auf denen die grossen KI-Systeme laufen: ChatGPT, Googles Gemini, Microsofts Copilot. Ohne Nvidia-Hardware funktioniert heute kaum ein KI-Dienst. Der Konzern kontrolliert rund 80 Prozent dieses Markts und hat seinen Jahresumsatz in vier Jahren von 27 auf 216 Milliarden Dollar verachtfacht.

Ein Problem für Nvidia

Doch die Branche verändert sich. Bisher floss das grosse Geld ins Training von KI-Modellen – also in das Beibringen. Jetzt verlagert sich der Bedarf auf die Anwendung: Hunderte Millionen Nutzer stellen Fragen, lassen Texte schreiben, Bilder erzeugen. Diesen Vorgang nennt die Branche Inferenz. Laut Schätzungen von Deloitte macht Inferenz 2026 bereits rund zwei Drittel aller KI-Rechenleistung aus. Gegenüber nur einem Drittel im Jahr 2023.

Das Problem für Nvidia: Bei der Inferenz wächst die Konkurrenz. Google und Amazon bauen längst eigene Chips, die für bestimmte Aufgaben günstiger arbeiten. Nvidias grösste Kunden werden damit zu seinen gefährlichsten Rivalen. Huangs Antwort ist die neue Plattform Vera Rubin, benannt nach der Astronomin Vera Rubin (1928-2016). Das Gesamtsystem mit mehreren Chips vereint Training und Inferenz. Neu darin ist die Technik des Start-ups Groq, dessen Chips Nvidia im letzten Jahr für 20 Milliarden Dollar lizenziert hat. Groqs Spezialchips beschleunigen die Reaktionszeit von KI-Systemen. Huang versprach dabei eine 35-fache Leistungssteigerung – allerdings nur für einen spezifischen Anwendungsfall.

Roche rüstet mit Nvidia auf

Der Basler Pharmariese Roche will seine KI-Infrastruktur massiv ausbauen. Über 2000 neue Hochleistungsprozessoren vom US-Chipgiganten Nvidia kommen hinzu. Der Konzern kommt damit auf über 3500 sogenannte Blackwell-GPUs. Laut eigenen Angaben ist das die grösste GPU-Infrastruktur, die je einem Pharmaunternehmen zur Verfügung stand. Die Plattform soll KI-gestützte Laborprozesse, digitale Zwillinge zur Produktionsoptimierung und automatisierte Bildanalyse in der Diagnostik ermöglichen. Das Ziel: Medikamente und Diagnoseverfahren schneller zur Marktreife bringen. Die Partnerschaft mit Nvidia besteht seit 2023.

keystone-sda.ch

Der Basler Pharmariese Roche will seine KI-Infrastruktur massiv ausbauen. Über 2000 neue Hochleistungsprozessoren vom US-Chipgiganten Nvidia kommen hinzu. Der Konzern kommt damit auf über 3500 sogenannte Blackwell-GPUs. Laut eigenen Angaben ist das die grösste GPU-Infrastruktur, die je einem Pharmaunternehmen zur Verfügung stand. Die Plattform soll KI-gestützte Laborprozesse, digitale Zwillinge zur Produktionsoptimierung und automatisierte Bildanalyse in der Diagnostik ermöglichen. Das Ziel: Medikamente und Diagnoseverfahren schneller zur Marktreife bringen. Die Partnerschaft mit Nvidia besteht seit 2023.

Tokens als Bonusleistung

Wie wichtig diese Rechenleistung wird, machte Huang mit einem ungewöhnlichen Vergleich deutlich. Künftig werde jede Entwicklerin, jeder Entwickler ein jährliches Budget an Tokens erhalten – zusätzlich zum Gehalt. «Wie viele Tokens im Jobangebot enthalten sind, ist bereits ein Rekrutierungsthema im Silicon Valley», sagte Huang. Tokens sind die Recheneinheit der KI: Jedes Wort, das eine KI verarbeitet oder erzeugt, verbraucht Tokens – vergleichbar mit Kilowattstunden beim Strom.

Für Nutzerinnen und Nutzer heisst das konkret: Die KI-Dienste, die viele täglich verwenden, dürften mittelfristig schneller und günstiger werden. Direkt spürbar wird das nicht sofort – die neuen Chips kommen erst in der zweiten Jahreshälfte auf den Markt. Greifbarer war eine Neuheit für Gamer: Eine Technik namens DLSS 5 berechnet Spielegrafik per KI in Echtzeit neu – mit deutlich realistischerer Beleuchtung. Sie erscheint im Herbst, läuft aber nur auf der neuesten Grafikkartengeneration.

Was sagst du dazu?
Heiss diskutiert
    Meistgelesen