Une question à plusieurs centaines de milliards
Les mensonges autour de la durée de vie d'une puce IA effritent le secteur

La durée de vie des puces IA suscite des doutes croissants. Des experts remettent en question les estimations optimistes des géants technologiques, suggérant une obsolescence plus rapide.
Des doutes émergent quant à la durée de vie des puce IA.
Photo: Getty Images
Post carré.png
AFP Agence France-Presse

Ils sont de plus en plus nombreux à mettre en doute les estimations, jugées trop optimistes, des grands acteurs de l'intelligence artificielle (IA) quant à la durée de vie des puces spécialisées, prévenant que le réveil pourrait être brutal et coûteux. Une «fraude», voilà comment le célèbre investisseur Michael Burry, popularisé par le film «The Big Short», a décrit ce phénomène sur X début novembre.

Avant la déferlante qui a suivi l'arrivée de ChatGPT, les géants de l'informatique à distance (cloud) avaient revu à la hausse la longévité moyenne de leurs équipements (puces et serveurs), la portant, pour la plupart d'entre eux, à six ans.

Une puce vedette

Mais «la combinaison de l'usure et de l'obsolescence technologique rendent assez irréaliste cet horizon de six ans», estime Mihir Kshirsagar, du Centre de politique des technologies de l'information (CITP), à l'université de Princeton. D'un côté, le cycle d'innovation des grands noms des processeurs s'est nettement accéléré.

Moins d'un an après le lancement de sa nouvelle puce vedette, la Blackwell, le poids lourd du secteur, l'Américain Nvidia, a annoncé en septembre l'arrivée en 2026 de la Rubin, aux performances 7,5 fois supérieures. A ce rythme, «au bout de trois à quatre ans, la valeur des puces est de 10% à 15%» de leur prix originel, fait valoir Gil Luria, de la société de conseil financier D.A. Davidson.

Taux de défaillance élevé

En mars, Jensen Huang, patron de Nvidia, a expliqué que lorsque sa gamme Blackwell est sortie, en début d'année, «plus personne ne voulait des Hopper», la précédente génération. «Il y a des cas dans lesquels les Hopper conviennent», s'est-il repris, «mais pas beaucoup».

En outre, les processeurs IA, appelés GPU (graphics processing unit), «connaissent un taux de défaillance plus élevé que par le passé», ajoute Gil Luria. «Ils montent tellement en température que parfois, ils peuvent être endommagés» définitivement. Une récente étude publiée par Meta sur son modèle d'IA Llama a mis en évidence un taux de défaillance de 9% par an.

Bénéfices amputés

Pour Mihir Kshirsagar, tout comme pour Michael Burry, l'espérance de vie réelle de ces puces est, en réalité, de deux ou trois ans. En novembre, dans une communication au ton très inhabituel pour le groupe, Nvidia a défendu la projection de 4 à 6 ans pour un GPU, assurant qu'elle s'appuyait sur «des tendances de longévité et d'utilisation constatées dans le monde réel».

Mihir Kshirsagar estime qu'en retenant des hypothèses beaucoup plus optimistes que les siennes, les géants de la tech créent les conditions du développement d'un écosystème IA centré autour d'eux grâce à des coûts «artificiellement bas».

Ces estimations généreuses ont, par ailleurs, un effet direct sur les comptes d'une entreprise. Plus longtemps les puces tournent, plus le bénéfice gonfle. Si cette durée estimée était réduite, «cela affecterait immédiatement le résultat» et amputerait les bénéfices, prévient Jon Peddie, du cabinet Jon Peddie Research. «C'est ce qui arrive quand on prend des libertés avec sa comptabilité.»

Besoin d'argent

L'analyste Gil Luria ne craint pas pour les conglomérats comme Amazon, Google ou Microsoft, qui ont d'autres sources de revenus que l'IA ou même que le cloud, mais davantage pour les spécialistes comme Oracle ou CoreWeave.

Tous deux sont déjà considérablement endettés et achètent des puces à tour de bras pour mieux se positionner vis-à-vis des clients du cloud. «Pour bâtir leurs centres de données», ils «ont besoin de lever de l'argent», rappelle Gil Luria. «Mais s'ils ont l'air moins rentables» car ils doivent remplacer leur matériel plus fréquemment, «cela va devenir plus dur et plus cher pour eux d'emprunter».

D'autant que certains prêts sont garantis par les puces elles-mêmes. Certains voient une porte de sortie dans la revente des puces ou leur redéploiement sur d'autres fonctions que l'IA la plus avancée. «Un GPU de 2023», dit Jon Peddie, «s'il est toujours rentable économiquement, peut être affecté à des tâches de moindre niveau ou comme infrastructure de secours.»

Articles les plus lus