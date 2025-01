1/4 Avec une baleine comme logo, Deepseek est effectivement un gros morceau dans la mer des IA. Photo: Anadolu via Getty Images

Thomas Benkö

Après TikTok, une nouvelle application chinoise plonge l’industrie technologique américaine dans la crise. La petite bombe s’appelle DeepSeek, une intelligence artificielle (IA) performante et bon marché. C'est elle qui a fait chuter Wall Street. A la clôture des marchés lundi, le Nasdaq enregistrait une baisse de plus de 3%, effaçant plus de 1000 milliards de dollars de la valeur totale des entreprises technologiques. Nvidia, en particulier, a perdu 17 % de sa valeur, soit 600 milliards de dollars, établissant un record historique de perte individuelle. Le géant des semi-conducteurs a également cédé sa place de leader mondial à Apple.

1 Pourquoi tout le monde parle de DeepSeek?

DeepSeek a commencé à faire parler d’elle fin 2024, mais c’est la semaine dernière que les tests de performance de son modèle R1 Reasoning ont attiré l’attention du monde entier. Capable de rivaliser avec OpenAI ou Llama, DeepSeek surpasse même ses concurrents dans certains domaines comme la programmation et les mathématiques. Le tout, avec un argument imparable: l’accès à l’IA est gratuit, contrairement aux alternatives américaines.

2 Les sanctions américaines ont-elles stimulé son succès?

Ironiquement, oui. Comme DeepSeek n'a pas pu acheter les meilleures puces IA de Nvidia, les créateurs ont dû faire preuve de créativité:

Précision réduite: en baissant la précision des données de 32 à 8 décimales, les besoins en mémoire ont été réduits de 75%, sans perte significative de précision.

Traitement multi-tokens: plutôt que de traiter les textes mot à mot, DeepSeek analyse des phrases entières, doublant ainsi la vitesse de traitement.

Activation sélective des paramètres: seuls 37 milliards des 671 milliards de paramètres sont activés simultanément, augmentant encore l’efficacité.

Ces innovations remettent en question l’efficacité des sanctions américaines et pourraient redéfinir la compétition entre les deux puissances.

3 Qui a inventé DeepSeek?

En 2015, trois ingénieurs de l'Université de Zhejiang ont créé le fonds spéculatif appelé High-Flyer, qui a franchi en six ans la barre des 100 milliards de yuans – environ 14 milliards de dollars. Liang Wenfeng, l'un de ses fondateurs, a créé en avril 2023 l'entreprise DeepSeek. Ce projet d’IA, initialement considéré comme un passe-temps excentrique, s’est transformé en révolution technologique.

4 A quoi ressemble son fondateur?

Contrairement à d'autres patrons du monde de l'IA, Liang Wenfeng évite les projecteurs. On trouve peu de photos de lui sur le web. D'où le fait curieux que la plupart du temps, c'est un homonyme de lui qui apparaît dans Google. Le «vrai» Liang Wenfeng est ici à droite sur la photo.

Exactement ! A droite, le «vrai» Liang Wenfeng.

5 DeepSeek est-elle vraiment économique?

Selon ses créateurs, l’entraînement de l’IA n’a coûté que 5,6 millions de dollars – une somme dérisoire comparée aux budgets de 100 millions à 1 milliard nécessaires pour les modèles concurrents. Cela a été possible grâce à 2048 GPU H800 «allégés» de Nvidia (unité de calcul assurant les fonctions de calcul de l'image), bien loin des 100'000 GPU souvent utilisés ailleurs.

6 Les rumeurs concernant les 50'000 processeurs haut de gamme sont-elles fondées?

Tout le monde ne croit pas au miracle d'une IA bas de gamme. «DeepSeek a 50'000 GPU Nvidia H100 en service», a déclaré Alexandr Wang, CEO de Scale AI, à la chaîne de télévision CNBC lors du WEF. En raison des sanctions américaines, l'entreprise chinoise n'avouerait pas avoir utilisé ces puces haut de gamme. Coût du matériel: environ deux milliards de dollars! Elon Musk, l'homme le plus riche du monde et lui-même dans le secteur de l'IA, croit également à cette rumeur. Sous un tweet correspondant, il a écrit: «Obviously» (évident). Il n'existe toutefois aucune preuve de ces accusations.

7 Y a-t-il une censure chinoise sur DeepSeek?

DeepSeek applique une censure fluctuante: la semaine dernière, Blick pouvait encore parler du massacre de Tiananmen de 1989 à Pékin lors de son test avec DeepSeek. Maintenant, l'IA affiche le message suivant: «Désolé, cela dépasse mon domaine de compétence actuel. Parlons d'autre chose.» Pendant ce temps, l'IA donne des informations assidues sur l'assassinat de JFK.

8 DeepSeek est-elle un bon moyen pour traiter de sujets suisses?

En théorie, oui. DeepSeek comprend l'allemand et le français. Mais la question sur le président de la Confédération, qui change toujours chez nous, a posé des problèmes presque insolubles au modèle de raisonnement R1: DeepSeek a d'abord évoqué Alain Berset, qui occupait le poste en 2023. Puis, sur demande, Viola Amherd, la présidente de l'année dernière. Ce n'est qu'après des demandes répétées et l'activation manuelle de la recherche sur le web que la bonne réponse est arrivée: Karin Keller-Sutter.

9 DeepSeek est open source: qu'est-ce que cela signifie?

Open Source chez DeepSeek signifie que les modèles d'IA de l'entreprise sont accessibles au public et que chacun peut les utiliser, les adapter et les développer. Il n'y a pas de frais de licence pour les développeurs. Le modèle linguistique peut également être utilisé sur des ordinateurs personnels, ce qui augmente la sécurité des données.

10 Que conclure sur le bouleversement que produit DeepSeek?

Le monde peut apprendre de DeepSeek comment la créativité et l'efficacité peuvent surmonter les obstacles technologiques. Malgré des ressources limitées, le modèle montre que l'innovation n'est pas nécessairement liée à un matériel coûteux ou à des budgets énormes. Une précision réduite, une utilisation optimisée des paramètres et un traitement multi-tokens pourraient ouvrir la voie à des solutions d'IA plus rentables dans le monde entier – et permettre ainsi aux pays moins riches d'accéder à une technologie de pointe.