L’industrie de l’IA vient de connaître une secousse. Une start-up chinoise, DeepSeek, a lancé un modèle d’IA générative qui suscite une grande attention, tant de la part des techniciens que des marchés. Ce modèle promet des performances de niveau américain pour une fraction du coût. Cela semble changer la donne, n’est-ce pas ? Peut-être. Mais prenons un peu de recul et examinons ce qui se passe réellement.

DeepSeek secoue le marché, mais les géants peuvent s’adapter rapidement

DeepSeek a fait la une des journaux en surpassant le ChatGPT de l’OpenAI. ChatGPT d’OpenAI d’OpenAI en termes de téléchargements d’applications. C’est impressionnant. Plus surprenant ? La réaction des investisseurs. L’action de Nvidia a perdu 17 % de sa valeur. Le Nasdaq a perdu 600 points. Les gens ont pensé qu’il s’agissait d’un « changement de paradigme de l’IA ». Mais voilà, il ne s’agit pas d’une avancée fondamentale dans le domaine de l’intelligence artificielle. Il s’agit d’une amélioration de l’efficacité.

La « sauce secrète » de DeepSeek est l’activation sélective. Au lieu d’exécuter l’intégralité du modèle pour chaque requête, il ne traite que les parties pertinentes. Cela permet de réduire les coûts, de diminuer le nombre de GPU et d’obtenir des réponses plus rapides. Intelligent. Mais aussi reproductible. Des entreprises comme Google, Meta et OpenAI disposent déjà de l’infrastructure nécessaire pour intégrer des techniques similaires. Lorsqu’elles le feront, DeepSeek perdra son avantage de pionnier.

« En réalité, les marchés ont tendance à réagir de manière excessive aux perturbations, et ce n’est pas différent. Les gains d’efficacité de DeepSeek sont réels, mais ils ne réécrivent pas les règles du jeu. Ils ne font que l’optimiser.

Réaction excessive des marchés et raisons pour lesquelles l’efficacité de l’IA n’est pas un jeu à somme nulle

La réaction du marché a été extrême, et peut-être malavisée. Certains investisseurs ont pensé que l’efficacité de DeepSeek signifiait que les grandes entreprises technologiques allaient soudainement cesser d’investir dans des infrastructures d’IA massives. Ce n’est pas ainsi que cela fonctionne.

Les innovations de DeepSeek améliorent l’évolutivité de l’IA, mais n’éliminent pas le besoin de calcul à grande échelle. L’IA est une course aux armements. Chaque gain d’efficacité est intégré dans la prochaine itération de modèles. Au lieu de rendre les centres de données obsolètes, les méthodes de DeepSeek vont probablement élargir l’adoption de l’IA, la rendant moins chère et plus répandue. Il s’agit d’une tendance haussière à long terme, et non d’une tendance baissière.

Chirag Dekate, de Gartner, l’affirme sans ambages : « Ce n’est pas un moment où le ciel nous tombe sur la tête ». Les entreprises ne vont pas mettre au rebut des années de R&D parce qu’une start-up a optimisé son processus. Au contraire, elles s’adapteront, s’intégreront et iront de l’avant, probablement plus fortes qu’avant.

DeepSeek réduit les coûts de l’IA pour tout le monde

Parlons maintenant de ce qui est réellement passionnant : DeepSeek a trouvé comment rendre l’IA moins chère et plus efficace. C’est important.

Il y a deux grandes victoires techniques à la clé :

  1. Passage de la précision FP32 (32 bits) à la précision FP8 (8 bits) : Imaginez que vous essayez de faire passer une flotte de camions sur une autoroute étroite. Une solution ? Réduire la taille des camions. C’est ce que fait le FP8 : il permet à la même mémoire de contenir plus de données, ce qui accroît l’efficacité.

  2. Optimisation du cache des valeurs clés : Au lieu de traiter une invite en une seule fois, DeepSeek la décompose en deux phases. Cela signifie moins de perte de mémoire et des réponses plus rapides.

Qu’est-ce que cela signifie pour les entreprises ? Des coûts de développement de l’IA moins élevés, moins de GPU nécessaires et une intégration plus rapide de l’IA dans les systèmes d’entreprise. Même les grands acteurs de l’IA bénéficient de ces techniques – DeepSeek les a peut-être rendues célèbres, mais tout le monde peut désormais les adopter gratuitement.

L’IA a toujours besoin de matériel, et DeepSeek n’y a rien changé

Certains ont pensé que les gains d’efficacité de DeepSeek signifiaient la fin de la domination des GPU. C’est tout simplement faux. L’IA fonctionne toujours sur du matériel. Et DeepSeek a toujours besoin de beaucoup beaucoup.

Malgré ses optimisations, le modèle de DeepSeek repose sur des milliers de GPU. Les accélérateurs d’IA tels que les microprocesseurs de Nvidia restent indispensables. Tout ce que DeepSeek a fait, c’est rendre l’IA un peu moins gourmande en énergie, et non pas rendre obsolète le besoin de matériel de haute performance.

C’est Chirag Dekate qui le dit le mieux : « Ce n’est pas comme s’ils avaient découvert une nouvelle technique qui a fait exploser tout cet espace ». L’IA a toujours besoin d’une grande puissance de calcul, et des entreprises comme Nvidia, AMD et la division TPU de Google continueront à stimuler l’innovation dans ce domaine.

« L’efficacité est certes utile, mais elle ne change pas les fondamentaux. L’IA fonctionne toujours sur du silicium ».

La question de la censure et de l’éthique

L’histoire de DeepSeek est aussi une histoire de censure. Les rapports suggèrent que le modèle filtre les contenus critiques à l’égard du gouvernement chinois, à moins qu’ils ne soient formulés de manière intelligente. C’est un problème.

Les entreprises qui envisagent d’adopter DeepSeek doivent se poser des questions difficiles. Qu’est-ce qui est filtré ? L’IA fonctionne-t-elle avec des préjugés cachés ? Si vous êtes une multinationale, pouvez-vous faire confiance à un modèle qui pourrait restreindre certains points de vue ? Bien que les réponses ne soient pas tout à fait claires, il s’agit d’une question qui mérite d’être examinée attentivement et testée avec des modèles concurrents.

Il y a aussi la façon dont DeepSeek a formé son modèle. Contrairement à la plupart des grands systèmes d’IA, il n’a pas tenu compte de l’avis des humains dans le processus de formation. Cela permet d’accélérer le processus, mais soulève des inquiétudes quant à la précision et aux considérations éthiques. Les modèles d’IA formés sans supervision humaine renforcent souvent les préjugés au lieu de les corriger.

Ben Thompson, un développeur d’IA, a averti que le fait de ne pas tenir compte de l’avis de l’homme pourrait créer des problèmes à l’avenir. John Belton, du fonds Gabelli, a également qualifié de trompeuse l’affirmation de DeepSeek selon laquelle le développement aurait coûté 6 millions de dollars, suggérant que des raccourcis ont pu être pris.

DeepSeek fait progresser l’IA pour tous

DeepSeek n’est pas susceptible de faire tomber OpenAI ou Google. Mais il est les obligeant à repenser l’efficacité. Tout le monde y gagne.

Les coûts de l’IA constituent un goulot d’étranglement majeur. DeepSeek vient de montrer qu’il est possible de les réduire rapidement. Cela va accélérer l’adoption de l’IA dans tous les secteurs, en la rendant plus accessible aux entreprises qui ne pouvaient pas se l’offrir auparavant.

Des entreprises comme OpenAI et Meta intégreront ces gains d’efficacité, ce qui signifie que l’IA deviendra plus rapide, moins chère et plus répandue. Même si DeepSeek ne domine pas le marché, son impact se fera sentir dans l’ensemble du secteur.

Comme le dit Chirag Dekate, « DeepSeek a développé des capacités spécifiques qui sont quantitatives : « DeepSeek a développé des capacités spécifiques qui sont quantitatives, et c’est quelque chose dont il faut s’inspirer. » En d’autres termes, les géants de l’IA prendront des notes, puis agiront.

Principaux enseignements pour les décideurs et les dirigeants

  • Innovation en matière d’efficacité : Le modèle de DeepSeek réduit considérablement les coûts opérationnels de l’IA en optimisant l’utilisation de l’ordinateur et de la mémoire. Les dirigeants devraient envisager d’intégrer des techniques similaires afin de réduire les dépenses et d’accroître l’efficacité.

  • Réaction du marché et adaptabilité : Le choc initial du marché, y compris une chute notable de 17 % de l’action de Nvidia, est probablement temporaire car les principaux acteurs peuvent rapidement reproduire ces gains d’efficacité. Les décideurs devraient considérer cette perturbation comme une volatilité à court terme plutôt que comme une menace à long terme.

  • L’investissement en matériel reste crucial : Malgré les gains d’efficacité, la dépendance à l’égard du matériel haute performance, comme les GPU, reste inchangée. Les dirigeants devraient continuer à investir dans une infrastructure d’IA robuste pour soutenir les avancées technologiques en cours.

  • Gouvernance et considérations éthiques : Les inquiétudes concernant le filtrage des contenus et l’absence de supervision humaine dans la formation des modèles mettent en évidence les risques potentiels en matière d’éthique et de conformité. Les dirigeants doivent évaluer rigoureusement les modèles d’IA pour s’assurer qu’ils respectent les normes réglementaires et préservent la transparence.

Tim Boesen

février 11, 2025

8 Min