Défis posés par les coûts insoutenables des charges de travail d’IA

L’IA est à l’origine d’innovations incroyables, mais la mise à l’échelle des charges de travail d’IA sur les plateformes de cloud public devient rapidement un casse-tête financier pour les entreprises. Nous parlons ici de la formation de modèles d’IA avancés qui peuvent coûter des dizaines de millions de dollars, et ce avant de prendre en compte les dépenses permanentes pour le réglage fin, le recyclage et l’inférence. Une fois que vous passez de l’expérimentation en laboratoire au déployer l’IA à grande échelleces factures commencent à ressembler davantage à un passif qu’à un investissement.

N’oublions pas non plus l’augmentation globale des coûts de l’énergie. Les systèmes d’IA consomment d’énormes quantités d’énergie pour l’entraînement et le refroidissement. Lorsque vous faites tourner des centaines ou des milliers de GPU 24 heures sur 24 et 7 jours sur 7, les avantages économiques de la tarification à l’usage du cloud s’évanouissent assez rapidement. Le directeur financier commence à poser des questions difficiles.

Les données dressent un tableau clair. Selon IDC, les dépenses des entreprises en matériel de calcul et de stockage pour l’IA ont grimpé de 37 % au cours du premier semestre 2024. La majorité de ces dépenses (65 %) ont été consacrées à des systèmes basés sur l’IA dans des environnements cloud. Mais le hic, c’est que de plus en plus d’entreprises se retirent des solutions de cloud public, explorant des alternatives moins chères et plus efficaces.

« Alastair Edwards, analyste en chef chez Canalys, a parfaitement résumé la situation. Il a souligné que si les phases d’expérimentation et de formation de l’adoption de l’IA semblaient en valoir le coût, la charge financière à l’échelle de la production l’emporte sur les avantages. C’est un cas classique d’économie qui ne s’additionne pas ».

Popularité croissante des services de colocation et du GPU-as-a-Service

Les entreprises deviennent plus intelligentes dans leurs stratégies d’IA. Au lieu d’engloutir leur budget dans des factures de cloud public qui montent en flèche, elles se tournent vers les services de colocation, les fournisseurs de GPU-as-a-service et les modèles hybrides. Ces solutions permettent de maîtriser les coûts et les performances.

Qu’est-ce qui motive ce changement ? La flexibilité et l’efficacité. Ces fournisseurs construisent des infrastructures spécifiques à l’IA à partir de zéro. Pensez à des GPU à haute densité, à des configurations économes en énergie et à des systèmes de refroidissement liquide qui optimisent les exigences élevées de l’IA. Il s’agit d’un tout nouveau plan de jeu conçu pour la prochaine génération d’IA.

Des startups comme CoreWeave et Foundry sont à l’avant-garde. Elles misent beaucoup sur la capacité des GPU et proposent des tarifs à la carte qui rivalisent avec ceux des hyperscalers. Même des acteurs plus anciens comme Rackspace se lancent dans l’action, en déployant leurs propres offres de GPU-as-a-service. Ces options donnent aux entreprises ce qu’elles veulent vraiment : un meilleur contrôle et une voie claire vers la réduction des coûts à long terme.

Les entreprises s’intéressent également aux modèles de propriété ou de partage des ressources. Il ne s’agit plus d’économiser de l’argent, mais d’adopter une approche durable pour faire évoluer les charges de travail d’IA sans épuiser votre capital.

Limites des modèles de tarification basés sur la consommation pour l’IA à grande échelle

Le modèle de tarification basé sur sur Cloud fonctionne très bien – jusqu’à ce qu’il ne fonctionne plus. Bien sûr, il est facile d’activer des ressources pour une expérience d’IA rapide, mais la mise à l’échelle de ces systèmes pour des charges de travail lourdes et régulières est l’endroit où les choses s’effondrent.

L’IA à grande échelle exige une puissance de calcul énormece qui entraîne des coûts exorbitants. Vous ne pouvez pas vous fier à la promesse d’élasticité lorsque chaque heure d’utilisation du GPU grève votre budget. Le calcul ne fonctionne plus et les entreprises commencent à chercher des alternatives.

Les microclouds et les infrastructures hybrides font leur apparition. Elles sont à la fois moins chères et plus intelligentes. Elles fournissent des solutions évolutives, axées sur l’IA et adaptées à des opérations intensives et continues. Lorsque vous associez la maîtrise des coûts à la fiabilité opérationnelle, il n’est pas étonnant que ces options fassent l’objet d’une grande attention.

Les fournisseurs de cloud public ont bâti leur empire sur la flexibilité, mais les déploiements d’IA à long terme exigent plus que de la flexibilité. Ils nécessitent une prévisibilité financière, et c’est là que les hyperscalers ne sont pas à la hauteur.

Risque que les fournisseurs de clouds publics soient à la traîne des tendances du marché

Les fournisseurs de cloud public ne sont pas étrangers à l’innovation, mais leur incapacité à s’adapter aux grandes évolutions du marché devient un handicap. Ils ont raté le coche des stratégies multicloud, se sont fourvoyés dans le mouvement FinOps et semblent aujourd’hui dangereusement lents à répondre aux demandes spécifiques de l’IA.

C’est d’autant plus ironique que ce sont ces grandes entreprises qui ont été à l’origine de l’essor de l’IA. Mais leur focalisation sur les revenus à court terme issus des phases d’expérimentation signifie qu’ils risquent d’être dépassés par des acteurs plus légers et plus agiles. Les entreprises commencent à en avoir assez des coûts imprévisibles et du manque de personnalisation.

Les entreprises modifient leurs priorités. Elles veulent de la rentabilité, du contrôle et une infrastructure conçue pour évoluer sans se ruiner. Si les fournisseurs de clouds publics ne repensent pas rapidement leurs stratégies, ils se retrouveront sur la touche. L’histoire est pleine de géants qui n’ont pas su pivoter au moment le plus important. La question est de savoir si les hyperscalers d’aujourd’hui en tireront les leçons ou s’ils deviendront les témoins de l’histoire de demain.

Dernières réflexions

Alors que l’IA remodèle les industries à une vitesse fulgurante, la vraie question est la suivante : construisez-vous une infrastructure qui prospérera à long terme, ou vous accrochez-vous à des modèles qui ne pourront pas répondre aux exigences de demain ? Les marques qui réussiront ne se contenteront pas de s’adapter, elles redéfiniront entièrement les règles. Alors, que faites-vous aujourd’hui pour garder une longueur d’avance et vous assurer que vous ne vous contentez pas de suivre, mais que vous êtes à la pointe ? L’avenir de votre marché pourrait en dépendre.

Tim Boesen

janvier 2, 2025

5 Min