Qu’est-ce que l’Edge AI ?

La combinaison de l’intelligence artificielle (IA) et de l’informatique en périphérie marque une évolution vers le traitement des données à la source. L’Edge AI permet d’obtenir des informations et de prendre des décisions immédiates là où les données sont générées, en minimisant la latence et en améliorant la confidentialité. Le traitement local des données réduit la nécessité d’une transmission constante vers des centres de données centralisés, ce qui modifie la dynamique des processus de prise de décision dans tous les secteurs d’activité.

Qu’est-ce que la quantification de modèle et comment fonctionne-t-elle ?

La quantification des modèles est une technique utilisée pour réduire la taille et augmenter l’efficacité des modèles d’intelligence artificielle (IA), ce qui les rend aptes à être déployés sur des appareils périphériques, qui ont souvent des ressources informatiques et une capacité de stockage limitées. La quantification du modèle consiste essentiellement à convertir les poids du modèle et, éventuellement, les activations de la représentation en virgule flottante, qui utilise généralement 32 bits de données, en un format de précision inférieure, tel que les entiers de 16 bits, les entiers de 8 bits, voire moins.

La quantification du modèle modifie les modèles d’IA pour les adapter au déploiement en périphérie, en réduisant la précision des données numériques pour diminuer la taille du modèle avec une perte de précision minimale. Des techniques telles que la quantification post-entraînement généralisée (GPTQ), l’adaptation de faible rang (LoRA) et l’adaptation de faible rang quantifiée (QLoRA) optimisent l’efficacité des calculs et garantissent la portabilité des modèles sur divers appareils périphériques. Grâce à la quantification, les modèles s’adaptent mieux aux ressources informatiques limitées des appareils périphériques, ce qui permet de maintenir les performances tout en garantissant un traitement des données plus rapide et plus efficace.

La mise en œuvre de l’Edge AI présente des avantages concrets

Temps de latence réduit pour une prise de décision en temps réel

Le traitement local des données réduit considérablement le temps nécessaire pour obtenir des informations, ce qui permet de prendre des mesures et des décisions instantanément. Par exemple, dans les véhicules autonomes, l’edge AI traite les données sensorielles en temps réel pour prendre des décisions de conduite immédiates, améliorant ainsi la sécurité et les performances de conduite.

Réduction des coûts grâce à la minimisation de la transmission des données

Les coûts d’exploitation diminuent du fait que les données ne doivent plus transiter entre le nuage et l’ordinateur. Pour les entreprises qui déploient des systèmes IdO à grande échelle, comme celles des villes intelligentes, les économies sont substantielles lorsque l’analyse des données se fait sur l’appareil, ce qui réduit les dépenses de stockage et de traitement dans le nuage.

Amélioration de la protection de la vie privée et de la sécurité

Le fait de conserver les données sur l’appareil protège les informations sensibles contre d’éventuelles violations pendant la transmission. Dans le domaine des soins de santé, par exemple, les données des patients collectées par les dispositifs portables peuvent être analysées localement, ce qui garantit la confidentialité et la sécurité des informations personnelles sur la santé. Compte tenu des réglementations de plus en plus nombreuses dans le domaine des soins de santé, il s’agit d’une innovation très puissante et utile.

Évolutivité grâce à des approches décentralisées

Un modèle décentralisé permet une mise à l’échelle sans les goulets d’étranglement des systèmes centralisés. Concrètement, dans le domaine de l’agriculture intelligente, des capteurs déployés dans de vastes exploitations agricoles collectent et traitent les données localement, ce qui permet une surveillance évolutive et précise sans encombrer les serveurs centraux.

Applications concrètes de l’Edge AI

Fabrication – Améliorer l’efficacité opérationnelle

L’Edge AI transforme la fabrication grâce à la maintenance prédictive, au contrôle de la qualité et à la détection des défauts. Par exemple, les capteurs installés sur les équipements permettent de prévoir les défaillances avant qu’elles ne se produisent, ce qui réduit les temps d’arrêt et les coûts de maintenance.

Soins de santé – Transformer les soins aux patients

Les dispositifs portables équipés d’une IA de pointe surveillent les signes vitaux en temps réel, offrant une vision sans précédent de l’état de santé du patient et permettant une intervention précoce. Ces dispositifs peuvent détecter des anomalies et alerter les prestataires de soins de santé, améliorant ainsi les résultats pour les patients.

Commerce de détail – Améliorer les systèmes de gestion des stocks

Dans le commerce de détail, les capteurs intelligents gèrent efficacement les stocks, en automatisant le contrôle des niveaux de stock et en alertant les responsables pour qu’ils réapprovisionnent les produits. Cette technologie minimise les ruptures de stock et le surstockage, optimisant ainsi les niveaux de stock.

Adapter les modèles d’IA au déploiement en périphérie

L’adaptation des modèles d’IA au déploiement en périphérie par le biais de la quantification des modèles nécessite un examen minutieux des contraintes et des exigences propres aux environnements en périphérie. Ces environnements sont caractérisés par une puissance de traitement et une mémoire limitées, ainsi que par une connectivité parfois intermittente, ce qui peut avoir un impact significatif sur les performances et la faisabilité du déploiement de modèles d’IA sophistiqués directement sur les appareils périphériques.

Le choix d’une technique de quantification appropriée est très important et doit être effectué avec soin, car il influence directement la précision, l’efficacité et l’efficience globale du modèle dans les scénarios de bordures.

Choisir la bonne technique de quantification

Le choix de la technique de quantification dépend de plusieurs facteurs liés au scénario de déploiement spécifique, notamment

Exigences en matière de précision du modèle: La mesure dans laquelle la précision du modèle peut être compromise pour des gains d’efficacité varie selon l’application. Par exemple, les applications impliquant un contrôle critique de la santé peuvent privilégier la précision plutôt que la réduction de la taille, ce qui nécessite une approche de quantification ayant un impact minimal sur la précision.

Capacités matérielles: Les capacités de calcul et de stockage des appareils de bord cibles jouent un rôle important dans la détermination de la méthode de quantification appropriée. Les appareils dotés d’un matériel plus avancé peuvent s’adapter à des formats de précision plus élevée, tels que la virgule flottante 16 bits, tandis que les appareils plus limités peuvent nécessiter une quantification plus agressive à des entiers de 8 bits ou moins.

Consommation électrique: Pour les appareils périphériques fonctionnant sur batterie, l’efficacité énergétique est primordiale. Les techniques de quantification qui réduisent les besoins de calcul peuvent prolonger considérablement la durée de vie des batteries, ce qui les rend préférables pour les appareils portables, les capteurs à distance et d’autres applications sensibles à la consommation d’énergie.

Exigences en matière de latence: Les applications qui exigent des réponses en temps réel ou quasi réel bénéficient de méthodes de quantification qui optimisent la vitesse. La réduction de la précision des calculs peut accélérer les temps d’inférence, ce qui permet de respecter des exigences strictes en matière de temps de latence.

L’avenir de l’informatique de pointe

L’investissement dans l’informatique de pointe devrait augmenter à mesure que ses avantages deviennent de plus en plus évidents. Les plateformes et les bases de données d’inférence sont essentielles pour soutenir le déploiement des applications d’intelligence artificielle en périphérie.

Le développement de plateformes de données unifiées devrait être une condition essentielle pour gérer les exigences de l’informatique de pointe, en fournissant un cadre cohésif pour l’excellence opérationnelle. L’inférence distribuée répond aux préoccupations en matière de confidentialité et de conformité, offrant une approche sécurisée de l’informatique en périphérie.

Conclusions

L’intégration de l’IA de pointe et de la quantification des modèles donne une nouvelle orientation à la technologie, offrant aux entreprises des possibilités d’amélioration de l’efficacité et un avantage concurrentiel. À mesure que ces technologies continuent de se développer, leur influence sur la transformation numérique et l’innovation s’accroît. Les entreprises qui intègrent des stratégies d’IA de pointe se positionnent à l’avant-garde du progrès technologique, prêtes à relever les défis d’un environnement numérique dynamique.

Tim Boesen

février 12, 2024

8 Min