OpenAI o1-preview a introduit un nouvel ensemble de capacités d’IA, conçues pour s’attaquer aux tâches de raisonnement les plus complexes dans les domaines de la science, du codage et des mathématiques.
Publiée le 12 septembre, cette série représente une avancée majeure dans les performances de l’IA, dépassant les limites des modèles précédents.

Le nouveau modèle est disponible à la fois dans ChatGPT et via l’API, offrant une phase initiale de prévisualisation avec des mises à jour régulières pour affiner ses performances.
Les futures mises à jour du modèle sont déjà en cours, avec des évaluations en cours pour une amélioration et un progrès continus.

Ce qui différencie OpenAI o1-preview de tout ce que vous avez vu auparavant

Les modèles OpenAI o1-preview font partie d’une nouvelle classe d’IA conçue pour gérer des tâches complexes et exigeantes en consacrant plus de temps à la réflexion sur les problèmes.
Contrairement à ses prédécesseurs, o1-preview ne se précipite pas pour produire des réponses ; il imite la résolution de problèmes à la manière humaine, où un raisonnement minutieux et des stratégies multiples sont appliqués avant d’arriver à une conclusion.

La nouvelle approche « penser d’abord » améliore la capacité du modèle à traiter des questions difficiles et à fournir des résultats précis dans différents domaines.

Avec la version initiale, OpenAI prévoit de mettre régulièrement à jour les modèles, en incorporant le retour d’information et les données de performance afin d’améliorer progressivement les capacités.
Les évaluations de ces futures mises à jour sont déjà en cours de développement, afin de s’assurer que chaque itération s’appuie sur les points forts de la précédente tout en comblant les lacunes ou les limites.

o1-preview d’OpenAI réfléchit en profondeur et résout des problèmes plus complexes

La force principale d’OpenAI o1-preview réside dans ses capacités améliorées de résolution de problèmes et de raisonnement.
Ces modèles sont entraînés à adopter une approche méthodique, en envisageant différents angles et possibilités avant de répondre.
Cette capacité à « réfléchir en profondeur » les rend bien mieux adaptés à la résolution de problèmes complexes dans les domaines de la science, du codage et des mathématiques.

  • L’étalonnage des performances : Les modèles o1-preview montrent des résultats comparables à ceux des étudiants en doctorat lorsqu’ils sont testés sur des tâches rigoureuses en physique, en chimie et en biologie.
    Par exemple, dans les problèmes de physique qui exigent généralement une compréhension approfondie et une réflexion analytique, o1-preview obtient des résultats similaires à ceux d’étudiants de troisième cycle avancés.
  • Améliorations spectaculaires en mathématiques : Lors d’un examen de qualification pour les Olympiades internationales de mathématiques (IMO), l’examen o1 a obtenu un score de 83 %, ce qui représente une amélioration spectaculaire par rapport aux 13 % de l’examen GPT-4o.
  • Les prouesses en matière de codage : Dans les compétitions de codage, les modèles o1-preview ont été évalués dans Codeforces, une plateforme connue pour ses défis en matière de programmation compétitive.
    Ils se sont classés dans le 89e percentile, soulignant leur capacité à générer et à déboguer efficacement des codes complexes.

Ce qu’OpenAI o1-preview ne peut pas encore faire mais apprend rapidement

Actuellement, le modèle o1-preview d’OpenAI ne prend pas en charge des fonctions telles que la navigation sur le web, le téléchargement de fichiers ou la gestion d’images.
Ces fonctionnalités sont essentielles pour de nombreux cas d’utilisation, mais l’accent mis sur les tâches de raisonnement complexes fait de o1-preview un outil spécialisé pour les scénarios nécessitant une réflexion critique et une analyse approfondie.

Malgré ces limitations, le modèle surpasse GPT-4o dans la gestion des tâches de raisonnement complexes.
L’absence de certaines caractéristiques n’enlève rien à sa force principale : sa capacité à résoudre des problèmes plus difficiles avec une plus grande précision.

Les méthodes innovantes d’OpenAI o1-preview en matière de sécurité et de protection de vos données

OpenAI a introduit une nouvelle approche de formation à la sécurité qui utilise les capacités de raisonnement avancées du modèle pour rester aligné sur les lignes directrices en matière de sécurité et d’éthique.
Cette méthode améliore la capacité du modèle à identifier et à éviter les contenus nuisibles pour des interactions plus sûres avec les utilisateurs.

  • Résistance au « jailbreaking » : L’o1-preview a montré une nette amélioration dans la résistance aux tentatives non autorisées de contournement de ses mesures de sécurité, connues sous le nom de « jailbreaking ».
    Lors de l’un des tests de jailbreaking les plus difficiles, le modèle a obtenu un score de 84 sur 100, contre 22 pour le GPT-4o, ce qui indique un niveau plus élevé de résistance à la manipulation et, en fin de compte, une réduction du risque d’utilisation abusive.
  • Protocoles de sécurité stricts : L’OpenAI a renforcé sa gouvernance interne en collaborant étroitement avec les agences fédérales et en améliorant la surveillance grâce à des cadres tels que le Preparedness Framework.
    Parmi les mesures de sécurité supplémentaires, on peut citer le « red teaming » (processus au cours duquel le modèle est testé de manière rigoureuse pour trouver les vulnérabilités) et la supervision du comité de sûreté et de sécurité au niveau du conseil d’administration.

Comment les partenariats mondiaux contribuent à rendre OpenAI o1-preview plus sûre

Pour mieux sécuriser les modèles, OpenAI a conclu des accords formels avec des instituts de sécurité de l’IA aux États-Unis et au Royaume-Uni.
Ces partenariats visent à rendre opérationnels les protocoles de sécurité en accordant à ces instituts un accès anticipé à une version de recherche du modèle.

Cet accès permet de procéder à des évaluations et à des tests rigoureux, afin d’identifier les problèmes potentiels avant la diffusion publique.

L’objectif est de mettre au point des protocoles d’essai complets pouvant servir de norme pour les futurs modèles, afin de s’assurer que chaque nouvelle itération améliore les capacités et s’aligne sur des normes de sécurité strictes.

Qui devrait se réjouir de l’OpenAI o1 et quel sera son impact sur eux ?

Les modèles OpenAI o1 sont conçus pour répondre aux besoins des professionnels confrontés à la résolution de problèmes complexes dans de nombreux domaines :

  • Recherche dans le domaine de la santé : OpenAI o1 peut aider les chercheurs à analyser et à annoter des ensembles de données massifs, tels que les données de séquençage cellulaire, avec une rapidité et une précision accrues.
  • Physique et recherche quantique : Les physiciens peuvent utiliser o1 pour générer et résoudre des formules mathématiques complexes nécessaires à la recherche avancée dans des domaines tels que l’optique quantique.
  • Développement de logiciels : Les développeurs peuvent créer et déboguer plus efficacement des flux de travail à plusieurs étapes, grâce aux capacités avancées de codage et de raisonnement du modèle.

OpenAI o1-mini est un bon choix pour les tâches d’IA à petit budget

OpenAI o1-mini offre une alternative plus accessible au modèle o1-preview, spécialement conçu pour le codage et les tâches de raisonnement ciblées.

En tant que version plus petite et plus rapide, o1-mini est 80 % moins cher, ce qui en fait une option attrayante pour les applications où la rentabilité est essentielle.
Bien qu’il n’ait pas la même connaissance du monde que son grand frère, il excelle dans les tâches ciblées et axées sur le raisonnement, en particulier dans le domaine du codage.

Qui peut commencer à utiliser OpenAI o1 maintenant et à quoi s’attendre ?

OpenAI déploie progressivement l’accès aux modèles o1 :

  • Accès immédiat pour les utilisateurs Plus et Team : Les utilisateurs de ChatGPT Plus et Team peuvent sélectionner manuellement les modèles o1-preview ou o1-mini dès aujourd’hui, avec des limites hebdomadaires de 30 messages pour o1-preview et de 50 pour o1-mini.
  • Accès prochain pour les utilisateurs Enterprise et Edu : A partir de la semaine prochaine, les utilisateurs de ChatGPT Enterprise et Edu auront également accès aux deux modèles.
  • Accès à l’API pour les développeurs : Les développeurs de niveau 5 peuvent commencer à utiliser les deux modèles dès maintenant, avec une limite de 20 requêtes par minute (RPM).
    Notez que les fonctionnalités actuelles de l’API ne comprennent pas l’appel de fonction, la diffusion en continu ou la prise en charge des messages système.

L’avenir de l’OpenAI o1, encore plus puissant et accessible

OpenAI prévoit d’augmenter le nombre de messages et de permettre à ChatGPT de sélectionner automatiquement le meilleur modèle pour un message donné.
Les prochaines mises à jour introduiront des fonctionnalités de navigation, de téléchargement de fichiers et de traitement d’images, élargissant ainsi les applications pratiques des modèles o1.

Le développement continu vise à maintenir la série OpenAI o1 et la série GPT à la pointe de la technologie de l’IA.
Les mises à jour prévues apporteront de nouvelles fonctionnalités, des protocoles de sécurité améliorés et une plus grande accessibilité, faisant de ces modèles des outils encore plus polyvalents et puissants pour les utilisateurs du monde entier.

Tim Boesen

septembre 18, 2024

8 Min