Rejoignez les newsletters quotidiens et hebdomadaires pour obtenir les dernières mises à jour et le contenu exclusif pour couvrir la principale intelligence artificielle de l’industrie. Apprendre encore plus


OpenAI a publié un nouveau modèle pour Amnesty International à temps pour faire face à la montée rapide de son adversaire open source Deepseek-R1, mais cela suffira-t-il pour atteindre le succès de ce dernier?

Aujourd’hui, après plusieurs jours de rumeurs et une anticipation accrue entre les utilisateurs de l’intelligence artificielle sur les réseaux sociaux, Openal pour la première fois O3-MiniLe deuxième modèle de sa nouvelle famille de « logiques » – des modèles qui prennent un peu plus de « réflexion », analysant leurs propres processus et réfléchissant à leurs « chaînes de pensée » avant de répondre aux demandes et aux entrées des utilisateurs avec de nouvelles sorties.

Le résultat est un modèle qui peut mener au niveau d’un doctorant ou même d’un titulaire d’un diplôme pour répondre à des questions difficiles en mathématiques, sciences, ingénierie et de nombreux autres domaines.

Le modèle O3-MinI est désormais disponible sur ChatGPT, y compris le niveau gratuit, sur l’interface d’application OpenAI (API). En fait, il s’agit des performances les plus basses, les plus rapides et plus que le modèle haut de gamme précédent, l’O1 d’OpenAI, et ses sœurs les plus rapides et le paramètre inférieur, O1-MINI.

Bien qu’il soit en partie comparé à Deepseeek-R1 – la date de libération est considérée par certains comme une réaction – il est important de se rappeler que O3 et O3-MinI ont été annoncés avant la publication de janvier de Deepseek R1, en décembre 2024, et que Le président Openai Sam Altman Executive Executive J’ai mentionné plus tôt sur x En raison des réactions des développeurs et des chercheurs, il arrivera à ChatGpt et Openai API en même temps.

Contrairement à Deepseek-R1, O3-Mini ne sera pas fourni en tant que modèle open source – qui signifie que le code ne peut pas être téléchargé pour une utilisation sans se connecter à Internet, ni personnalisé dans la même mesure, ce qui peut limiter son attractivité par rapport à Deepseek- R1 pour certaines applications.

Openai n’a fourni aucun autre détail sur l’ancien (supposé) modèle O3 qui a été annoncé à nouveau en décembre aux côtés d’O3-min. À ce moment-là, le modèle OpenAI du menu Drop-Down O3 Test a déclaré qu’il subirait « plusieurs semaines de retard » avant que les tiers puissent le tester.

Performances et fonctionnalités

Comme O1, Openai O3-Mini a été amélioré pour réfléchir aux mathématiques, au codage et aux sciences.

Ses performances sont similaires à l’Openai O1 lors de l’utilisation d’une tension de réflexion moyenne, mais il offre les avantages suivants:

  • 24% des temps de réponse plus rapides par rapport à O1-Mini (OpenAI n’a pas fourni de nombre spécifique ici, mais en regardant le groupe d’évaluation tiers Tests d’analyse artificielleLe temps de réponse d’O1-Mini est de 12,8 secondes pour recevoir et supprimer 100 icônes. Par conséquent, pour l’O3-min, la vitesse de la vitesse de 24% baissera le temps de réponse à 10,32 secondes.)
  • Une précision améliorée, les tests externes préfèrent les réponses O3-MinI 56% du temps.
  • 39% de moins que les principales erreurs des questions complexes du monde réel.
  • De meilleures performances dans les tâches de codage et les compétences scientifiques, en particulier lors de l’utilisation d’une tension de réflexion élevée.
  • Trois niveaux de réflexion (faible, moyen, élevé), permettant aux utilisateurs et aux développeurs d’atteindre un équilibre entre la précision et la vitesse.

Le modèle comprend également de grands critères, même O1 dans certains cas, selon le système O3-Mini OpenAI qui a été publié en ligne (qui a été publié avant d’annoncer la disponibilité du modèle officiel).

Concours de fenêtre O3-mini-le nombre de symboles intégrés qui peuvent entrer / directement dans une réaction – est de 200 000, avec un maximum de 100 000 par sortie. C’est la même chose que le modèle O1 complet et sa supériorité DibsicFenêtre de contexte R1 À partir d’environ 128 000/130 000 symboles. Cependant, beaucoup plus bas que la nouvelle fenêtre de contexte de Google Gemini 2.0 flash pensant jusqu’à un million d’icônes.

Alors que O3-Mini se concentre sur les capacités de pensée, il n’a pas encore de capacités de vision. Les développeurs et les utilisateurs qui ont hâte de télécharger des images et des fichiers devraient continuer à utiliser l’O1 entre-temps.

La compétition est chauffée

L’arrivée des marques O3-Mini pour la première fois OpenAI est disponible pour libérer le modèle de réflexion pour les utilisateurs gratuits de ChatGpt. L’ancienne famille O1 n’était disponible que pour Chatgpt Plus, Pro et d’autres plans, ainsi que via l’interface des applications OpenAI payante.

Comme ce fut le cas avec la force des grands modèles de langue (LLM) en lançant Chatgpt en novembre 2022, OpenAI a créé une catégorie complète de modèles de réflexion en septembre 2024 lorsqu’il a révélé O1, une catégorie de modèles avec un nouveau système de formation brun.

Mais Openai, conformément à son histoire moderne, n’a pas rendu O open source, contrairement à son nom et à sa mission de fondation originale. Au lieu de cela, gardez le symbole du modèle royal.

Au cours des deux dernières semaines, l’O1 a été submergé par la société chinoise Deepseek AI, qui a lancé le R1, qui est un modèle de réflexion très concurrentiel, et la source est largement ouverte à la liberté de prendre, et de la transformer et de le personnaliser par Toute personne dans le monde, utilise également gratuitement sur le site Deepseek sur l’application Web et mobile – il est dit que le modèle a été formé sur une petite partie du coût des autres meilleurs laboratoires.

Deepsek-R1 Conditions de l’Institut de technologie du MassachusettsApplication / site Web gratuit pour les consommateurs et la décision de fournir la base de code R1 disponible librement pour prendre et l’amender à une véritable explosion pour une utilisation sur les marchés et les institutions de consommation – même Investisseur Openai Microsoft Le supporter humain précipité d’Amazon pour en ajouter des variables à leurs marchés de nuages. Confusion, la société de recherche de l’intelligence artificielle, rapidement Il a été ajouté une variable aux utilisateurs.

Deepseek a également supprimé l’application ChatGpt iOS comme numéro 1 en American Apple App StoreIl est perceptible pour la supériorité d’Openai en connectant son R1 pour rechercher le Web dans son application et sur le Web. C’est quelque chose qu’Openai n’a pas encore fait pour l’O1, ce qui conduit à une anxiété plus technique parmi les travailleurs de la technologie et d’autres sur Internet que la Chine provoque ou surpasse les États-Unis à créer une intelligence artificielle – ou même dans la technologie en général.

Cependant, de nombreux chercheurs ont accueilli l’intelligence artificielle, les scientifiques et les VC les plus élevés tels que Marc Andresen, dans l’apparition de Deepseek, et ses sources ouvertes en particulier, car tous les bateaux sont soulevés dans le domaine de l’intelligence artificielle, qui a augmenté l’intelligence à la disposition de tout ce qui réduire les coûts.

Disponible en chatppt

O3 est maintenant lancé dans le monde pour le chatgpt gratuit, en outre, l’équipe et l’équipe professionnelle, avec des institutions et l’arrivée de l’éducation la semaine prochaine.

  • Les utilisateurs libéraux peuvent d’abord découvrir l’O3-MINI pour la première fois en sélectionnant le bouton « Mind » dans la barre de chat ou en renouvelant la réponse.
Écran Instantané de la barre Chatgpt avec le bouton « Cause ». Notez que la réclamation soumise dans la capture d’écran OpenAI indique « QI Dibsic accuse de faire Prenez les sorties d’Openai et utilisez-les pour former R1.
  • Les limites des messages 3x pour plus et les utilisateurs de l’équipe ont augmenté, de 50 à 150 messages par jour.
  • Les utilisateurs professionnels ont un accès illimité à O3-MinI et à une nouvelle variable, jusqu’au plus haut niveau, O3-MINI.

De plus, O3-MinI prend désormais en charge l’intégration de la recherche dans le chatppt, en fournissant des réponses avec des liens Web pertinents. Cette fonctionnalité est encore à ses débuts car OpenAI améliore les capacités de recherche grâce à des modèles de réflexion.

Intégration et prix de l’API

Pour les développeurs, O3-MinI est disponible via l’API, les assistants API, l’API et l’API. Le modèle prend en charge la convocation du travail, les sorties organisées et les développeurs RS, ce qui facilite l’intégration dans les applications du monde réel.

L’un des avantages les plus notables O3-MinI est sa rentabilité: il est 63% moins cher qu’Openai O1-MinI et 93% moins cher que l’O1 complet, à 1,10 $ / 4,40 $ par million de codes en / OUT (avec une remise de 50% du stockage temporaire).

Cependant, il continue de diminuer par rapport à la capacité de se permettre les coûts API DeepseekOffre R1 à 0,14 $ / 0,55 dollars par million d’icônes en / sortie. Mais étant donné que Deepseek est basé en Chine et est livré avec des problèmes de conscience géopolitique et de sécurité concernant les données des utilisateurs / institutions qui se déroulent vers le modèle et à l’étranger, OpenAI est susceptible de rester l’interface de programmation d’application préférée pour certains clients et institutions qui se concentrent sur la sécurité dans la États-Unis et Europe.

Les développeurs peuvent également ajuster le niveau de tension de pensée (faible, moyen, élevé) en fonction de leurs besoins d’application, permettant un contrôle supplémentaire du cumin et des corps de précision.

En sécurité, Openai dit qu’il utilise quelque chose appelé « alignement délibératif » avec O3-MinI. Cela signifie que le modèle a été invité à réfléchir aux lignes directrices de sécurité qui ont été écrites à la personne qui a été donnée et à mieux comprendre son intention et les dommages conçus pour empêcher et atteindre ses propres voies pour assurer la prévention de ces dommages . OpenAI dit qu’il permet au modèle d’être moins sensible lors de la discussion des sujets sensibles tout en maintenant la sécurité.

Openai affirme que le modèle surpasse le GPT-4O pour faire face aux défis de la sécurité et des corbeaux, et qu’il a effectué un large test externe pour la sécurité avant le problème aujourd’hui.

UN Le dernier rapport couvert dans Sans fil (Là où ma femme travaille) J’ai montré que Deepseek s’est rendu à chaque routeur de jailbreak et à une tentative de 50 chercheurs en sécurité, ce qui peut donner à Openai O3-Mini l’avantage sur Deepseek R1 dans les cas où la sécurité et la sécurité sont très importantes.

Quoi le suivant?

Le lancement de l’O3-Mini est les efforts plus larges d’Openai pour faciliter la logique avancée et coûteuse face à la concurrence la plus intense que jamais avant R1 de Deepseek et d’autres. Cela inclut Google, qui a récemment publié une version gratuite de Modering Model Gemini 2 Flash Thinking avec le contexte d’une entrée élargie de jusqu’à un million d’icônes.

En mettant l’accent sur la réflexion sur la STEM et la capacité de résister aux coûts, OpenAI vise à étendre la portée de la résolution des problèmes que l’IA entraîne à la fois dans les applications de consommation et les développeurs.

Mais lorsque l’entreprise devient plus ambitieuse que toujours, elle a récemment annoncé le projet d’infrastructure de données de 500 milliards de dollars appelé Stargate avec le soutien de SoftBank – La question reste de savoir si sa stratégie sera bien suffisante par des investisseurs profonds tels que Microsoft et d’autres VC.

Étant donné que les modèles ouverts de la source bloquent de plus en plus l’écart avec Openai en performance et sa supériorité du coût, les mesures de sécurité supérieures qui lui sont dites -Utiliser des interfaces pour maintenir les clients – en particulier dans l’institution – qui peut donner la priorité au coût et à l’efficacité de ces fonctionnalités? Comme toujours, nous signalerons les développements parce qu’ils sont révélés.