Artwork

Inhalt bereitgestellt von Choses à Savoir. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Choses à Savoir oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
Player FM - Podcast-App
Gehen Sie mit der App Player FM offline!

o3, le nouveau modèle surpuissant d’OpenAI ?

2:07
 
Teilen
 

Manage episode 458413106 series 2709331
Inhalt bereitgestellt von Choses à Savoir. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Choses à Savoir oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.

OpenAI frappe fort pour clore l’année 2024. À l’occasion de son opération "Ship-mas", l’entreprise a levé le voile sur o3, son dernier modèle d’intelligence artificielle, une véritable révolution. Contrairement à ses prédécesseurs, o3 ne se limite pas à prédire les mots suivants dans une phrase. Il décompose les problèmes en microtâches, expose son raisonnement et affiche des performances sans précédent.


En mathématiques, le modèle pulvérise les records, résolvant 25,2 % des énigmes les plus complexes, là où ses prédécesseurs plafonnent à 2 %. Lors de la compétition AIME 2024, il n’a raté qu’une seule question, et il excelle aussi en programmation : o3 améliore de 22,8 % les scores de codage SWE-Bench Verified. Avec un taux de réussite de 87,7 % au GPQA Diamond, il surclasse même les experts d’OpenAI. Pourtant, malgré l’enthousiasme, OpenAI joue la prudence. Le modèle n’est pas encore accessible au grand public. L’entreprise a opté pour une phase de tests rigoureux, baptisée "Public Safety Testing". Des chercheurs et participants inscrits pourront interagir avec o3 afin d’identifier et corriger d’éventuelles failles de sécurité avant un déploiement à grande échelle prévu en 2025.


Ces tests mettent particulièrement l’accent sur l’alignement délibératif : o3 doit analyser chaque requête pour vérifier sa conformité avec les politiques de sécurité d’OpenAI. Ce raisonnement actif, bien plus sophistiqué que les règles fixes des versions précédentes, marque une avancée majeure dans la maîtrise des risques liés à l’IA. Avec o3, OpenAI ouvre une nouvelle ère de l’intelligence artificielle, à la croisée de la performance et de la sécurité. Une innovation ambitieuse, déployée pas à pas, pour garantir qu’elle soit à la hauteur des enjeux.



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

1386 Episoden

Artwork
iconTeilen
 
Manage episode 458413106 series 2709331
Inhalt bereitgestellt von Choses à Savoir. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Choses à Savoir oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.

OpenAI frappe fort pour clore l’année 2024. À l’occasion de son opération "Ship-mas", l’entreprise a levé le voile sur o3, son dernier modèle d’intelligence artificielle, une véritable révolution. Contrairement à ses prédécesseurs, o3 ne se limite pas à prédire les mots suivants dans une phrase. Il décompose les problèmes en microtâches, expose son raisonnement et affiche des performances sans précédent.


En mathématiques, le modèle pulvérise les records, résolvant 25,2 % des énigmes les plus complexes, là où ses prédécesseurs plafonnent à 2 %. Lors de la compétition AIME 2024, il n’a raté qu’une seule question, et il excelle aussi en programmation : o3 améliore de 22,8 % les scores de codage SWE-Bench Verified. Avec un taux de réussite de 87,7 % au GPQA Diamond, il surclasse même les experts d’OpenAI. Pourtant, malgré l’enthousiasme, OpenAI joue la prudence. Le modèle n’est pas encore accessible au grand public. L’entreprise a opté pour une phase de tests rigoureux, baptisée "Public Safety Testing". Des chercheurs et participants inscrits pourront interagir avec o3 afin d’identifier et corriger d’éventuelles failles de sécurité avant un déploiement à grande échelle prévu en 2025.


Ces tests mettent particulièrement l’accent sur l’alignement délibératif : o3 doit analyser chaque requête pour vérifier sa conformité avec les politiques de sécurité d’OpenAI. Ce raisonnement actif, bien plus sophistiqué que les règles fixes des versions précédentes, marque une avancée majeure dans la maîtrise des risques liés à l’IA. Avec o3, OpenAI ouvre une nouvelle ère de l’intelligence artificielle, à la croisée de la performance et de la sécurité. Une innovation ambitieuse, déployée pas à pas, pour garantir qu’elle soit à la hauteur des enjeux.



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

1386 Episoden

Alle Folgen

×
 
Loading …

Willkommen auf Player FM!

Player FM scannt gerade das Web nach Podcasts mit hoher Qualität, die du genießen kannst. Es ist die beste Podcast-App und funktioniert auf Android, iPhone und im Web. Melde dich an, um Abos geräteübergreifend zu synchronisieren.

 

Kurzanleitung

Hören Sie sich diese Show an, während Sie die Gegend erkunden
Abspielen