Los modelos, de los que Reuters informó por primera vez, son capaces de razonar a través de tareas complejas y pueden resolver problemas más complejos que los modelos anteriores en ciencia, codificación y matemáticas, dijo la empresa de IA en una entrada de blog.
OpenAI utiliza el nombre en clave Strawberry para referirse internamente al proyecto, mientras que a los modelos anunciados el jueves los denomina o1 y o1-mini. El o1 estará disponible en ChatGPT y su API a partir del jueves, según la empresa.
Noam Brown, investigador de OpenAI centrado en mejorar el razonamiento en los prototipos de la compañía, confirmó en un post en la plataforma de redes sociales X que los modelos eran los mismos que los del proyecto Strawberry.
«Me emociona compartir con todos vosotros el fruto de nuestro esfuerzo en OpenAI por crear modelos de IA capaces de un razonamiento verdaderamente general», escribió Brown.
En la entrada de su blog, OpenAI afirma que el modelo o1 obtuvo una puntuación del 83% en el examen clasificatorio de la Olimpiada Internacional de Matemáticas, frente al 13% de su modelo anterior, GPT-4o.
El modelo también mejoró su rendimiento en preguntas de programación competitivas y superó el nivel de precisión de un doctorado humano en una serie de problemas científicos, según la empresa.
¿Para qué puede usarse?
De acuerdo con Brown, los modelos lograron estas puntuaciones gracias a la incorporación de una técnica de razonamiento conocida como «cadena de pensamiento», que consiste en dividir los problemas complejos en pasos lógicos más pequeños.
El modelo «o1 puede ser utilizado por investigadores del sector sanitario para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos», explicó la empresa.
Los investigadores han observado que el rendimiento de los modelos de IA en problemas complejos tiende a mejorar cuando este enfoque se utiliza como técnica de estimulación. OpenAI ha automatizado esta capacidad para que los modelos puedan descomponer los problemas por sí solos, sin que el usuario tenga que darles instrucciones.
«Hemos entrenado a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, como haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores», señala OpenAI.
En su blog, OpenAI afirmó que está planeando brindar acceso a o1-mini a todos los usuarios de ChatGPT Free .
Con información de Reuters