OpenAI, la compañía detrás de ChatGPT, ha anunciado o1, su primer modelo de lenguaje capaz de razonar sobre tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencia, programación y matemáticas.
Este nuevo modelo está integrado dentro de ChatGPT, aunque por ahora no al 100%, por lo que carece de generación de imágenes o búsquedas en la web, entre otras cosas.
Según las pruebas realizadas por la compañía, o1 se desenvuelve de manera similar a estudiantes de doctorado en tareas desafiantes de física, química o biología, destacando también en matemáticas y programación.
A modo de referencia, en un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que o1 obtuvo una puntuación del 83 %.
Por ahora, responde de forma más lenta que GPT-40, y esto se debe precisamente a su propia concepción. No arroja una respuesta a las bravas ante la consulta, sino que la razona y luego la sirve, de ahí el retraso extra, que es de suponer que se irá puliendo con el tiempo. Esto hará también que se equivoque menos, pero no asegura el 100% de efectividad.
Una de las claves de o1 está en como ha sido entrenado. Mientras que en los entrenamientos de los modelos GPT anteriores se les enseñaba a imitar patrones de de datos, en este caso se ha utilizado una técnica de aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones. Posteriormente utiliza una «cadena de pensamiento» para procesar consultas, de manera similar a cómo los humanos procesamos los problemas al analizarlos paso a paso.
Por ahora está disponible en forma de «vista previa» para los miembros de ChatGPT Plus y Team, en los formatos o1-preview y o1-mini, mientras que los usuarios de Enterprise y Edu tendrán acceso a principios de la próxima semana.
La idea de OpenAI es dar acceso a o1-mini a todos los usuarios gratuitos de ChatGPT, aunque para esto no hay una fecha de disponibilidad por ahora.
Más información en la web oficial de OpenAI.