Después de muchos rumores y especulaciones, OpenAI anunció GPT-4, la nueva versión de su modelo de lenguaje preentrenado multimodal, con una complejidad inmensamente superior a la de su antecesor.
De inmediato el modelo actualizado comenzó a alimentar la versión Plus del popular servicio ChatGPT. Por su parte, Microsoft confirmó que el nuevo Bing y sus herramientas de IA corren en el modelo 4 de GPT desde el inicio.
Tal vez el cambio más significativo es que ahora la IA responde no solamente a comandos o descripciones en texto, sino que también es capaz de analizar imágenes en tiempo real para generar textos o descripciones. La compañía explica que el nuevo modelo es más colaborativo y creativo que el anterior, además de considerablemente más preciso a la hora de trabajar en problemas complicados.
Así las cosas, el nuevo modelo multimodal "muestra un rendimiento a nivel humano en varios puntos de referencia académicos y profesionales", según OpenAI.
Mejor, pero no perfecto
Pese a esto, OpenAI también fue enfática en decir que la versión 4 del modelo comparte los problemas de antaño, como la tendencia para ‘inventarse’ información que no existe y también la capacidad para generar, en ciertos casos, textos ofensivos o violentos.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
Incluso con las limitaciones, los ejemplos que mostró la compañía fueron muy impresionantes. A nivel de detalles, el modelo 4 no tuvo problemas en generar sumarios de textos enteros, y para probar la eficacia el presidente de OpenAI también le puso la limitación de que cada palabra tiene que empezar con la letra Q.
Además de eso, es capaz de crear textos basados en otros textos, como tomar una publicación de una revista y convertirla en un poema o una canción. En comparación con 3.5, GPT 4 tiene mejores funciones para escribir código, con la capacidad de poner importar comandos y librerías simplemente poniéndolo como un comando de texto para el bot.
Tal vez el momento más impresionante del demo fue cuando Greg Brockman, presidente y confundador de OpenAI, tomó una foto de un diseño web y luego le pidió a GPT 4 que lo convirtiera en código HTML y JS sencillo. La IA generó automáticamente el código y creó un sitio web sencillo pero completamente funcional usando solamente una foto.
Evolución, más que revolución
Para probar las capacidades de la IA, OpenAI también la hizo tomar exámenes escolares de Estados Unidos para el ingreso a la universidad y otras instituciones. GPT 4 obtuvo notas en el percentil de 88 hacia arriba, es decir que es mejor que el 88% de los resultados totales. La lista de resultados fue publicada en el blog oficial.
Aunque quizás sería exagerado decir que se trata de un salto revolucionario, lo cierto es que lo presentado por OpenAI amplifica considerablemente las capacidades de GPT como motor para otros tipos de IA. En ese sentido, la firma ve el modelo 4 más como una evolución que como una revolución respecto al modelo 3.5.
Además de Bing, OpenAI también está trabajando para integrar su IA en productos como Duolingo y sitios pedagógicos en línea. El nuevo modelo está disponible para todos por medio de Microsoft Bing o ChatGPT Plus, el servicio de suscripción que cuesta 20 dólares al mes.