OpenAI presenta GPT-4o, su modelo más avanzado que aspira a ser tu nuevo asistente de voz

La "o" en GPT-4o hace referencia a la palabra "omni", un claro indicador del potencial que ofrecerá a los usuarios y su promesa por revolucionar la IA generativa.
Un fondo de una ciudad futurista acompañado de dos robots y en el centro el logo de OpenAI; esto en referencia a la introducción de GPT-4o, el nuevo modelo de IA generativa.
13 de mayo, de 2024
Copiar enlace

Es oficial: OpenAI acaba de desvelar GPT-4o, su nuevo modelo de inteligencia artificial que fungirá como emblema de la empresa creada por Sam Altman. Esta nueva presentación de la IA generativa busca generar una interacción humanos-computadoras mucho más natural, a la vez que promete revolucionar lo que ofrecía su anterior modelo, GPT-4 Turbo.

Las capacidades de GPT-4o prometen mayor velocidad y eficiencia

Los líderes de la compañía dieron a conocer la noticia a través del OpenAI Spring Event, una iniciativa que surge con el principal objetivo de compartir las innovaciones de la empresa. La principal de ellas fue la introducción de este nuevo modelo de IA generativa, el cual mejorará la experiencia de ChatGPT al hacer la interacción más fluida y económica, siendo así que es dos veces más rápido que la versión Turbo y más accesible al estar a la mitad de precio.

Cabe destacar que la «o» en su nombre hace referencia a la palabra «omni», un claro indicador del potencial que ofrecerá a los usuarios. Aunado a esto, sus líderes también lanzarán la versión de ChatGPT para escritorio, por lo que también se encuentran desarrollando nuevas aplicaciones para ello.

«Con GPT-4o, entrenamos un nuevo modelo único de extremo a extremo que incluye texto, visión y audio, lo que implica que todos los inputs y outputs sean procesados por la misma red neural. Ya que GPT-4o es el primer modelo que combina todas estas modalidades, estamos apenas rascando la superficie para explorar lo que el modelo puede hacer y sus limitaciones«, señala la compañía a través de su blog oficial.

El nuevo modelo opera en tiempo real

Además de buscar ser más accesible y amigable en su interacción con humanos, el reciente modelo de OpenAI opera completamente en tiempo real; esto quiere decir que al interactuar con la IA será posible interrumpirla mientras genera una respuesta, e incluso puede detectar emociones en las voces de los usuarios, generando outputs con diferentes estilos emotivos.

De igual manera, GPT-4o optimizará las capacidades de visión de ChatGPT, permitiendo dar respuesta a preguntas relacionadas con imágenes. Por ejemplo, si compartimos con la IA una captura de pantalla de un código y buscamos saber qué está mal, la IA podrá identificar dónde está el error y así ayudarnos a corregirlo; o si queremos encontrar algún elemento específico dentro de una fotografía, el modelo lo señalará en cuestión de segundos.

Mejoras y optimización en otros lenguajes

Más allá de hacer la experiencia más fluida, los líderes de la IA dieron a conocer que también implementaron mejoras en el desempeño de la IA en más de 50 lenguajes, además de que se encuentran trabajando en refrescar su UI (User Interface).

Las capacidades de GPT-4o estarán disponibles de forma iterativa en los próximos días, aunque las nuevas funciones en texto e imagen ya comenzaron a desplegarse desde hoy en ChatGPT para el rango gratuito. Para el plan de pago Plus, los expertos se encuentran trabajando en una nueva versión del Modo de Voz que estará disponible en las siguientes semanas, mientras que los desarrolladores ya podrán acceder al nuevo modelo desde su API.

Finalmente, las funciones en audio y video estarán accesibles a un pequeño grupo de partners en las próximas semanas.

Publicado por

Content Creator
Content Creator en Marketing4eCommerce desde 2023. Host del Podcast de M4C MX, además de ocasionalmente ser Community Manager para nuestros perfiles en México y TikToker aficionado cuando se necesita.

Suscríbete a M4C

Únete a nuestro canal de Whatsapp

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.