Google lanza Gemini, su IA más ambiciosa para derrotar a ChatGPT

De acuerdo con los tests de Google, Gemini supera a GPT-4 en la mayoría de los campos, permitiendo incluso el tratamiento de inputs en vídeo.
Foto del nuevo modelo de lenguaje de Google, Gemini, basado en IA.
6 de diciembre, de 2023
Copiar enlace

Es oficial: el gigante tecnológico Google ha desvelado Gemini, su propio modelo de lenguaje de inteligencia artificial (IA) con el que buscará hacerle frente a ChatGPT; así lo dio a conocer la empresa basada en California, Estados Unidos.

La compañía dio a conocer que este nuevo LLM (large language model) llegará en tres tamaños diferentes: Nano, Pro y Ultra, cada uno de ellos adaptándose a las diferentes necesidades y complejidades de cada tarea. La versión Pro ya está disponible en varios dispositivos y herramientas (como Bard) en más de 170 países, su versión más potente, Gemini Ultra, llegará hasta principios de 2024.

Google Gemini, la IA multimodal más potente de la actualidad

Si bien Google en apariencia ha tardado demasiado en realizar las pruebas y evaluaciones para lanzar su propia IA, al parecer la espera ha valido al pena, ya que el gigante de internet destaca que la funcionalidad de Gemini rompe con las expectativas actuales en el mercado, ya que sus resultados fueron los mejores en 30 de las 32 pruebas académicas de uso generalizado, alcanzando una puntuación del 90,0% en MMLU (massive multitask language understanding) y superando a GPT-4, el modelo más potente de OpenAI. Esto convierte a Gemini en la IA multimodal más potente de la actualidad.

Comparativa entre Gemini y GPT-4 Fuente: Google

«Gemini es el resultado de los esfuerzos colaborativos a gran escala de los equipos en Google, incluyendo a nuestros colegas en Google Research. Fue construida desde cero para ser multimodal, lo que significa que puede generalizar y comprender sin problema alguno, operando y combinando a través de diferentes tipos de información, incluyendo texto, código, audio, imagen y video«, señala la empresa en su comunicado.

El CEO de Alphabet, Sundar Pichai se ha mostrado entusiasmado ante el lanzamiento de Gemini, destacando sus capacidades con este vídeo en el que presenta funcionalidades como la comprensión de inputs en forma de vídeo, algo que estaba fuera del alcance actual de GPT-4.


Las 3 versiones de Gemini se dividen de acuerdo a las diferentes tareas a las que estará asignado:

  • Nano: modelo que ejecutará tareas directamente desde dispositivos
  • Pro: diseñado para escalar en varios tipos de tasks
  • Ultra: el modelo más potente, diseñado específicamente para tareas de gran complejidad

Su capacidad ofrece comprensión de texto, código, imágenes y más

Con el modelo Gemini 1.0, la compañía apunta a democratizar sus capacidades sofisticadas de razonamiento, permitiendo que los usuarios puedan darle sentido a información compleja tanto en imagen como en texto, vídeo, audio o código. De esta forma, la IA podrá extraer insights de cientos de documentos a la vez, filtrando la información a nuevas velocidades nunca antes vistas. Además, su modelo de lenguaje es tan avanzado que incluso tendrá la capacidad de entender y brindar información de disciplinas como matemáticas o física.

Para los desarrolladores esta IA contará con la facultad para entender, explicar y generar código de alta calidad en distintos lenguajes de programación, tales como Python, Java C++ y Go. La compañía asegura que desde Gemini Ultra, los desarrolladores no solo tendrán la oportunidad de diseñar mejores servicios, sino que también podrán hacerlo mucho más rápido.

“Gemini fue diseñado para que sea multimodal de forma nativa, preentrenado desde el comienzo en diferentes modalidades y, después, fue perfeccionado con datos multimodales para refinar aún más su eficacia. Esto ayuda a que Gemini pueda entender y razonar a la perfección sobre cualquier tipo de entrada, mucho mejor que los modelos multimodales existentes”.

Desde hoy, Gemini se presenta en su versión Pro en Google Bard, marcando la mayor actualización desde su lanzamiento. Google destaca que esto lo posiciona como uno de los modelos gratuitos más avanzados globalmente. Inicialmente en inglés y disponible en más de 170 países, y a pesar de que aún no está disponible en Europa, la empresa asegura que en los próximos meses se expandirá a otros territorios e idiomas.

Con respecto a Gemini Ultra, la variante más potente de este modelo, Google afirma que estará accesible para algunos clientes, desarrolladores y especialistas en seguridad, quienes tendrán la primicia de probarlo antes de su lanzamiento general a todos los desarrolladores en los primeros meses de 2024.

En cuanto a la versión Nano, Gemini hace su entrada en el móvil de élite de Google, el Pixel 8 Pro. Este añadido brinda al smartphone nuevas capacidades, como la integración de respuestas inteligentes del teclado Gboard en WhatsApp, entre otras funciones. Para el año 2024, la compañía asegura que extenderá la presencia de Gemini a diversas aplicaciones de mensajería.

 

Otros artículos de

Publicado por

Content Creator
Content Creator en Marketing4eCommerce desde 2023. Host del Podcast de M4C MX, además de ocasionalmente ser Community Manager para nuestros perfiles en México y TikToker aficionado cuando se necesita.

Suscríbete a M4C

Únete a nuestro canal de Whatsapp

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.