Gemini Live, Imagen 3 y Ask Photos: esto anunció Google en el I/O 2024 en materia de IA

Entre las principales innovaciones, los líderes comparten que Gemini 1.5 Pro ahora puede analizar documentos más largos, así como bases de códigos, videos y grabaciones de audio de mayor extensión.
14 de mayo, de 2024
Copiar enlace

Llegó la edición 2024 del Google I/O y la tecnológica estadounidense viene con todo, introduciendo al mercado nuevas soluciones en IA y optimizando las ya existentes con la promesa de seguir revolucionando el mundo digital a través de la inteligencia artificial. Entre las principales innovaciones, la edición 2024 del I/O presentó Gemini Live, una nueva función que permitirá a usuarios tener chats de voz con la IA a través de sus smartphones.

Google I/O 2024 trae propuestas que cambiarán el rumbo de la IA

Fue hace menos de un año que Google desveló de forma oficial Gemini, su IA más ambiciosa que pretendería hacerle frente a ChatGPT, y desde entonces la compañía ha trabajado en numerosas optimizaciones para perfeccionar el modelo. Desde Mountainview, California –lugar donde tomó lugar el evento– los líderes de la empresa compartieron que esta misión va viento en popa, pues Gemini 1.5 Pro ahora puede analizar documentos más largos, así como bases de códigos, videos y grabaciones de audio de mayor extensión.

Sin embargo, quizás su propuesta más atractiva por el momento sea Gemini Live, la función que le permitirá al asistente de Google tener una conversación en audio con los usuarios. Esta herramienta tiene la capacidad de adaptarse a los patrones de habla de los usuarios, ofreciendo respuestas más conversacionales en 10 diferentes opciones de voz, además de que podrá tener acceso a las cámaras de los smartphones para interpretar video en tiempo real, una acción similar a lo que propone a la vez GPT-4o, el modelo más avanzado de ChatGPT.

«Queremos que todos se beneficien con lo que Gemini puede hacer. Así que hemos trabajado rápidamente para compartir esos avances con todos ustedes. Hoy, más de 1.5 millones de desarrolladores utilizan modelos de Gemini a lo largo de nuestras herramientas. Lo están ocupando para depurar código, obtener nuevos insights, y construir la nueva generación de aplicaciones de IA. También hemos estado incorporando las capacidades revolucionarias de Gemini en nuestros productos de formas poderosas«, señaló Sundar Pichai, CEO de Google, a lo largo del evento.

La IA de Google promete revolucionar también las imágenes

Además de darle una nueva personalidad (y claro, voz) al nuevo asistente basado en IA, Gemini también será un aliado clave en Imagen 3, el nuevo modelo generativo de imágenes. Según los desarrolladores, este modelo tendrá una mayor capacidad de comprensión en los prompts, traduciéndolos en imágenes más realistas y creativas con un margen de error más pequeño y con artefactos de «menor distracción» en las imágenes finales.

En este mismo ámbito, la empresa introducirá Ask Photos, una nueva característica impulsada por Gemini que permitirá a los usuarios encontrar contenido específico en su colección de Google Photos. Gracias al procesamiento de lenguaje natural de la IA, será posible encontrar más rápidamente fotos de ciertas personas, lugares e incluso objetos, optimizando la experiencia de los usuarios.

Otras innovaciones en IA que estarán disponibles en el mercado

En miras de seguir acaparando mayor participación en el mundo de la IA, Google aprovechó el escenario del I/O 2024 para compartir a la vez la llegada de Gemini Nano, el más pequeño de sus modelos basados en IA. Este modelo podrá ser integrado de forma directa en la versión de escritorio para Chrome, lo que permitirá a desarrolladores potenciar sus propias características de IA; por ejemplo, en la herramienta «ayúdame a escribir» del Workspace Lab disponible en Gmail.

Finalmente, pero no menos importante, Gemini se integrará de forma complementaria en el sistema operativo de Android, teniendo un impacto directo en las apps de Google. Una vez ocurriendo esta integración, los usuarios podrán, por ejemplo, arrastrar y soltar imágenes creadas con IA en un correo de Gmail, así como en mensajes de texto y otras aplicaciones. Mientras tanto, en YouTube será posible utiliza la función de «Ask this video» para encontrar información específica dentro de un video, entre otras innovaciones que se desplegarán pronto.

Algunas de estas funciones ya están disponibles a través de Gemini 1.5 Pro, mientras que otras, como Ask Photos, estarán disponibles hasta el verano.

En cualquier caso, hay otras novedades que te interesarán de Google I/O 2024:

 

Publicado por

Content Creator
Content Creator en Marketing4eCommerce desde 2023. Host del Podcast de M4C MX, además de ocasionalmente ser Community Manager para nuestros perfiles en México y TikToker aficionado cuando se necesita.

Suscríbete a M4C

Únete a nuestro canal de Whatsapp

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.