Tiempo de lectura: 3 minutos
Shares

Facebook es esa red social que nunca deja de sorprender (para bien, claro). La red social liderada por Mark Zuckerberg se ha mostrado preocupada por el material potencialmente ofensivo que sus cientos de clientes pueden publicar, día a día, en su red. 

Para ellos, comprender el texto que aparece en las imágenes es importante para mejorar la experiencia de los usuarios (además de ser más accesible para las personas con discapacidad visual), por lo que ha invertido sus esfuerzos en crear una herramienta de Inteligencia Artificial capaz de leer e interpretar el texto de las imágenes y vídeos: Rosetta.

Rosetta: una herramienta de IA capaz de leer e interpretar el texto de las imágenes

Nadie puede negar, a día de hoy, que el mundo visual y de imágenes no está en la cresta de la ola (o sino, que se lo digan a Instagram), situándose como algo realmente atractivo para las generaciones Millennials, Z y venideras. Y, dado que, las interacciones sociales se están volviendo cada vez más y más visuales, si las plataformas sociales quieren estar al día, es necesario mantenerse actualizadas en lo que a imágenes y vídeos se refiere. Y no únicamente por todo lo positivo que éstos pueden ofrecer a la experiencia del usuario, sino también por todo lo negativo. 

Y, es que, hoy en día existe una libertad prácticamente absoluta para subir a nuestros perfiles de redes sociales todo tipo de contenido visual (con unos límites, claro, como todo), pero a veces no somos conscientes del material tan potencialmente ofensivo que estamos compartiendo en nuestros perfiles, como por ejemplo, con los memes.

En resumidas cuentas, si pensamos en el gran volumen de fotos compartidas cada día en Facebook e Instagram, el número de idiomas admitidos en la plataforma y las variaciones del texto, resulta obvio que la red no pueda entender el contexto de las imágenes, a pesar de que sí pueda reconocerlo.

Así que, buscando dar solución a esta problemática, Facebook ha estado trabajando durante años en una nueva y avanzada tecnología de Inteligencia Artificial que permite categorizar automáticamente las imágenes en función de su contenido, sin necesidad de haber escrito nada sobre el objeto, persona o acción de la imagen. Y a esa tecnología se ha bautizado como Rosetta.

Google lanza Parsey McParseface para revolucionar la Inteligencia Artificial mejorando la comprensión del lenguaje

Cómo trabaja Rosetta

La manera de trabajar de Rosetta está inmersa en el mundo de la Inteligencia Artificial, y, a pesar de que su mecánica de trabajo es realmente compleja, vamos a tratar de explicarla de forma sencilla:

Rosetta extrae texto de más de mil millones de imágenes públicas de Facebook e Instagram, de manera diaria y en tiempo real, y lo coloca todo ello en un modelo de reconocimiento de texto diseñado específicamente para ello, a través de dos pasos independientes: detección y reconocimiento.

En el primer paso, se detectan regiones rectangulares en la imagen que potencialmente contiene texto. En el segundo, se realiza el reconocimiento de texto, donde, por cada una de las regiones detectadas, se emplea una red neuronal para reconocer y transcribir el texto. En todo este proceso entra en juego una metodología basada en Faster R-CNN (Region-based Convolutional Neural Networks o Red Neuronal Convolucional); una red neuronal de detección de objetos de última generación.

De esa manera, permite una mejor búsqueda y descubrimiento de contenido relevante, que se basa en señales visuales. Por ejemplo, imaginémonos la imagen de una casa roja que, sin haber escrito nada relacionado con “casa roja” en el cuerpo de la imagen, permite identificar la fotografía al realizar una búsqueda previa.

Resumiendo, Rosetta se convertirá en esa herramienta que, además de detectar contenidos potencialmente ofensivos en la red, proporcionará más contexto a las usuarios con discapacidad visual. Pero, por si fuera poco, también se puede utilizar como una tecnología realmente útil para las campañas publicitarias de las marcas. Por ejemplo, podría servir para que una marca de ropa detectase imágenes en las que aparece su logo, y descubrir así públicos afines.

 

Mantente informado de las noticias más relevantes en nuestro canal de Telegram