
Facebook es esa plataforma social que nunca deja de asombrar (para bien, por supuesto). Esta red social, encabezada por Mark Zuckerberg, ha mostrado inquietud por el contenido potencialmente inapropiado que sus cientos de usuarios pueden publicar, día tras día, en su plataforma.
Para ellos, entender el texto que aparece en las imágenes es crucial para mejorar la experiencia de los usuarios (además de ser más accesible para las personas con discapacidad visual), por lo que ha invertido sus esfuerzos en desarrollar una herramienta de Inteligencia Artificial capaz de leer e interpretar el texto de las imágenes y vídeos: Rosetta.
Rosetta: una herramienta de IA capaz de leer e interpretar el texto de las imágenes
Nadie puede refutar, en la actualidad, que el ámbito visual e de imágenes está en su auge (o si no que se lo digan a Instagram), estableciéndose como algo realmente cautivador para las generaciones Millennials, Z y futuras. Y, dado que las interacciones sociales se están volviendo cada vez más visuales, si las plataformas sociales desean mantenerse relevantes, es indispensable permanecer al tanto en lo relacionado con imágenes y vídeos. Y no solo por todos los aspectos positivos que estos pueden ofrecer a la experiencia del usuario, sino también por los negativos.
Y, es que, hoy por hoy existe una libertad casi total para subir a nuestros perfiles de redes sociales todo tipo de contenido visual (siempre con ciertos límites, claro), pero a veces no somos conscientes del material tan potencialmente ofensivo que estamos difundiendo en nuestros perfiles, como por ejemplo, con los memes.
En resumen, si consideramos el gran flujo de fotos compartidas diariamente en Facebook e Instagram, el número de idiomas aceptados en la plataforma y las variaciones del texto, resulta evidente que la red no pueda captar el contexto de las imágenes, a pesar de que sí puede reconocerlas.
Por lo tanto, buscando solucionar esta problemática, Facebook ha estado desarrollando durante años una nueva y sofisticada tecnología de Inteligencia Artificial que permite clasificar automáticamente las imágenes según su contenido, sin necesidad de haber escrito nada sobre el objeto, persona o acción que aparece en la imagen. Y a esta tecnología se le ha dado el nombre de Rosetta.
https://icrono.com/tendenciasmarketinggoogle-libera-parsey-mcparseface-mejorando-la-ia/
Cómo opera Rosetta
El funcionamiento de Rosetta se encuentra inmerso en el campo de la Inteligencia Artificial, y, aunque su mecánica de operación es realmente compleja, vamos a intentar explicarla de manera sencilla:
Rosetta extrae texto de más de mil millones de imágenes públicas de Facebook e Instagram, de manera cotidiana y en tiempo real, y coloca todo ello en un modelo de reconocimiento de texto diseñado específicamente para esto, a través de dos etapas independientes: detección y reconocimiento.
En la primera etapa, se detectan áreas rectangulares en la imagen que potencialmente contienen texto. En la segunda, se lleva a cabo el reconocimiento del texto, donde, para cada una de las áreas detectadas, se utiliza una red neuronal para identificar y transcribir el texto. En todo este proceso se emplea una metodología basada en Faster R-CNN (Redes Neuronales Convolucionales Basadas en Regiones o Red Neuronal Convolucional); una red neuronal de detección de objetos de última generación.
De esta forma, facilita una búsqueda más efectiva y identificación de contenido pertinente, basado en indicios visuales. Por ejemplo, imaginemos una foto de una casa roja que, sin haber incluido nada relacionado con «casa roja» dentro del texto de la imagen, permite reconocer la fotografía al realizar una búsqueda anterior.
En resumen, Rosetta se transformará en esa herramienta que, además de identificar contenidos que podrían ser ofensivos en la red, brindará mayor contexto a las personas con discapacidades visuales. Pero eso no es todo, también puede ser utilizada como una tecnología verdaderamente valiosa para las campañas de publicidad de las marcas. Por ejemplo, podría ayudar a una marca de ropa a localizar imágenes donde aparece su logotipo, y así descubrir audiencias similares.