
Aroundo de las plataformas sociales existen numerosos mitos y concepciones, especialmente en relación a cómo presentan contenido que hemos mostrado interés recientemente o que normalmente nos resulta familiar. Facebook, con el objetivo de aclarar este asunto, ha proporcionado más información acerca de la inteligencia artificial predictiva.
Anteriormente, la red social había compartido información sobre su algoritmo para facilitar la comprensión de su funcionamiento, y demostrar que en realidad no se trata de leer la mente o espiarnos, sino de las interacciones que tenemos en la plataforma. No obstante, el sistema de clasificación basado en el aprendizaje automático, ML en inglés, que potencia este algoritmo es sumamente complejo y cuenta con múltiples capas.
Cuál es la naturaleza de este proceso de selección
El aspecto fundamental que considera este laborioso y fascinante trabajo de clasificación es la cantidad de usuarios. Facebook dispone de más de 2.000 millones de usuarios en todo el mundo, y cuando uno de ellos accede a su perfil, este algoritmo se activa. Para cada usuario hay más de mil publicaciones que podrían aparecer en su inicio, pero no todas son realmente relevantes. Por consiguiente, surgen miles de señales que el sistema debe analizar para decidir qué es lo más significativo para cada usuario. Este proceso ocurre en segundo plano, durante el tiempo que tarda en cargar la página de inicio de tu perfil.
Habiendo discutido cómo opera este proceso en términos generales, detallemos un poco más en cada etapa.
Inventario
Como mencionamos, en esta fase inicial se recopilan todas las publicaciones que podrían llegar al perfil del usuario, de las cuales existen miles para cada uno de los 2.000 millones de usuarios. Facebook ilustra este proceso a través de un usuario al que llamaremos Juan.
«Este inventario disponible incluye cualquier publicación compartida con Juan por un amigo, grupo o página a la que esté conectado, que se haya realizado desde su último ingreso y que no haya sido eliminada. Pero, ¿qué hacemos con las publicaciones creadas antes de su último inicio de sesión que Juan aún no ha visto?
Para asegurar que las publicaciones no vistas sean reconsideradas, las nuevas publicaciones clasificadas como elegibles para Juan (aunque no las haya visualizado) en sus sesiones anteriores se añaden al inventario elegible para esta sesión. También aplicamos una lógica que permite incluir en el inventario elegible todas las publicaciones que Juan ya haya visualizado y que hayan suscitado conversaciones interesantes entre sus amigos».
A continuación, el sistema debe evaluar cada publicación con base en una serie de factores, como el tipo de contenido, la similitud con otros elementos y cuánto se asemeja la publicación a lo que el usuario suele interactuar. Para llevar a cabo esto para más de 1.000 publicaciones, para cada uno de los miles de millones de usuarios, todo en tiempo real, Facebook ejecuta estos modelos para todas las historias candidatas.
en simultáneo en diversas máquinas, denominadas predictores.
Proceso de validación
Al recopilar todas estas publicaciones inicia el proceso de selección: en este punto se establece qué publicaciones se ajustan a las políticas de Facebook, descartando aquellas que no cumplan con dichas normas. Entre estas publicaciones se incluirían las que propagan información engañosa, que contengan contenido delicado y los conocidos clickbaits.
Al llegar a esta etapa, ya contamos con un número más reducido de publicaciones, aproximadamente 500. No obstante, aún hay tarea por realizar, ya que si bien todos pueden ser afines al interés del usuario, no todos poseen la misma relevancia. Por ello, antes de pasar al paso contextual, que representaría el resultado que observa el usuario, tenemos el siguiente punto.
Evaluación de puntuación
El siguiente es el scoring pass donde se lleva a cabo la mayor parte de la personalización. Aquí, se determina una puntuación para cada historia de manera independiente, y luego las 500 publicaciones se organizan según dicha puntuación. Para algunos, la puntuación podría ser más alta para los “me gusta” que para los comentarios, debido a que ciertas personas prefieren expresarse más a través de los “me gusta” que de los comentarios. Cualquier acción en la que un individuo rara vez participe (por ejemplo, una predicción de hacer «me gusta» que esté muy cerca de cero) recibe automáticamente un rol mínimo en la clasificación, dado que el valor anticipado es muy bajo.
En este punto es necesario diferenciar entre qué publicaciones son más pertinentes que otras. Para ello, debemos centrarnos por un instante en el usuario. Consideremos el ejemplo proporcionado por la red social en su anuncio.
Desde la apertura de sesión de Juan ayer, su amigo Wei compartió una imagen de su cocker spaniel. Otra amiga, Saanvi, publicó un video de su carrera matutina. Su página favorita compartió un artículo interesante sobre la mejor manera de observar la Vía Láctea por la noche, mientras que su grupo de cocina predilecto publicó cuatro nuevas recetas de masa madre.
En esta situación, el usuario, Juan, posee 4 publicaciones que podrían ocupar la posición más alta. Lo que definirá cuál de estas obtendrá una mejor calificación será el nivel de interacción que él mantenga con las publicaciones del usuario y el tipo de contenido.
«Podemos utilizar las características de una publicación, como quién está etiquetado en una imagen y cuándo fue publicada, para prever si a Juan le podría gustar. Por ejemplo, si Juan suele interactuar con las publicaciones de Saanvi (por ejemplo, compartiendo o comentando) con frecuencia y su video de carrera es muy reciente,
existe una elevada probabilidad de que a Juan le agrade su publicación. Si Juan ha interactuado con más material de video que con fotografías en el pasado, la estimación para la imagen de Wei de su cocker spaniel podría ser bastante baja. En este escenario, nuestro algoritmo de clasificación asignaría una puntuación más alta al video en ejecución de Saanvi que a la foto del perro de Wei debido a que anticipa una mayor probabilidad de que a Juan le guste.
Asimismo, es fundamental analizar el efecto a largo plazo que las publicaciones pueden ocasionar: Facebook logra esto a través de encuestas realizadas a sus usuarios, de las cuales obtienen un valor estimado para discernir dicho impacto en todos sus usuarios.
Contextual Pass
Finalmente, al llegar a la fase contextual, se implementan ciertas reglas, como la de diversificar el contenido para asegurar que este sea más agradable y no contenga el mismo tipo de publicación de manera continua.
Todos estos procedimientos ocurren en cuestión de unos pocos segundos, el tiempo necesario para abrir la aplicación de Facebook.
Imagen: Depositphotos