
La empresa tecnológica Google, en colaboración con su sección de inteligencia artificial DeepMind, ha revelado progresos notables hacia la construcción de robots autónomos seguros para interactuar con seres humanos. La exhibición abarca una nueva «Constitución robótica» que tiene como propósito guiar la conducta de los robots en situaciones del mundo real, tal como se detalla en el blog de DeepMind.
El proyecto fue presentado junto a 3 herramientas esenciales: AutoRT, SARA-RT y RT-Trajectory, diseñadas con la finalidad de optimizar la recolección de datos de robots en escenarios reales, aumentar su rapidez y mejorar su capacidad de generalización.
Los robots no pueden infligir daño a los seres humanos
Esta constitución se manifiesta como un conjunto de pautas centradas en la seguridad y está inspirada en las célebres 3 leyes de la robótica formuladas por el escritor y científico Isaac Asimov:
- Un robot debe preservar su existencia a toda costa.
- Un robot debe asegurar y mantener el acceso a su propia fuente de energía.
- Un robot debe buscar constantemente mejores fuentes de energía.
En este sentido, las normas fundamentales desarrolladas por Google se enfocan en el principio de que un robot no puede causar daño a un ser humano. Asimismo, se prohíbe a los robots realizar actividades que involucren la presencia de personas, animales, objetos afilados o dispositivos eléctricos; y se implementan medidas prácticas de seguridad, como la detención automática en caso de que la fuerza en las articulaciones de los robots sobrepase ciertos límites e interruptores de apagado físicos para el control humano.
El trabajo desarrollado se fundamenta en Robotics Transformers 2 (RT-2), que DeepMind comenzó para asistir a los robots en tomar decisiones más rápidamente y entender y desplazarse mejor en sus entornos.
Así son las 3 herramientas de la constitución robótica
1. AutoRT
Este sistema hace uso de Grandes Modelos de Lenguaje (LLM), o Modelos de Lenguaje Visual (VLM), junto con un modelo de control de robot (RT-1 o RT-2). AutoRT se especializa en la recopilación de datos de entrenamiento experiencial en entornos novedosos y variados. Permite dirigir simultáneamente múltiples robots para llevar a cabo diversas tareas en espacios del mundo real.
En términos más simples, esta herramienta funciona como el instructor de entrenamiento de los robots. AutoRT es capaz de instruir al robot en la ejecución de actividades diarias. Por ejemplo, proporciona al robot imágenes y le indica qué hacer en distintas circunstancias para que asimile a entender y llevar a cabo variadas tareas en entornos nuevos y diversos.
A lo largo de un lapso de 7 meses, el sistema AutoRT fue evaluado en situaciones de la vida real, concretamente en diferentes edificios de oficinas. La evaluación abarcó la gestión segura de hasta 20 robots a la vez y un total de hasta 52 robots únicos. Estos robots estaban equipados con cámaras de video y efector final, y se desplegaron para llevar a cabo 77.000 pruebas robóticas en 6.650 tareas distintas. Este enfoque permitió al sistema recopilar un conjunto de datos variado y relevante, evidenciando la capacidad de AutoRT para coordinar múltiples robots en entornos innovadores y ejecutar diversas tareas de manera eficaz.
2. SARA-RT
Este sistema transforma los modelos de Transformadores de Robótica (RT) en versiones más eficientes. Se utiliza para optimizar la velocidad y la precisión de los modelos RT.
Considera SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers) como una mejora en la capacidad de pensamiento ágil de los robots. Al tomar decisiones, a veces los robots pueden volverse lentos debido al volumen de información que necesitan procesar. SARA-RT les asiste en pensar con mayor rapidez y precisión.
SARA-RT fue evaluado en comparativa con modelos RT-2 existentes y demostró ser un 10,6% más preciso y un 14% más rápido que los modelos RT-2 tras recibir una breve secuencia de imágenes.
Como menciona DeepMind, «Hemos diseñado nuestro sistema para que sea intuitivo y esperamos que una gran cantidad de investigadores y profesionales lo implementen, tanto en robótica como en otros campos. Dado que SARA ofrece una fórmula universal para acelerar Transformers, sin requerir una capacitación previa que consuma muchos recursos computacionales, este enfoque posee el potencial de ampliar enormemente el uso de la tecnología Transformers. No es necesario ningún código adicional, ya que se pueden utilizar varias versiones lineales de código abierto».
3. RT-Trajectory
Esta herramienta se enfoca en potenciar la capacidad de los robots para generalizar movimientos. Les asiste en interpretar y ejecutar tareas específicas a través de la representación visual de las trayectorias de los movimientos que se diseñan para abordar diferentes aspectos de la interacción de los robots en el entorno real.
Es similar a un instructor de danza que incorpora «ilustraciones« visuales de los movimientos del robot en los videos de práctica. De esta forma, el robot no solo aprende qué acción debe realizar, sino también cómo moverse de manera eficiente para completar la tarea. El sistema además puede generar trayectorias observando demostraciones humanas de las tareas deseadas e incluso acepta bocetos hechos a mano. Y se puede ajustar con facilidad a distintas plataformas robóticas.
Este modelo duplicó la tasa de éxito de los modelos RT previos. En comparación con RT-2, un brazo controlado por RT-Trajectory alcanzó una tasa de éxito del 63%, en contraste con el 29% para RT-2.
Foto: Freepik.