La patente de DeepMind se suma a las ambiciones de la IA robótica

DeepMind quiere asegurarse de que sus modelos de IA conozcan el mundo que los rodea.

La división de IA de Google presentó una solicitud de patente para una forma de generar un “modelo de un entorno objetivo” basado en interacciones entre un agente autónomo y un «entorno fuente». El sistema de DeepMind ayuda a los modelos de IA a mejorar la toma de decisiones al obtener una comprensión profunda de varios entornos diferentes, lo que permite que los modelos de IA sean más adaptables.

Controlar un agente, como un robot o un dispositivo autónomo, en cualquier entorno requiere un cierto nivel de incertidumbre en la toma de decisiones, señaló DeepMind. «El agente debe negociar el equilibrio entre aprender sobre las distribuciones de recompensas explorando los efectos de las acciones versus explotar las acciones más prometedoras basadas en el historial de interacción actual del agente con el entorno».

El sistema de DeepMind selecciona una serie de acciones que un agente autónomo puede realizar en su entorno actual utilizando lo que se llama un «modelo de entorno», o una simulación del entorno del agente.

Utilizando esa simulación, así como datos históricos sobre diferentes acciones e interacciones que ha realizado el agente, el modelo de entorno se «parametriza» o se ajusta para darle al agente una mejor conciencia situacional. Además, el sistema toma datos de varios «entornos de origen» diferentes, o lugares que son diferentes de la ubicación del agente, lo que proporciona datos diversos para ayudar al modelo a mejorar sus reflejos y generalizar su entrenamiento.

Finalmente, este sistema sopesa el riesgo y la recompensa de cada acción que un robot puede realizar en un entorno determinado, con el objetivo de obtener el resultado más eficaz. Este proceso se repite a lo largo del tiempo, lo que permite al agente esencialmente aprender de sus errores.

El sistema de DeepMind tiene como objetivo esencialmente permitir que los robots exploren sus opciones, dijo Rhonda Dibachi, directora ejecutiva de la plataforma de fabricación como servicio. Hola Scottie. Imagínese conducir por la misma ruta al trabajo todos los días, pero un día está bloqueada por una construcción. En lugar de volver a la misma ruta al día siguiente, explora nuevas rutas y aprende las ventajas y desventajas de diferentes opciones. «Es un equilibrio entre exploración y explotación», dijo Dibachi.

Este tipo de decisión nos parece obvia a nosotros como seres humanos, pero debe expresarse claramente a un robot o máquina autónoma, señaló Dibachi. Estas máquinas son capaces de realizar muchas acciones diferentes, pero a menudo sólo pueden hacer aquello para lo que están preprogramadas, en lugar de reaccionar o utilizar una toma de decisiones «probabilística», dijo.

Superar esta barrera en la toma de decisiones es vital para integrar aún más la robótica impulsada por IA en operaciones como la logística, la fabricación y la construcción. Tal como están las cosas, los robots existen detrás de jaulas en las fábricas para limitar su rango de movimiento y evitar riesgos de seguridad. La patente de DeepMind, sin embargo, puede «ayudarlos a salir de la jaula», afirmó Dibachi.

“Si se derriban esos muros, los peligros se multiplicarán infinitamente”, afirmó Dibachi. “Entonces lo que hay que hacer es recurrir a la IA, porque permite al robot interactuar con el entorno de forma abierta. Este es el próximo gran paso”.

La fusión de la IA y la robótica ha despertado el interés de muchas grandes empresas tecnológicas en los últimos meses. Varias grandes empresas tecnológicas han buscado patentes de robótica impulsada por IA en aspectos como la duración de la batería, la planificación de acciones y la reactividad, y varias nuevas empresas han estado trabajando arduamente para llevar al mercado robots humanoides multiuso.

Aparte de esta patente, DeepMind también ha estado experimentando con la robótica. La compañía anunció en enero varios avances en su investigación en robótica que ayudan con la rápida toma de decisiones y la navegación ambiental. Y a principios de este mes, Ayzaan Wahid, ingeniero de investigación de la empresa, publicó una serie de videos en X mostrando ALOHA Unleashed, un proyecto que tiene como objetivo ampliar los límites de la destreza en robots autónomos. Los videos mostraban brazos robóticos colgando camisas en perchas, atando zapatos, reemplazando piezas de máquinas y apretando engranajes.