Aaron Saunders, vicepresidente de ingeniería de Boston Dynamics, nos cuenta de dónde sacó Atlas sus movimientos
¿Hubo algunas cosas que fueron particularmente difíciles de traducir de los bailarines humanos a Atlas? O bien, ¿hubo cosas que Atlas pudiera hacer mejor que los humanos?
Algunos de los giros en las partes de ballet requirieron más iteraciones para que funcionaran, porque eran los más alejados de los saltos y las carreras y algunas de las otras cosas con las que tenemos más experiencia, por lo que desafiaron tanto a la máquina como al software de nuevas maneras. Definitivamente, aprendimos a no subestimar la flexibilidad y la fuerza de los bailarines; cuando tomas a los atletas de élite y tratas de hacer lo que ellos hacen pero con un robot, es un problema difícil. Es una lección de humildad. Fundamentalmente, no creo que Atlas tenga la amplitud de movimiento o la potencia que tienen estos atletas, aunque seguimos desarrollando nuestros robots para conseguirlo, porque creemos que para desplegar ampliamente este tipo de robots comercialmente, y eventualmente en un hogar, necesitamos que tengan este nivel de rendimiento.
Una cosa en la que los robots son realmente buenos es en hacer algo una y otra vez exactamente de la misma manera. Así que, una vez que definimos lo que queríamos hacer, los robots podían repetirlo una y otra vez mientras jugábamos con diferentes ángulos de cámara.
Puedo entender que utilicen bailarines humanos para ayudarles a montar una rutina con Atlas, pero ¿cómo funcionó eso con Spot, y en particular con Handle?
Creo que la gente con la que trabajamos tenía mucho talento para pensar en el movimiento y en cómo expresarse a través de él. Y nuestros robots se mueven muy bien: son dinámicos, emocionantes, se equilibran. Así que creo que lo que descubrimos fue que los bailarines conectaban con la forma en que se movían los robots, y luego le daban forma a una historia, y no importaba si había dos o cuatro patas. Cuando no tienes necesariamente una plantilla de movimiento animal o de comportamiento humano, sólo tienes que pensar un poco más en cómo hacer algo, y eso es cierto para los comportamientos comerciales más pragmáticos también.
¿Cómo influye la experiencia de enseñar a los robots a bailar, o a hacer gimnasia o parkour, en su enfoque de la robótica para aplicaciones comerciales?
Creemos que las habilidades inherentes a la danza y el parkour, como la agilidad, el equilibrio y la percepción, son fundamentales para una amplia variedad de aplicaciones robóticas. Y lo que es más importante, encontrar esa intersección entre la creación de una nueva capacidad robótica y la diversión ha sido la receta de Boston Dynamics para la robótica: es una gran forma de avanzar.
Un buen ejemplo es cómo cuando se empujan los límites pidiendo a los robots que realicen estos movimientos dinámicos durante un período de varios días, se aprende mucho sobre la robustez del hardware. Spot, a través de su productización, se ha vuelto increíblemente robusto, y casi no requiere mantenimiento: puede bailar todo el día una vez que se le enseña a hacerlo. Y la razón por la que es tan robusto hoy en día es por todas esas lecciones que aprendimos de cosas anteriores que podían parecer simplemente extrañas y divertidas. Tienes que adentrarte en territorio desconocido para saber incluso lo que no sabes.
A menudo es difícil saber al ver vídeos como estos cuánto tiempo se tardó en hacer que las cosas funcionaran como se quería, y lo representativos que son de las capacidades reales de los robots. ¿Podría hablar de ello?
Permítame intentar responder en el contexto de este vídeo, pero creo que lo mismo ocurre con todos los vídeos que publicamos. Trabajamos duro para hacer algo, y una vez que funciona, funciona. En el caso de Atlas, la mayor parte del control del robot procede de nuestro trabajo anterior, como el que realizamos sobre el parkour, que nos llevó a utilizar controladores predictivos de modelos que tienen en cuenta la dinámica y el equilibrio. Los utilizamos para ejecutar en el robot un conjunto de pasos de baile que habíamos diseñado fuera de línea con los bailarines y el coreógrafo. Así que pasamos mucho tiempo, meses, pensando en el baile y componiendo los movimientos e iterando en la simulación.
El baile requiere mucha fuerza y velocidad, así que incluso mejoramos parte del hardware de Atlas para darle más potencia. Puede que el baile sea lo más potente que hemos hecho hasta la fecha; aunque te parezca que el parkour es mucho más explosivo, la cantidad de movimiento y velocidad que tienes en el baile es increíble. Eso también nos llevó mucho tiempo durante meses; crear la capacidad en la máquina para que fuera compatible con la capacidad en los algoritmos.
Una vez que tuvimos la secuencia final que se ve en el vídeo, sólo filmamos durante dos días. Gran parte de ese tiempo se dedicó a averiguar cómo mover la cámara a través de una escena con un montón de robots en ella para capturar una toma continua de dos minutos, y aunque corrimos y filmamos la rutina de baile varias veces, pudimos repetirla con bastante fiabilidad. No hubo cortes ni empalmes en esa toma inicial de dos minutos.
Sin duda hubo algunos fallos en el hardware que requirieron mantenimiento, y nuestros robots tropezaron y se cayeron a veces. Estos comportamientos no están pensados para ser producidos y ser 100 por ciento confiables, pero definitivamente son repetibles. Intentamos ser honestos mostrando las cosas que podemos hacer, no un fragmento de algo que hicimos una vez. Creo que hay una honestidad necesaria para decir que has logrado algo, y eso es definitivamente importante para nosotros.
Has mencionado que Spot es ahora lo suficientemente robusto como para bailar todo el día. ¿Qué hay de Atlas? Si se le siguen sustituyendo las baterías, ¿podría bailar todo el día también?
Atlas, como máquina, sigue siendo, ya sabes… sólo hay un puñado de ellas en el mundo, son complicadas, y la fiabilidad no era un objetivo principal. Definitivamente romperíamos el robot de vez en cuando. Pero la robustez del hardware, en el contexto de lo que estábamos tratando de hacer, era realmente grande. Y sin esa robustez, no habríamos podido hacer el vídeo. Creo que Atlas es un poco más parecido a un helicóptero, donde hay una mayor proporción entre el tiempo que pasas haciendo el mantenimiento y el tiempo que pasas operando. Mientras que con Spot, la expectativa es que sea más como un coche, donde puedes hacerlo funcionar durante mucho tiempo antes de tener que tocarlo.
Cuando estáis enseñando a Atlas a hacer cosas nuevas, ¿está utilizando algún tipo de aprendizaje automático? Y si no, ¿por qué no?
Como empresa, hemos explorado muchas cosas, pero Atlas no está utilizando un controlador de aprendizaje en este momento. Espero que llegue un día en que lo hagamos. La danza actual de Atlas utiliza una mezcla de lo que nos gusta llamar control reflexivo, que es una combinación de reacción a las fuerzas, optimización de la trayectoria en línea y fuera de línea, y control predictivo de modelos. Aprovechamos estas técnicas porque son una forma fiable de conseguir un rendimiento realmente alto, y sabemos cómo manejar estas herramientas muy bien. No hemos encontrado el final del camino en cuanto a lo que podemos hacer con ellas.
Pensamos utilizar el aprendizaje para ampliar y construir sobre la base de software y hardware que hemos desarrollado, pero creo que nosotros, junto con la comunidad, todavía estamos tratando de averiguar dónde están los lugares adecuados para aplicar estas herramientas. Creo que lo verás como parte de nuestra progresión natural.
De momento, gran parte del movimiento dinámico de Atlas proviene de la parte inferior de su cuerpo, pero el parkour también hace uso de la fuerza y la agilidad de la parte superior del cuerpo, y hemos visto algunas imágenes conceptuales recientes que muestran a Atlas haciendo saltos y jalones. ¿Puede decirnos algo más?
Los humanos y los animales hacen cosas increíbles con las piernas, pero hacen cosas aún más increíbles cuando utilizan todo el cuerpo. Creo que el parkour proporciona un marco fantástico que nos permite progresar hacia la movilidad de todo el cuerpo. Caminar y correr fue sólo el comienzo de ese viaje. Estamos avanzando hacia comportamientos dinámicos más complejos, como saltar y girar, que es en lo que hemos estado trabajando en los últimos dos años. Y el siguiente paso es explorar cómo el uso de los brazos para empujar y tirar del mundo podría ampliar esa agilidad.
Una de las misiones que he encomendado al equipo de Atlas es empezar a trabajar en el aprovechamiento de los brazos tanto como aprovechamos las piernas para mejorar y ampliar nuestra movilidad, y estoy realmente entusiasmado con lo que vamos a trabajar en los próximos dos años, porque va a abrir muchas más oportunidades para que hagamos cosas emocionantes con Atlas.
¿Cuál es su punto de vista sobre los actuadores hidráulicos frente a los eléctricos para los robots altamente dinámicos?
A lo largo de mi carrera en Boston Dynamics, me he sentido apasionadamente conectado a muchos tipos diferentes de tecnología, pero me he asentado en un lugar donde realmente no creo que esto sea una conversación de uno u otro. Creo que la selección de la tecnología de los actuadores depende realmente del tamaño del robot que se está construyendo, de lo que se quiere que haga ese robot, de dónde se quiere que vaya y de muchos otros factores. En última instancia, es bueno tener ambos tipos de actuadores en tu caja de herramientas, y me encanta tener acceso a ambos, y hemos utilizado ambos con gran éxito para hacer máquinas dinámicas realmente impresionantes.
Creo que la única delineación entre los actuadores hidráulicos y eléctricos que parece ser distinta para mí es probablemente en la escala. Es muy difícil hacer cosas hidráulicas pequeñas porque la industria no hace mucho de eso, y lo recíproco es que la industria tampoco tiende a hacer cosas eléctricas masivas. Por lo tanto, usted puede encontrar que para ser una división natural entre estas dos tecnologías.
Además de en lo que está trabajando en Boston Dynamics, ¿qué investigación robótica reciente le entusiasma más?
Para nosotros, como empresa, nos encanta seguir los avances en detección, visión por ordenador, percepción del terreno, todas estas son cosas que cuanto más mejoran, más podemos hacer. Personalmente, una de las cosas que me gusta seguir es la investigación sobre la manipulación y, en particular, la investigación sobre la manipulación que hace avanzar nuestra comprensión de las interacciones complejas basadas en la fricción, como el deslizamiento y el empuje, o el movimiento de cosas conformes, como las cuerdas.
Estamos viendo un cambio de simplemente pellizcar cosas, levantarlas, moverlas y dejarlas caer, a interacciones mucho más significativas con el entorno. La investigación en ese tipo de manipulación creo que va a desbloquear el potencial de los manipuladores móviles, y creo que realmente va a abrir la capacidad de los robots para interactuar con el mundo de una manera rica.
¿Hay algo más que le gustaría que la gente se llevara de este vídeo?
Para mí personalmente, y creo que es porque paso mucho de mi tiempo inmerso en la robótica y tengo una profunda apreciación de lo que es un robot y cuáles son sus capacidades y limitaciones, uno de mis fuertes deseos es que más gente pase más tiempo con los robots. Vemos muchas opiniones e ideas de personas que ven nuestros vídeos en YouTube, y me parece que si más personas tuvieran la oportunidad de pensar, aprender y pasar tiempo con robots, ese nuevo nivel de comprensión podría ayudarles a imaginar nuevas formas en las que los robots podrían ser útiles en nuestra vida diaria. Creo que las posibilidades son realmente emocionantes, y sólo quiero que más gente pueda hacer ese viaje.
Este artículo aparece en la edición impresa de marzo de 2021 como «Boston Dynamics & Hyundai: Let’s Dance».