Aaron Saunders, VP de Engenharia da Boston Dynamics, nos diz de onde a Atlas obteve seus movimentos
Existiram algumas coisas que foram particularmente difíceis de traduzir dos dançarinos humanos para o Atlas? Ou, coisas que o Atlas podia fazer melhor que os humanos?
Algumas das reviravoltas nas partes do ballet levaram mais iterações para chegar ao trabalho, porque estavam mais longe de saltar e correr e algumas das outras coisas com que temos mais experiência, por isso desafiaram tanto a máquina como o software de novas maneiras. Nós definitivamente aprendemos a não subestimar o quão flexíveis e fortes os dançarinos são – quando você pega atletas de elite e tenta fazer o que eles fazem, mas com um robô, é um problema difícil. É humilhante. Fundamentalmente, eu não acho que a Atlas tenha o alcance do movimento ou potência que esses atletas fazem, embora continuemos desenvolvendo nossos robôs para isso, porque acreditamos que, a fim de implantar amplamente esses tipos de robôs comercialmente, e eventualmente em uma casa, achamos que eles precisam ter esse nível de desempenho.
Uma coisa em que os robôs são realmente bons é fazer algo repetidamente da mesma maneira. Assim, uma vez que discamos no que queríamos fazer, os robôs podiam fazê-lo repetidamente, pois jogávamos com ângulos de câmara diferentes.
Eu consigo entender como é que se pode usar dançarinos humanos para ajudar a montar uma rotina com o Atlas, mas como é que isso funcionava com o Spot, e particularmente com o Handle?
Eu acho que as pessoas com quem trabalhámos tinham de facto muito talento para pensar em movimento, e para pensar em como se expressar através do movimento. E os nossos robôs fazem movimento muito bem – eles são dinâmicos, são excitantes, equilibram-se. Então acho que o que descobrimos foi que os dançarinos se conectaram com a maneira como os robôs se moviam, e depois moldaram isso em uma história, e não importava se havia duas ou quatro pernas. Quando não temos necessariamente um modelo de movimento animal ou comportamento humano, só temos de pensar um pouco mais sobre como fazer algo, e isso também é verdade para comportamentos comerciais mais pragmáticos.
Como é que a experiência que você ganha ensinando robôs a dançar, ou a fazer ginástica ou parkour, informa sua abordagem à robótica para aplicações comerciais?
Pensamos que as habilidades inerentes à dança e ao parkour, como agilidade, equilíbrio e percepção, são fundamentais para uma grande variedade de aplicações de robôs. Talvez mais importante, descobrir que a intersecção entre construir uma nova capacidade robótica e se divertir tem sido a receita da Boston Dynamics para a robótica – é uma ótima maneira de avançar.
Um bom exemplo é como, quando você pressiona limites pedindo aos seus robôs para fazer esses movimentos dinâmicos durante um período de vários dias, você aprende muito sobre a robustez do seu hardware. O Spot, através da sua produção, tornou-se incrivelmente robusto, e quase não exigiu manutenção – ele poderia apenas dançar o dia inteiro uma vez que você o ensinasse. E a razão pela qual ele é tão robusto hoje em dia é devido a todas aquelas lições que aprendemos de coisas anteriores que podem ter parecido estranhas e divertidas. Você tem que entrar em território desconhecido para até mesmo saber o que não sabe.
É muitas vezes difícil dizer, ao ver vídeos como estes, quanto tempo levou para que as coisas funcionassem da forma que você queria, e quão representativos são das capacidades reais dos robôs. Você pode falar sobre isso?
Deixe-me tentar responder no contexto deste vídeo, mas eu acho que o mesmo é verdade para todos os vídeos que postamos. Trabalhamos muito para fazer algo, e uma vez que funciona, funciona. Para a Atlas, a maior parte do controle do robô existia do nosso trabalho anterior, como o trabalho que fizemos no parkour, que nos enviou por um caminho de usar controladores preditivos de modelos que são responsáveis pela dinâmica e equilíbrio. Usamos esses controladores para executar no robô um conjunto de passos de dança que tínhamos projetado offline com os dançarinos e coreógrafos. Então, muito tempo, meses, gastamos pensando na dança e compondo os movimentos e iterando em simulação.
Dançar exigiu muita força e velocidade, então até fizemos um upgrade no hardware do Atlas para dar-lhe mais potência. A dança pode ser a coisa mais potente que já fizemos até hoje – embora você possa pensar que parkour parece muito mais explosivo, a quantidade de movimento e velocidade que você tem na dança é incrível. Isso também levou muito tempo ao longo dos meses; criando a capacidade na máquina de acompanhar a capacidade nos algoritmos.
Após termos a sequência final que vê no vídeo, filmamos apenas durante dois dias. Muito desse tempo foi gasto descobrindo como mover a câmera através de uma cena com um monte de robôs nela para capturar uma cena contínua de dois minutos, e enquanto corríamos e filmávamos a rotina de dança várias vezes, podíamos repeti-la de forma bastante confiável. Não houve cortes ou emendas naquela filmagem de dois minutos de abertura.
Existiram definitivamente algumas falhas no hardware que exigiram manutenção, e os nossos robôs tropeçaram e caíram por vezes. Estes comportamentos não são para ser produzidos e para ser 100% confiáveis, mas são definitivamente repetíveis. Tentamos ser honestos em mostrar coisas que podemos fazer, não um pedaço de algo que fizemos uma vez. Eu acho que há uma honestidade necessária em dizer que você conseguiu algo, e isso é definitivamente importante para nós.
Você mencionou que o Spot agora é robusto o suficiente para dançar o dia todo. Que tal o Atlas? Se você continuasse a substituir suas baterias, ele poderia dançar o dia todo, também?
Atlas, como uma máquina, ainda é, você sabe… há apenas um punhado deles no mundo, eles são complicados, e confiabilidade não foi um foco principal. Nós definitivamente quebraríamos o robô de vez em quando. Mas a robustez do hardware, no contexto do que estávamos a tentar fazer, era realmente fantástica. E sem essa robustez, não teríamos conseguido fazer o vídeo de forma alguma. Eu acho que o Atlas é um pouco mais como um helicóptero, onde há uma proporção maior entre o tempo que você passa fazendo manutenção e o tempo que você passa operando. Enquanto com o Spot, a expectativa é que seja mais como um carro, onde você pode rodá-lo por muito tempo antes de ter que tocá-lo.
Quando você está ensinando o Atlas a fazer coisas novas, ele está usando algum tipo de aprendizagem de máquina? E se não, porque não?
Como empresa, já exploramos muitas coisas, mas o Atlas não está a usar um controlador de aprendizagem neste momento. Eu espero que chegue o dia em que o faremos. A performance de dança atual da Atlas usa uma mistura do que gostamos de chamar de controle reflexivo, que é uma combinação de reação a forças, otimização de trajetória online e offline, e controle preditivo de modelos. Aproveitamos estas técnicas porque são uma forma confiável de desbloquear coisas de alto desempenho, e entendemos muito bem como manejar estas ferramentas. Ainda não encontramos o fim da estrada em termos do que podemos fazer com elas.
Planejamos usar o aprendizado para estender e construir sobre a base de software e hardware que desenvolvemos, mas acho que nós, junto com a comunidade, ainda estamos tentando descobrir onde estão os lugares certos para aplicar essas ferramentas. Eu acho que você verá isso como parte de nossa progressão natural.
Muito movimento dinâmico do Atlas vem do seu corpo inferior no momento, mas parkour faz uso da força e agilidade da parte superior do corpo também, e temos visto algumas imagens de conceitos recentes mostrando Atlas fazendo abóbadas e pullups. Pode nos dizer mais?
Humanos e animais fazem coisas incríveis usando suas pernas, mas eles fazem coisas ainda mais incríveis quando usam o corpo inteiro. Acho que o parkour proporciona uma estrutura fantástica que nos permite progredir em direcção à mobilidade de todo o corpo. Andar e correr foi apenas o começo dessa jornada. Estamos a progredir através de comportamentos dinâmicos mais complexos como saltar e girar, é nisso que temos estado a trabalhar nos últimos anos. E o próximo passo é explorar como usar braços para empurrar e puxar o mundo poderia estender essa agilidade.
Uma das missões que dei à equipe Atlas é começar a trabalhar para alavancar os braços tanto quanto alavancamos as pernas para melhorar e estender nossa mobilidade, e estou realmente animado com o que vamos trabalhar nos próximos dois anos, porque isso vai abrir muito mais oportunidades para fazermos coisas emocionantes com o Atlas.
Qual sua perspectiva sobre atuadores hidráulicos versus elétricos para robôs altamente dinâmicos?
Atravessando minha carreira na Boston Dynamics, eu me senti apaixonadamente conectado a tantos tipos diferentes de tecnologia, mas eu me instalei em um lugar onde eu realmente não acho mais que isso seja uma conversa de um ou de outro. Eu acho que a seleção da tecnologia do atuador realmente depende do tamanho do robô que você está construindo, o que você quer que esse robô faça, para onde você quer que ele vá, e muitos outros fatores. Em última análise, é bom ter ambos os tipos de atuadores em sua caixa de ferramentas, e eu adoro ter acesso ao bot – e nós usamos ambos com grande sucesso para fazer máquinas dinâmicas realmente impressionantes.
Eu acho que o único delineamento entre atuadores hidráulicos e elétricos que parece ser distinto para mim é provavelmente em escala. É realmente desafiador fazer pequenas coisas hidráulicas porque a indústria simplesmente não faz muito disso, e o recíproco é que a indústria também não tende a fazer coisas elétricas maciças. Então, você pode achar que é uma divisão natural entre essas duas tecnologias.
Beside o que você está trabalhando na Boston Dynamics, que pesquisa robótica recente você mais gosta?
Para nós, como empresa, nós realmente adoramos seguir os avanços em sensoriamento, visão computadorizada, percepção do terreno, essas são todas as coisas em que quanto melhor elas ficam, mais nós podemos fazer. Para mim pessoalmente, uma das coisas que eu gosto de seguir é a pesquisa de manipulação, e em particular a pesquisa de manipulação que avança nossa compreensão de interações complexas, baseadas em fricção como deslizar e empurrar, ou mover coisas complacentes como cordas.
Estamos vendo uma mudança de apenas beliscar as coisas, elevando-as, movendo-as, e deixando-as cair, para interações muito mais significativas com o ambiente. A pesquisa nesse tipo de manipulação acho que vai revelar o potencial dos manipuladores móveis, e acho que vai realmente abrir a capacidade dos robôs de interagir com o mundo de uma forma rica.
Existe mais alguma coisa que você gostaria que as pessoas tirassem deste vídeo?
Para mim pessoalmente, e acho que é porque passo muito do meu tempo imerso em robótica e tenho um profundo apreço pelo que é um robô e quais são as suas capacidades e limitações, um dos meus fortes desejos é que mais pessoas passem mais tempo com robôs. Nós vemos muitas opiniões e idéias de pessoas olhando nossos vídeos no YouTube, e me parece que se mais pessoas tivessem oportunidades de pensar, aprender e passar tempo com robôs, esse novo nível de compreensão poderia ajudá-las a imaginar novas maneiras pelas quais os robôs poderiam ser úteis em nossas vidas diárias. Eu acho que as possibilidades são realmente emocionantes, e eu só quero que mais pessoas sejam capazes de fazer essa jornada.
Este artigo aparece na edição impressa de março de 2021 como “Boston Dynamics & Hyundai”: Vamos Dançar.”