Comment Boston Dynamics a appris à ses robots à danser

Par Evan Ackerman

Posé le 2021-01-07 14:00 GMT

Aaron Saunders, vice-président de l’ingénierie de Boston Dynamics, nous dit d’où Atlas tire ses mouvements

Atlas robots dansant — Image : Boston Dynamics

Y avait-il des choses qui étaient particulièrement difficiles à traduire des danseurs humains à Atlas ? Ou, des choses qu’Atlas pourrait faire mieux que les humains ?

Certains des tours tournants dans les parties de ballet ont nécessité plus d’itérations pour arriver à fonctionner, parce qu’ils étaient les plus éloignés du saut et de la course et de certaines autres choses avec lesquelles nous avons plus d’expérience, donc ils ont défié à la fois la machine et le logiciel de nouvelles façons. Nous avons définitivement appris à ne pas sous-estimer la souplesse et la force des danseurs. Lorsque vous prenez des athlètes d’élite et que vous essayez de faire ce qu’ils font mais avec un robot, c’est un problème difficile. C’est une leçon d’humilité. Fondamentalement, je ne pense pas qu’Atlas ait l’amplitude de mouvement ou la puissance de ces athlètes, bien que nous continuions à développer nos robots dans ce sens, car nous pensons que pour déployer largement ce type de robots dans le commerce, et éventuellement dans une maison, nous pensons qu’ils doivent avoir ce niveau de performance.

Une chose pour laquelle les robots sont vraiment bons est de faire quelque chose encore et encore exactement de la même manière. Donc, une fois que nous avons composé ce que nous voulions faire, les robots pouvaient simplement le faire encore et encore alors que nous jouions avec différents angles de caméra.

Je peux comprendre comment vous pourriez utiliser des danseurs humains pour vous aider à mettre en place une routine avec Atlas, mais comment cela a-t-il fonctionné avec Spot, et en particulier avec Handle ?

Je pense que les gens avec qui nous avons travaillé avaient en fait beaucoup de talent pour penser au mouvement, et penser à la façon de s’exprimer à travers le mouvement. Et nos robots font vraiment bien le mouvement – ils sont dynamiques, ils sont excitants, ils sont équilibrés. Je pense donc que nous avons constaté que les danseurs se connectaient à la façon dont les robots se déplaçaient, et qu’ils en faisaient une histoire, peu importe qu’ils aient deux ou quatre jambes. Quand vous n’avez pas nécessairement un modèle de mouvement animal ou de comportement humain, vous devez juste penser un peu plus fort sur la façon de faire quelque chose, et c’est vrai pour des comportements commerciaux plus pragmatiques aussi.

Comment l’expérience que vous obtenez en apprenant aux robots à danser, ou à faire de la gymnastique ou du parkour, informe votre approche de la robotique pour les applications commerciales ?

Nous pensons que les compétences inhérentes à la danse et au parkour, comme l’agilité, l’équilibre et la perception, sont fondamentales pour une grande variété d’applications robotiques. Peut-être plus important encore, trouver cette intersection entre la construction d’une nouvelle capacité de robot et le fait de s’amuser a été la recette de Boston Dynamics pour la robotique – c’est un excellent moyen d’avancer.

Un bon exemple est comment, lorsque vous repoussez les limites en demandant à vos robots de faire ces mouvements dynamiques sur une période de plusieurs jours, vous apprenez beaucoup sur la robustesse de votre matériel. Spot, grâce à sa production, est devenu incroyablement robuste et ne nécessite presque aucune maintenance – il peut danser toute la journée si on lui apprend à le faire. Et la raison pour laquelle il est si robuste aujourd’hui, c’est grâce à toutes les leçons que nous avons tirées de choses antérieures qui pouvaient simplement sembler bizarres et amusantes. Vous devez aller en territoire inexploré pour même savoir ce que vous ne savez pas.

Atlas et Spot dansent — Image : Boston Dynamics

Il est souvent difficile de dire, en regardant des vidéos comme celles-ci, combien de temps il a fallu pour faire fonctionner les choses comme vous le vouliez, et à quel point elles sont représentatives des capacités réelles des robots. Pouvez-vous en parler ?

Laissez-moi essayer de répondre dans le contexte de cette vidéo, mais je pense que c’est la même chose pour toutes les vidéos que nous postons. Nous travaillons dur pour faire quelque chose, et une fois que ça marche, ça marche. Pour Atlas, la plupart des commandes du robot provenaient de nos travaux antérieurs, comme ceux que nous avons effectués sur le parkour, qui nous ont amenés à utiliser des contrôleurs prédictifs de modèle qui tiennent compte de la dynamique et de l’équilibre. Nous les avons utilisés pour exécuter sur le robot un ensemble de pas de danse que nous avions conçus hors ligne avec les danseurs et le chorégraphe. Nous avons donc passé beaucoup de temps, des mois, à réfléchir à la danse, à composer les mouvements et à itérer en simulation.

La danse requiert beaucoup de force et de vitesse, nous avons donc même amélioré une partie du matériel d’Atlas pour lui donner plus de puissance. La danse est peut-être la chose la plus puissante que nous ayons faite à ce jour – même si vous pouvez penser que le parkour semble beaucoup plus explosif, la quantité de mouvement et de vitesse que vous avez dans la danse est incroyable. Cela a également pris beaucoup de temps pendant des mois ; créer la capacité dans la machine pour aller de pair avec la capacité dans les algorithmes.

Une fois que nous avons eu la séquence finale que vous voyez dans la vidéo, nous n’avons filmé que pendant deux jours. Une grande partie de ce temps a été consacrée à trouver comment déplacer la caméra à travers une scène avec un tas de robots pour capturer un plan continu de deux minutes, et alors que nous avons couru et filmé la routine de danse plusieurs fois, nous avons pu la répéter de manière assez fiable. Il n’y a pas eu de coupure ou de collage dans ce plan d’ouverture de deux minutes.

Il y a certainement eu des défaillances dans le matériel qui ont nécessité une maintenance, et nos robots ont trébuché et sont tombés parfois. Ces comportements ne sont pas destinés à être productivisés et à être fiables à 100 %, mais ils sont définitivement reproductibles. Nous essayons d’être honnêtes en montrant les choses que nous pouvons faire, et non pas une bribe de quelque chose que nous avons fait une fois. Je pense qu’il y a une honnêteté requise pour dire que vous avez réalisé quelque chose, et c’est définitivement important pour nous.

Vous avez mentionné que Spot est maintenant assez robuste pour danser toute la journée. Qu’en est-il d’Atlas ? Si vous continuiez à remplacer ses batteries, pourrait-il aussi danser toute la journée ?

Atlas, en tant que machine, est encore, vous savez… il n’y en a qu’une poignée dans le monde, ils sont compliqués, et la fiabilité n’était pas un objectif principal. Nous avons certainement cassé le robot de temps en temps. Mais la robustesse du matériel, dans le contexte de ce que nous essayions de faire, était vraiment excellente. Et sans cette robustesse, nous n’aurions pas pu réaliser la vidéo. Je pense qu’Atlas ressemble un peu plus à un hélicoptère, où le ratio entre le temps consacré à la maintenance et le temps consacré au fonctionnement est plus élevé. Alors qu’avec Spot, on s’attend à ce que ce soit plus comme une voiture, où vous pouvez la faire fonctionner pendant longtemps avant de devoir la toucher.

Lorsque vous apprenez à Atlas à faire de nouvelles choses, utilise-t-il une sorte d’apprentissage automatique ? Et si non, pourquoi pas ?

En tant qu’entreprise, nous avons exploré beaucoup de choses, mais Atlas n’utilise pas de contrôleur d’apprentissage pour le moment. J’espère qu’un jour viendra où nous le ferons. La performance de danse actuelle d’Atlas utilise un mélange de ce que nous aimons appeler le contrôle réflexif, qui est une combinaison de réaction aux forces, d’optimisation de trajectoire en ligne et hors ligne, et de contrôle prédictif de modèle. Nous utilisons ces techniques parce qu’elles constituent un moyen fiable de débloquer des performances très élevées, et nous savons très bien comment manier ces outils. Nous n’avons pas trouvé la fin de la route en termes de ce que nous pouvons faire avec eux.

Nous prévoyons d’utiliser l’apprentissage pour étendre et construire sur la base de logiciels et de matériel que nous avons développé, mais je pense que nous, ainsi que la communauté, essayons encore de déterminer où sont les bons endroits pour appliquer ces outils. Je pense que vous verrez cela comme faisant partie de notre progression naturelle.

Une grande partie du mouvement dynamique d’Atlas provient du bas de son corps pour le moment, mais le parkour fait également appel à la force et à l’agilité du haut du corps, et nous avons vu quelques images conceptuelles récentes montrant Atlas faisant des sauts et des tractions. Pouvez-vous nous en dire plus ?

Les humains et les animaux font des choses étonnantes en utilisant leurs jambes, mais ils font des choses encore plus étonnantes lorsqu’ils utilisent leur corps entier. Je pense que le parkour fournit un cadre fantastique qui nous permet de progresser vers la mobilité du corps entier. Marcher et courir n’était que le début de ce voyage. Nous progressons vers des comportements dynamiques plus complexes, comme le saut et la rotation, sur lesquels nous avons travaillé ces deux dernières années. Et la prochaine étape consiste à explorer comment l’utilisation des bras pour pousser et tirer sur le monde pourrait étendre cette agilité.

L’une des missions que j’ai confiées à l’équipe d’Atlas est de commencer à travailler sur l’exploitation des bras autant que nous exploitons les jambes pour améliorer et étendre notre mobilité, et je suis vraiment enthousiasmé par ce sur quoi nous allons travailler au cours des deux prochaines années, car cela va nous ouvrir beaucoup plus de possibilités de faire des choses passionnantes avec Atlas.

Quel est votre point de vue sur les actionneurs hydrauliques par rapport aux actionneurs électriques pour les robots hautement dynamiques ?

Au cours de ma carrière chez Boston Dynamics, je me suis senti passionné par tant de types de technologies différentes, mais je me suis installé dans un endroit où je ne pense vraiment plus que c’est une conversation de l’un ou l’autre. Je pense que le choix de la technologie d’actionnement dépend vraiment de la taille du robot que vous construisez, de ce que vous voulez que ce robot fasse, de l’endroit où vous voulez qu’il aille, et de nombreux autres facteurs. En fin de compte, il est bon d’avoir les deux types d’actionneurs dans votre boîte à outils, et j’aime avoir accès aux deux – et nous avons utilisé les deux avec beaucoup de succès pour faire des machines dynamiques vraiment impressionnantes.

Je pense que la seule délimitation entre les actionneurs hydrauliques et électriques qui semble être distincte pour moi est probablement dans l’échelle. Il est vraiment difficile de faire des choses hydrauliques minuscules parce que l’industrie ne fait tout simplement pas beaucoup de cela, et la réciproque est que l’industrie n’a pas non plus tendance à faire des choses électriques massives. Donc, vous pouvez trouver que c’est une division naturelle entre ces deux technologies.

En dehors de ce sur quoi vous travaillez à Boston Dynamics, quelles sont les recherches récentes en robotique qui vous enthousiasment le plus ?

Pour nous en tant qu’entreprise, nous aimons vraiment suivre les avancées en matière de détection, de vision par ordinateur, de perception du terrain, ce sont toutes des choses où plus elles s’améliorent, plus nous pouvons en faire. Pour moi personnellement, l’une des choses que j’aime suivre est la recherche sur la manipulation, et en particulier la recherche sur la manipulation qui fait progresser notre compréhension des interactions complexes, basées sur la friction, comme glisser et pousser, ou déplacer des choses compliquées comme des cordes.

Nous assistons à un passage du simple fait de pincer des choses, de les soulever, de les déplacer et de les laisser tomber, à des interactions beaucoup plus significatives avec l’environnement. La recherche dans ce type de manipulation va, je pense, débloquer le potentiel des manipulateurs mobiles, et je pense que cela va vraiment ouvrir la capacité des robots à interagir avec le monde d’une manière riche.

Y a-t-il autre chose que vous aimeriez que les gens retiennent de cette vidéo ?

Pour moi personnellement, et je pense que c’est parce que je passe tellement de temps immergé dans la robotique et que j’ai une profonde appréciation de ce qu’est un robot et de ses capacités et limites, l’un de mes désirs les plus forts est que plus de gens passent plus de temps avec des robots. Nous voyons beaucoup d’opinions et d’idées de la part des gens qui regardent nos vidéos sur YouTube, et il me semble que si plus de gens avaient l’occasion de réfléchir, d’apprendre et de passer du temps avec des robots, ce nouveau niveau de compréhension pourrait les aider à imaginer de nouvelles façons dont les robots pourraient être utiles dans notre vie quotidienne. Je pense que les possibilités sont vraiment excitantes, et je veux juste que plus de gens puissent faire ce voyage.

Cet article est paru dans le numéro imprimé de mars 2021 sous le titre « Boston Dynamics & Hyundai : Let’s Dance. »

Aaron Saunders, vice-président de l’ingénierie de Boston Dynamics, nous dit d’où Atlas tire ses mouvements

Laisser un commentaire Annuler la réponse