Aaron Saunders, VP della Boston Dynamics, ci dice da dove Atlas ha preso le sue mosse
C’erano alcune cose che erano particolarmente difficili da tradurre dai ballerini umani ad Atlas? O cose che Atlas poteva fare meglio degli umani?
Alcune delle rotazioni nelle parti del balletto hanno richiesto più iterazioni per funzionare, perché erano le più lontane dal salto e dalla corsa e alcune delle altre cose con cui abbiamo più esperienza, quindi hanno sfidato sia la macchina che il software in modi nuovi. Abbiamo sicuramente imparato a non sottovalutare quanto siano flessibili e forti i ballerini – quando prendi atleti d’élite e cerchi di fare quello che fanno loro ma con un robot, è un problema difficile. È umiliante. Fondamentalmente, non credo che Atlas abbia la gamma di movimento o la potenza che hanno questi atleti, anche se continuiamo a sviluppare i nostri robot in questo senso, perché crediamo che al fine di distribuire ampiamente questo tipo di robot commercialmente, ed eventualmente in una casa, pensiamo che debbano avere questo livello di prestazioni.
Una cosa in cui i robot sono davvero bravi è fare qualcosa più e più volte nello stesso modo. Quindi, una volta stabilito ciò che volevamo fare, i robot potevano rifarlo più volte mentre giocavamo con diverse angolazioni della telecamera.
Posso capire come si possano usare ballerini umani per aiutarvi a mettere insieme una routine con Atlas, ma come ha funzionato con Spot, e in particolare con Handle?
Penso che le persone con cui abbiamo lavorato avessero davvero molto talento nel pensare al movimento e nel pensare a come esprimersi attraverso il movimento. E i nostri robot si muovono molto bene: sono dinamici, eccitanti, in equilibrio. Quindi penso che quello che abbiamo scoperto è che i ballerini si sono collegati con il modo in cui i robot si muovevano, e poi l’hanno modellato in una storia, e non importa se c’erano due o quattro gambe. Quando non si ha necessariamente un modello di movimento animale o di comportamento umano, bisogna pensare un po’ di più a come fare qualcosa, e questo è vero anche per comportamenti commerciali più pragmatici.
In che modo l’esperienza acquisita insegnando ai robot a ballare, o a fare ginnastica o parkour, informa il vostro approccio alla robotica per applicazioni commerciali?
Pensiamo che le abilità inerenti alla danza e al parkour, come agilità, equilibrio e percezione, siano fondamentali per un’ampia varietà di applicazioni robotiche. Forse ancora più importante, trovare quell’intersezione tra la costruzione di una nuova capacità dei robot e il divertimento è stata la ricetta di Boston Dynamics per la robotica – è un ottimo modo per progredire.
Un buon esempio è come quando si spingono i limiti chiedendo ai robot di fare questi movimenti dinamici per un periodo di diversi giorni, si impara molto sulla robustezza del proprio hardware. Spot, attraverso la sua produzione, è diventato incredibilmente robusto, e non ha richiesto quasi nessuna manutenzione – potrebbe danzare tutto il giorno una volta che glielo hai insegnato. E il motivo per cui oggi è così robusto è dovuto a tutte quelle lezioni che abbiamo imparato da cose precedenti che potevano sembrare strane e divertenti. Devi andare in un territorio inesplorato per sapere anche quello che non sai.
Spesso è difficile dire, guardando video come questi, quanto tempo ci sia voluto per far funzionare le cose nel modo desiderato e quanto siano rappresentativi delle reali capacità dei robot. Puoi parlarne?
Lascia che provi a rispondere nel contesto di questo video, ma penso che lo stesso sia vero per tutti i video che pubblichiamo. Lavoriamo duramente per fare qualcosa, e una volta che funziona, funziona. Per Atlas, la maggior parte del controllo del robot esisteva dal nostro lavoro precedente, come il lavoro che abbiamo fatto sul parkour, che ci ha mandato sulla strada dell’uso di controllori predittivi del modello che tengono conto della dinamica e dell’equilibrio. Li abbiamo usati per eseguire sul robot una serie di passi di danza che avevamo progettato offline con i ballerini e il coreografo. Così, un sacco di tempo, mesi, abbiamo passato a pensare alla danza e a comporre i movimenti e a iterare nella simulazione.
La danza richiedeva molta forza e velocità, così abbiamo anche aggiornato parte dell’hardware di Atlas per dargli più potenza. La danza potrebbe essere la cosa più potente che abbiamo fatto fino ad oggi – anche se si potrebbe pensare che il parkour sembri molto più esplosivo, la quantità di movimento e velocità che si ha nella danza è incredibile. Anche questo ha richiesto molto tempo nel corso dei mesi; creare la capacità della macchina per andare insieme alla capacità degli algoritmi.
Una volta ottenuta la sequenza finale che si vede nel video, abbiamo girato solo per due giorni. Gran parte di quel tempo è stato speso per capire come muovere la telecamera in una scena con un mucchio di robot per catturare una ripresa continua di due minuti, e mentre abbiamo eseguito e filmato la routine di danza più volte, abbiamo potuto ripeterla in modo abbastanza affidabile. Non c’era alcun taglio o giuntura in quell’inquadratura iniziale di due minuti.
Ci sono stati sicuramente alcuni guasti nell’hardware che hanno richiesto manutenzione, e i nostri robot sono inciampati e caduti a volte. Questi comportamenti non sono pensati per essere prodotti e per essere affidabili al 100%, ma sono sicuramente ripetibili. Cerchiamo di essere onesti nel mostrare le cose che possiamo fare, non un frammento di qualcosa che abbiamo fatto una volta. Penso che ci sia un’onestà richiesta nel dire che hai raggiunto qualcosa, e questo è sicuramente importante per noi.
Hai detto che Spot è ora abbastanza robusto per ballare tutto il giorno. E Atlas? Se continuate a sostituire le sue batterie, potrebbe anche ballare tutto il giorno?
Atlas, come macchina, è ancora, sai… ce ne sono solo una manciata nel mondo, sono complicati, e l’affidabilità non era un obiettivo principale. Di tanto in tanto avremmo sicuramente rotto il robot. Ma la robustezza dell’hardware, nel contesto di ciò che stavamo cercando di fare, era davvero grande. E senza questa robustezza, non saremmo stati in grado di fare il video. Penso che Atlas sia un po’ più simile a un elicottero, dove c’è un rapporto più alto tra il tempo che passi a fare manutenzione e il tempo che passi a operare. Mentre con Spot, l’aspettativa è che sia più come una macchina, dove puoi farla funzionare per molto tempo prima di doverla toccare.
Quando stai insegnando ad Atlas a fare nuove cose, sta usando qualche tipo di apprendimento automatico? E se no, perché no?
Come azienda, abbiamo esplorato un sacco di cose, ma Atlas non sta usando un controller di apprendimento in questo momento. Mi aspetto che arrivi un giorno in cui lo faremo. L’attuale performance di danza di Atlas utilizza una miscela di quello che ci piace chiamare controllo riflessivo, che è una combinazione di reazione alle forze, ottimizzazione della traiettoria online e offline, e controllo predittivo del modello. Sfruttiamo queste tecniche perché sono un modo affidabile di sbloccare cose ad alte prestazioni, e sappiamo come maneggiare questi strumenti molto bene. Non abbiamo trovato la fine della strada in termini di ciò che possiamo fare con loro.
Pianifichiamo di usare l’apprendimento per estendere e costruire sulla base del software e dell’hardware che abbiamo sviluppato, ma penso che noi, insieme alla comunità, stiamo ancora cercando di capire dove sono i posti giusti per applicare questi strumenti. Penso che lo vedrete come parte della nostra progressione naturale.
Molto del movimento dinamico di Atlas proviene dalla parte inferiore del corpo al momento, ma il parkour fa uso anche della forza e dell’agilità della parte superiore del corpo, e abbiamo visto alcune recenti immagini concettuali che mostrano Atlas fare volteggi e pullup. Puoi dirci di più?
Gli esseri umani e gli animali fanno cose incredibili usando le gambe, ma fanno cose ancora più incredibili quando usano tutto il corpo. Penso che il parkour fornisca un quadro fantastico che ci permette di progredire verso la mobilità di tutto il corpo. Camminare e correre è stato solo l’inizio di questo viaggio. Stiamo progredendo attraverso comportamenti dinamici più complessi come il salto e la rotazione, questo è ciò su cui abbiamo lavorato negli ultimi due anni. E il prossimo passo è quello di esplorare come l’uso delle braccia per spingere e tirare il mondo potrebbe estendere questa agilità.
Una delle missioni che ho dato al team Atlas è quella di iniziare a lavorare per sfruttare le braccia tanto quanto noi sfruttiamo le gambe per migliorare ed estendere la nostra mobilità, e sono davvero entusiasta di ciò su cui lavoreremo nei prossimi due anni, perché ci aprirà molte più opportunità per fare cose eccitanti con Atlas.
Qual è la sua prospettiva sugli attuatori idraulici rispetto a quelli elettrici per i robot altamente dinamici?
Nel corso della mia carriera alla Boston Dynamics, mi sono sentito appassionatamente connesso a così tanti tipi diversi di tecnologia, ma mi sono stabilito in un luogo in cui non credo più che si tratti di una conversazione tra due opzioni. Penso che la scelta della tecnologia degli attuatori dipenda davvero dalle dimensioni del robot che si sta costruendo, da ciò che si vuole che il robot faccia, da dove si vuole che vada e da molti altri fattori. In definitiva, è bene avere entrambi i tipi di attuatori nella tua cassetta degli attrezzi, e mi piace avere accesso a entrambi e li abbiamo usati entrambi con grande successo per realizzare macchine dinamiche davvero impressionanti.
Penso che l’unica distinzione tra attuatori idraulici ed elettrici che sembra essere distinta per me è probabilmente nella scala. È davvero impegnativo fare cose idrauliche minuscole perché l’industria non ne fa molte, e il reciproco è che l’industria non tende nemmeno a fare cose elettriche massicce. Quindi, si può trovare che sia una divisione naturale tra queste due tecnologie.
Oltre a quello su cui sta lavorando alla Boston Dynamics, di quale recente ricerca robotica è più entusiasta?
Per noi come azienda, ci piace molto seguire i progressi nel rilevamento, nella computer vision, nella percezione del terreno, sono tutte cose per cui più migliorano, più possiamo fare. Per me personalmente, una delle cose che mi piace seguire è la ricerca sulla manipolazione, e in particolare la ricerca sulla manipolazione che fa progredire la nostra comprensione delle interazioni complesse, basate sull’attrito, come scivolare e spingere, o muovere cose compiacenti come le corde.
Stiamo vedendo uno spostamento dal semplice pizzicare le cose, sollevarle, spostarle e farle cadere, a interazioni molto più significative con l’ambiente. La ricerca in questo tipo di manipolazione penso che sbloccherà il potenziale per i manipolatori mobili, e penso che aprirà davvero la capacità dei robot di interagire con il mondo in modo ricco.
C’è qualcos’altro che vorresti che la gente portasse via da questo video?
Per me personalmente, e penso che sia perché passo così tanto del mio tempo immerso nella robotica e ho un profondo apprezzamento per ciò che è un robot e quali sono le sue capacità e limitazioni, uno dei miei forti desideri è che più persone passino più tempo con i robot. Vediamo un sacco di opinioni e idee dalle persone che guardano i nostri video su YouTube, e mi sembra che se più persone avessero l’opportunità di pensare, imparare e passare del tempo con i robot, quel nuovo livello di comprensione potrebbe aiutarli a immaginare nuovi modi in cui i robot potrebbero essere utili nella nostra vita quotidiana. Penso che le possibilità siano davvero eccitanti, e voglio solo che più persone siano in grado di fare quel viaggio.
Questo articolo appare nel numero di stampa di marzo 2021 come “Boston Dynamics & Hyundai: Balliamo.”
.