Hur Boston Dynamics lärde sina robotar att dansa

Av Evan Ackerman

Posterad 2021-01-07 14:00 GMT

Aaron Saunders, vice VD för teknik på Boston Dynamics, berättar varifrån Atlas fick sina rörelser

Atlas-robotar som dansar
Bild: Boston Dynamics

Är det några saker som var särskilt svåra att överföra från mänskliga dansare till Atlas? Eller saker som Atlas kunde göra bättre än människor?

Vissa av de snurrande svängarna i balettdelarna krävde fler iterationer för att få dem att fungera, eftersom de låg längst bort från hopp och löpning och vissa andra saker som vi har mer erfarenhet av, så de utmanade både maskinen och programvaran på nya sätt. Vi lärde oss definitivt att inte underskatta hur flexibla och starka dansare är – när man tar elitidrottare och försöker göra vad de gör men med en robot är det ett svårt problem. Det är ödmjukt. I grunden tror jag inte att Atlas har det rörelseomfång eller den kraft som dessa idrottare har, även om vi fortsätter att utveckla våra robotar i riktning mot det, eftersom vi tror att för att kunna använda den här typen av robotar på bred front kommersiellt, och så småningom i ett hem, tror vi att de måste ha den här prestandanivån.

En sak som robotar är riktigt bra på är att göra något om och om igen på exakt samma sätt. Så när vi väl hade bestämt vad vi ville göra kunde robotarna bara göra det om och om igen när vi lekte med olika kameravinklar.

Jag kan förstå att ni kan använda mänskliga dansare för att hjälpa er att sätta ihop en rutin med Atlas, men hur fungerade det med Spot, och i synnerhet med Handle?

Jag tror att de människor som vi arbetade med faktiskt hade mycket talang för att tänka på rörelser, och för att tänka på hur de kan uttrycka sig själva genom rörelser. Och våra robotar rör sig riktigt bra – de är dynamiska, spännande och balanserar. Så jag tror att det vi upptäckte var att dansarna kopplade sig till hur robotarna rörde sig och sedan formade det till en berättelse, och det spelade ingen roll om det var två eller fyra ben. När man inte nödvändigtvis har en mall för djurs rörelser eller mänskligt beteende måste man tänka lite hårdare på hur man ska göra något, och det gäller även för mer pragmatiska kommersiella beteenden.

Hur informerar den erfarenhet ni får genom att lära robotar att dansa, gymnastik eller parkour er inställning till robotik för kommersiella tillämpningar?

Vi anser att de färdigheter som är inneboende i dans och parkour, som smidighet, balans och perception, är grundläggande för ett stort antal olika robottillämpningar. Kanske ännu viktigare är att hitta den skärningspunkten mellan att bygga en ny robotförmåga och att ha roligt, vilket har varit Boston Dynamics recept för robotteknik – det är ett bra sätt att göra framsteg.

Ett bra exempel är hur man, när man tänjer på gränserna genom att be sina robotar utföra dessa dynamiska rörelser under flera dagar, lär sig en hel del om robustheten hos sin hårdvara. Spot har genom sin produktifiering blivit otroligt robust och krävde nästan inget underhåll – den kunde bara dansa hela dagen om man lärde den det. Och anledningen till att den är så robust i dag är på grund av alla de lärdomar vi dragit av tidigare saker som kanske bara verkade konstiga och roliga. Man måste ge sig ut på okänd mark för att ens veta vad man inte vet.

Atlas och Spot dansar
Bild: Det är ofta svårt att avgöra hur mycket tid det tog att få saker och ting att fungera som man ville och hur representativa de är för robotarnas faktiska kapacitet. Kan du tala om det?

Låt mig försöka svara i samband med den här videon, men jag tror att samma sak gäller för alla videor som vi lägger upp. Vi arbetar hårt för att göra något, och när det väl fungerar så fungerar det. För Atlas fanns det mesta av robotkontrollen från vårt tidigare arbete, till exempel det arbete som vi har gjort med parkour, vilket skickade oss in på en väg där vi använde modellförutsägande styrsystem som tar hänsyn till dynamik och balans. Vi använde dem för att köra en uppsättning danssteg på roboten som vi hade utformat offline tillsammans med dansarna och koreografen. Så vi ägnade mycket tid, flera månader, åt att tänka på dansen och komponera rörelserna och iterera i simulering.

Dansen krävde mycket styrka och snabbhet, så vi uppgraderade till och med en del av Atlas hårdvara för att ge den mer kraft. Dans kan vara det mest kraftfulla vi har gjort hittills – även om man kanske tycker att parkour ser mycket mer explosivt ut, är mängden rörelse och hastighet som man har i dansen otrolig. Det tog också mycket tid under flera månader; att skapa kapaciteten i maskinen för att gå ihop med kapaciteten i algoritmerna.

När vi väl hade den slutliga sekvensen som du ser i videon filmade vi bara i två dagar. En stor del av den tiden gick åt till att räkna ut hur kameran ska flyttas genom en scen med en massa robotar för att fånga en kontinuerlig tvåminutersbild, och även om vi körde och filmade dansrutinen flera gånger kunde vi upprepa den ganska tillförlitligt. Det fanns ingen klippning eller skarvning i den inledande tvåminutersbilden.

Det fanns definitivt en del fel i hårdvaran som krävde underhåll, och våra robotar snubblade och föll ner ibland. Det är inte meningen att dessa beteenden ska kunna produceras och vara 100 procent tillförlitliga, men de kan definitivt upprepas. Vi försöker vara ärliga med att visa saker som vi kan göra, inte ett utdrag av något som vi gjorde en gång. Jag tror att det krävs en ärlighet när man säger att man har uppnått något, och det är definitivt viktigt för oss.

Du nämnde att Spot nu är tillräckligt robust för att kunna dansa hela dagen. Hur är det med Atlas? Om du fortsätter att byta batterier, kan den också dansa hela dagen?

Atlas, som maskin, är fortfarande, du vet… det finns bara en handfull av dem i världen, de är komplicerade, och tillförlitlighet var inte ett huvudfokus. Vi skulle definitivt förstöra roboten från tid till annan. Men hårdvarans robusthet, i förhållande till vad vi försökte göra, var verkligen fantastisk. Och utan den robustheten skulle vi inte ha kunnat göra videon överhuvudtaget. Jag tror att Atlas är lite mer som en helikopter, där det finns ett högre förhållande mellan den tid man ägnar åt underhåll och den tid man ägnar åt drift. När det gäller Spot förväntar man sig att det är mer som en bil, där man kan köra den länge innan man behöver röra den.

När ni lär Atlas att göra nya saker, använder den då någon form av maskininlärning? Och om inte, varför inte?

Som företag har vi utforskat många saker, men Atlas använder sig inte av någon inlärningsstyrning just nu. Jag förväntar mig att det kommer en dag då vi gör det. Atlas nuvarande dansföreställning använder en blandning av vad vi gillar att kalla reflexiv styrning, vilket är en kombination av att reagera på krafter, optimering av bana online och offline och modellförutsägande styrning. Vi utnyttjar dessa tekniker eftersom de är ett pålitligt sätt att låsa upp riktigt högpresterande saker, och vi vet hur vi ska använda dessa verktyg riktigt bra. Vi har inte hittat slutet på vägen när det gäller vad vi kan göra med dem.

Vi planerar att använda inlärning för att utöka och bygga vidare på den grund av mjukvara och hårdvara som vi har utvecklat, men jag tror att vi, tillsammans med samhället, fortfarande försöker ta reda på var de rätta platserna för att tillämpa dessa verktyg finns. Jag tror att du kommer att se det som en del av vår naturliga utveckling.

Atlas Parkour
Bild: För närvarande kommer en stor del av Atlas dynamiska rörelse från underkroppen, men parkour använder sig också av överkroppens styrka och smidighet, och vi har nyligen sett några konceptbilder som visar hur Atlas gör hopp och pullups. Kan du berätta mer?

Människor och djur gör fantastiska saker med hjälp av sina ben, men de gör ännu mer fantastiska saker när de använder hela kroppen. Jag tycker att parkour utgör en fantastisk ram som gör det möjligt för oss att utvecklas mot rörlighet med hela kroppen. Att gå och springa var bara början på den resan. Vi går vidare till mer komplexa dynamiska beteenden som att hoppa och snurra, det är vad vi har arbetat med under de senaste åren. Och nästa steg är att utforska hur man genom att använda armarna för att skjuta och dra i världen kan utöka denna smidighet.

Ett av de uppdrag som jag har gett Atlas-teamet är att börja arbeta med att utnyttja armarna lika mycket som vi utnyttjar benen för att förbättra och utöka vår rörlighet, och jag är verkligen entusiastisk över det som vi kommer att arbeta med under de närmaste åren, eftersom det kommer att öppna upp många fler möjligheter för oss att göra spännande saker med Atlas.

Hur ser du på hydrauliska respektive elektriska manöverdon för mycket dynamiska robotar?

Under min karriär på Boston Dynamics har jag känt mig passionerat kopplad till så många olika typer av teknik, men jag har kommit till en plats där jag verkligen inte tror att det här är en antingen-eller-konversation längre. Jag tror att valet av manöverdonsteknik verkligen beror på storleken på den robot du bygger, vad du vill att roboten ska göra, vart du vill att den ska ta vägen och många andra faktorer. I slutändan är det bra att ha båda typerna av ställdon i sin verktygslåda, och jag älskar att ha tillgång till båda – och vi har använt båda med stor framgång för att göra riktigt imponerande dynamiska maskiner.

Jag tror att den enda avgränsning mellan hydrauliska och elektriska ställdon som verkar vara distinkt för mig är förmodligen i skala. Det är verkligen en utmaning att tillverka små hydrauliska saker eftersom branschen inte gör så mycket av det, och tvärtom tenderar branschen inte heller att tillverka massiva elektriska saker. Så det kan vara en naturlig uppdelning mellan dessa två tekniker.

Bortsett från det du arbetar med på Boston Dynamics, vilken nyare robotforskning är du mest entusiastisk över?

För oss som företag älskar vi verkligen att följa framstegen inom avkänning, datorsyn, terränguppfattning, allt detta är saker som vi kan göra ju bättre de blir, desto mer kan vi göra. För mig personligen är en av de saker som jag gillar att följa är forskning om manipulation, och i synnerhet forskning om manipulation som ökar vår förståelse för komplexa, friktionsbaserade interaktioner som att glida och skjuta, eller att förflytta följsamma saker som rep.

Vi ser ett skifte från att bara nypa i saker, lyfta dem, förflytta dem och släppa dem, till mycket mer meningsfulla interaktioner med omgivningen. Forskning inom den typen av manipulation tror jag kommer att frigöra potentialen för mobila manipulatorer, och jag tror att det verkligen kommer att öppna upp möjligheten för robotar att interagera med världen på ett innehållsrikt sätt.

Är det något annat du vill att folk ska ta med sig från den här videon?

För mig personligen, och jag tror att det beror på att jag tillbringar så mycket av min tid i robotteknik och att jag har en djup förståelse för vad en robot är och vilka möjligheter och begränsningar den har, är en av mina starka önskemål att fler människor ska få tillbringa mer tid med robotar. Vi ser många åsikter och idéer från människor som tittar på våra videor på YouTube, och jag tycker att om fler människor hade möjlighet att tänka på, lära sig om och tillbringa tid med robotar, skulle den nya nivån av förståelse kunna hjälpa dem att föreställa sig nya sätt på vilka robotar kan vara användbara i vårt dagliga liv. Jag tycker att möjligheterna är riktigt spännande, och jag vill bara att fler människor ska kunna göra den resan.

Denna artikel finns i det tryckta numret från mars 2021 som ”Boston Dynamics & Hyundai”: Låt oss dansa.”

Lämna ett svar

Din e-postadress kommer inte publiceras.