Aaron Saunders, a Boston Dynamics műszaki alelnöke elmondja, honnan vette az Atlas a mozdulatokat
Voltak olyan dolgok, amelyeket különösen nehéz volt átültetni az emberi táncosokról az Atlasra? Vagy olyan dolgok, amiket az Atlas jobban tudott csinálni, mint az emberek?
A balettrészek néhány pörgős fordulata több iterációt igényelt, hogy működjön, mert ezek voltak a legtávolabb az ugrástól és a futástól és néhány más dologtól, amivel több tapasztalatunk van, így ezek új kihívások elé állították mind a gépet, mind a szoftvert. Határozottan megtanultuk, hogy nem szabad alábecsülni, mennyire rugalmasak és erősek a táncosok – amikor elit sportolókat veszünk, és megpróbáljuk azt csinálni, amit ők, de egy robottal, az egy nehéz probléma. Megalázó. Alapvetően nem hiszem, hogy az Atlasnak olyan mozgástartománya vagy ereje lenne, mint ezeknek a sportolóknak, bár tovább fejlesztjük a robotjainkat, mert úgy gondoljuk, hogy ahhoz, hogy az ilyen típusú robotokat széles körben be tudjuk vetni a kereskedelemben, és végül az otthonokban, úgy gondoljuk, hogy ilyen szintű teljesítményre van szükségük.
A robotok egy dologban nagyon jók, hogy újra és újra pontosan ugyanúgy csinálnak valamit. Szóval, ha már egyszer meghatároztuk, hogy mit akarunk csinálni, a robotok újra és újra meg tudták csinálni, miközben különböző kameraszögekkel játszottunk.
Megértem, hogy emberi táncosokat használhattok, hogy segítsenek összeállítani egy gyakorlatot az Atlas-szal, de hogyan működött ez Spot-tal, és különösen Handle-lel?
Úgy gondolom, hogy az emberek, akikkel dolgoztunk, nagyon tehetségesek voltak a mozgásban való gondolkodásban, és abban, hogy hogyan fejezzék ki magukat a mozgáson keresztül. És a robotjaink nagyon jól mozognak – dinamikusak, izgalmasak, egyensúlyoznak. Úgyhogy azt hiszem, azt tapasztaltuk, hogy a táncosok kapcsolódtak a robotok mozgásához, majd ezt egy történetté formálták, és nem számított, hogy két- vagy négylábúak voltak. Ha nem feltétlenül van egy sablon az állatok mozgásáról vagy az emberi viselkedésről, akkor egy kicsit jobban át kell gondolni, hogyan kell csinálni valamit, és ez igaz a pragmatikusabb kereskedelmi viselkedésre is.
A robotok táncra, tornára vagy parkourra való tanítása során szerzett tapasztalataik hogyan befolyásolják a kereskedelmi célú robotika megközelítését?
Úgy gondoljuk, hogy a táncban és a parkourban rejlő képességek, mint például a mozgékonyság, az egyensúly és az érzékelés, alapvető fontosságúak a robotok sokféle alkalmazásához. Talán még ennél is fontosabb, hogy a Boston Dynamics receptje a robotika terén az volt, hogy megtaláljuk ezt a metszéspontot egy új robotképesség megalkotása és a szórakozás között – ez egy nagyszerű módja a fejlődésnek.
Az egyik jó példa, hogy amikor a határokat feszegetjük azzal, hogy a robotokat több napon keresztül ilyen dinamikus mozgásokra kérjük, sokat tanulunk a hardver robusztusságáról. A Spot a produktivizálása révén hihetetlenül robosztus lett, és szinte semmilyen karbantartást nem igényelt – egész nap csak táncolni tudott, ha egyszer megtanítottad rá. És az ok, amiért ma ilyen robusztus, az a sok lecke, amit a korábbi dolgokból tanultunk, amelyek talán csak furcsának és szórakoztatónak tűntek. Ismeretlen területre kell menned ahhoz, hogy egyáltalán megtudd, mit nem tudsz.
Az ilyen videókat nézve gyakran nehéz megmondani, hogy mennyi időbe telt, amíg a dolgok úgy működtek, ahogy szerettük volna, és hogy mennyire reprezentálják a robotok tényleges képességeit. Tudna erről beszélni?
Hadd próbáljak meg ennek a videónak a kontextusában válaszolni, de szerintem ugyanez igaz az összes általunk közzétett videóra. Keményen dolgozunk, hogy elkészítsünk valamit, és ha egyszer működik, akkor működik. Az Atlas esetében a robotvezérlés nagy része a korábbi munkáinkból származik, például a parkourral kapcsolatos munkáinkból, amelyek a dinamikát és az egyensúlyt figyelembe vevő modell-előrejelző vezérlők használatának útjára tereltek minket. Ezeket arra használtuk, hogy a roboton lefuttassunk egy sor tánclépést, amelyeket offline terveztünk a táncosokkal és a koreográfussal. Tehát sok időt, hónapokat töltöttünk a tánc átgondolásával, a mozdulatok összeállításával és a szimulációban történő ismétléssel.
A tánc sok erőt és sebességet igényelt, ezért még az Atlas hardverének egy részét is továbbfejlesztettük, hogy nagyobb teljesítményt adjunk neki. A tánc talán a legnagyobb teljesítményű dolog, amit eddig csináltunk – még ha azt is gondolhatod, hogy a parkour sokkal robbanékonyabbnak tűnik, a mozgás és a sebesség, ami a táncban van, hihetetlen. Ez is rengeteg időt vett igénybe hónapokon keresztül; a gép képességének megteremtése az algoritmusok képességével együtt.
Amikor elkészült a videóban látható végső szekvencia, csak két napot forgattunk. Ennek az időnek nagy részét azzal töltöttük, hogy kitaláljuk, hogyan mozgassuk a kamerát egy csomó robotot tartalmazó jeleneten keresztül, hogy egy folyamatos kétperces felvételt készítsünk, és miközben többször lefuttattuk és lefilmeztük a táncos rutint, elég megbízhatóan meg tudtuk ismételni. Nem volt vágás vagy összevágás abban a kétperces nyitóképben.
Kétségtelenül voltak hibák a hardverben, amelyek karbantartást igényeltek, és a robotjaink néha megbotlottak és elestek. Ezek a viselkedések nem arra valók, hogy produktivizálhatók és 100 százalékig megbízhatóak legyenek, de határozottan megismételhetőek. Igyekszünk őszintén megmutatni azokat a dolgokat, amiket meg tudunk csinálni, nem pedig egy részletet valamiből, amit egyszer csináltunk. Azt hiszem, őszinteségre van szükség ahhoz, hogy azt mondjuk, hogy elértünk valamit, és ez határozottan fontos számunkra.
Elmondtad, hogy a Spot most már elég robusztus ahhoz, hogy egész nap táncoljon. Mi a helyzet Atlasszal? Ha folyamatosan cserélnéd az elemeit, akkor is képes lenne egész nap táncolni?
Az Atlas, mint gép, még mindig, tudod… csak egy maroknyi van belőle a világon, bonyolult, és a megbízhatóság nem volt a fő szempont. Időről időre biztosan összetörnénk a robotot. De a hardver robusztussága, annak fényében, amit csinálni akartunk, igazán nagyszerű volt. És e nélkül a robusztusság nélkül egyáltalán nem tudtuk volna elkészíteni a videót. Azt hiszem, az Atlas egy kicsit inkább hasonlít egy helikopterre, ahol nagyobb az arány a karbantartással és a működéssel töltött idő között. Míg a Spot esetében az elvárás az, hogy inkább olyan legyen, mint egy autó, ahol hosszú ideig lehet üzemeltetni, mielőtt hozzá kellene nyúlni.
Amikor az Atlast új dolgokra tanítja, használ valamilyen gépi tanulást? És ha nem, akkor miért nem?
Vállalkozásként sok mindent felfedeztünk már, de az Atlas jelenleg nem használ tanuló vezérlőt. Arra számítok, hogy eljön majd a nap, amikor használni fogjuk. Az Atlas jelenlegi táncelőadása az általunk reflexívnek nevezett vezérlés keverékét használja, ami az erőkre való reagálás, az online és offline pályaoptimalizálás és a modell-előrejelző vezérlés kombinációja. Azért használjuk ki ezeket a technikákat, mert ezek egy megbízható módja az igazán nagy teljesítményű dolgok felszabadításának, és értjük, hogyan kell ezeket az eszközöket igazán jól használni. Még nem értük el az út végét abból a szempontból, hogy mit tudunk velük csinálni.
Azt tervezzük, hogy a tanulás segítségével bővítjük és építünk az általunk kifejlesztett szoftver és hardver alapjaira, de úgy gondolom, hogy mi, a közösséggel együtt, még mindig próbáljuk kitalálni, hogy hol vannak a megfelelő helyek, ahol ezeket az eszközöket alkalmazni lehet. Azt hiszem, ezt a természetes fejlődésünk részeként fogod látni.”
Az Atlas dinamikus mozgásának nagy része jelenleg az alsó testéből származik, de a parkour a felsőtest erejét és mozgékonyságát is felhasználja, és láttunk néhány friss koncepcióképet, amelyeken az Atlas ugrás és húzódzkodás látható. Tudnál többet mondani?
Az emberek és az állatok elképesztő dolgokra képesek a lábaikkal, de még elképesztőbb dolgokra képesek, ha az egész testüket használják. Úgy gondolom, hogy a parkour fantasztikus keretet biztosít, amely lehetővé teszi számunkra, hogy az egész test mobilitása felé haladjunk. A gyaloglás és a futás csak a kezdete volt ennek az útnak. Olyan összetettebb dinamikus viselkedési formákon keresztül haladunk, mint az ugrás és a pörgés, ezen dolgoztunk az elmúlt néhány évben. A következő lépés az, hogy feltárjuk, hogyan lehetne a karok használatával a világot tologatni és húzni, hogy kiterjesszük ezt a mozgékonyságot.
Az egyik küldetés, amit az Atlas csapatának adtam, hogy elkezdjünk dolgozni a karok kihasználásán, ahogyan a lábakat is kihasználjuk a mobilitás javítására és kiterjesztésére, és nagyon izgatott vagyok, hogy min fogunk dolgozni a következő néhány évben, mert ez sokkal több lehetőséget fog megnyitni számunkra, hogy izgalmas dolgokat csináljunk az Atlasszal.
Mi a véleménye a nagy dinamikájú robotok hidraulikus és elektromos meghajtásairól?
A Boston Dynamicsnál töltött karrierem során nagyon sokféle technológia iránt éreztem szenvedélyes kötődést, de mostanra eljutottam oda, hogy már nem hiszem, hogy ez egy vagy-vagy beszélgetés lenne. Úgy gondolom, hogy a működtető technológia kiválasztása valóban attól függ, hogy mekkora robotot építünk, mit szeretnénk, hogy a robot mit csináljon, hová szeretnénk, hogy menjen, és sok más tényezőtől. Végső soron jó, ha mindkét fajta aktuátor megtalálható az eszköztárunkban, és én szeretem, ha mindkettőhöz hozzáférhetünk – és mindkettőt nagy sikerrel használtuk, hogy igazán lenyűgöző dinamikus gépeket készítsünk.
A hidraulikus és elektromos aktuátorok közötti egyetlen határvonal, ami számomra egyértelműnek tűnik, az valószínűleg a méretarány. Igazán nagy kihívás apró hidraulikus dolgokat készíteni, mert az ipar egyszerűen nem sok ilyet csinál, és ennek a fordítottja az, hogy az ipar szintén nem hajlamos hatalmas elektromos dolgokat gyártani. Tehát ez lehet, hogy természetes megosztottságot jelent e két technológia között.
Azon kívül, amin a Boston Dynamicsnál dolgozik, milyen legújabb robotikai kutatások izgatják leginkább?
Mi, mint vállalat, nagyon szeretjük követni az érzékelés, a számítógépes látás, a terepfelismerés fejlődését, ezek mind olyan dolgok, ahol minél jobbak lesznek, annál többet tudunk tenni. Személy szerint az egyik dolog, amit szeretek követni, az a manipulációs kutatás, és különösen az olyan manipulációs kutatás, amely továbbfejleszti a komplex, súrlódáson alapuló interakciók megértését, mint például a csúszás és a tolás, vagy a hajlékony dolgok, például kötelek mozgatása.
Azt látjuk, hogy a dolgok egyszerű megcsípése, felemelése, mozgatása és elejtése helyett a környezettel való sokkal értelmesebb interakciók felé mozdulunk el. Az ilyen típusú manipulációval kapcsolatos kutatások szerintem felszabadítják a mobil manipulátorok potenciálját, és szerintem ez valóban megnyitja a robotok előtt a világgal való gazdag interakció lehetőségét.
Van még valami, amit szeretnél, ha az emberek elhoznának ebből a videóból?
Nekem személy szerint – és azt hiszem, ez azért van, mert az időm nagy részét a robotikában töltöm, és nagyra értékelem, hogy mi a robot, milyen képességei és korlátai vannak – az egyik erős vágyam az, hogy minél több ember töltsön több időt robotokkal. Sok véleményt és ötletet látunk azoktól az emberektől, akik megnézik a videóinkat a YouTube-on, és úgy tűnik számomra, hogy ha több embernek lenne lehetősége gondolkodni, tanulni és időt tölteni a robotokkal, akkor ez az új szintű megértés segíthetné őket abban, hogy új utakat képzeljenek el, amelyeken a robotok hasznosak lehetnek a mindennapi életünkben. Szerintem a lehetőségek nagyon izgalmasak, és szeretném, ha minél több embernek lehetősége lenne erre az utazásra.”
Ez a cikk a 2021. márciusi nyomtatott kiadásban “Boston Dynamics & Hyundai” címmel jelenik meg: Táncoljunk.”