Aaron Saunders, Boston Dynamics’ VP of Engineering, tells us where Atlas got its moves from
Czy były jakieś rzeczy, które były szczególnie trudne do przełożenia z ludzkich tancerzy na Atlasa? Albo rzeczy, które Atlas mógł zrobić lepiej niż ludzie?
Niektóre z obrotów w baletach wymagały więcej iteracji, aby zadziałały, ponieważ były najbardziej odległe od skoków i biegów oraz innych rzeczy, z którymi mamy większe doświadczenie, więc stanowiły wyzwanie zarówno dla maszyny, jak i oprogramowania na nowe sposoby. Zdecydowanie nauczyliśmy się nie lekceważyć tego, jak elastyczni i silni są tancerze – kiedy bierzesz elitarnych sportowców i próbujesz zrobić to, co oni, ale z robotem, jest to trudny problem. To upokarzające. Zasadniczo nie sądzę, aby Atlas miał taki zakres ruchu lub siłę, jak ci sportowcy, chociaż nadal rozwijamy nasze roboty w tym kierunku, ponieważ uważamy, że aby szeroko rozpowszechnić tego rodzaju roboty w handlu, a ostatecznie w domu, muszą one mieć taki poziom wydajności.
Jedną z rzeczy, w których roboty są naprawdę dobre, jest robienie czegoś w kółko w ten sam sposób. Kiedy już więc ustaliliśmy, co chcemy zrobić, roboty mogły to robić raz za razem, bawiąc się różnymi kątami kamery.
Rozumiem, jak mogliście wykorzystać ludzkich tancerzy, aby pomogli wam ułożyć rutynę z Atlasem, ale jak to działało ze Spotem, a zwłaszcza z Rączką?
Myślę, że ludzie, z którymi pracowaliśmy, mieli wiele talentu do myślenia o ruchu i o tym, jak wyrazić siebie poprzez ruch. A nasze roboty poruszają się naprawdę dobrze – są dynamiczne, ekscytujące, zachowują równowagę. Myślę, że odkryliśmy, że tancerze połączyli się ze sposobem, w jaki roboty się poruszały, a następnie przekształcili to w historię i nie miało znaczenia, czy roboty miały dwie czy cztery nogi. Kiedy nie ma się wzorca ruchu zwierzęcia lub ludzkiego zachowania, trzeba się trochę bardziej zastanowić nad tym, jak coś zrobić, i to samo dotyczy bardziej pragmatycznych zachowań komercyjnych.
Jak doświadczenie, które zdobyliście ucząc roboty tańca, gimnastyki lub parkour, wpłynęło na wasze podejście do robotyki do zastosowań komercyjnych?
Myślimy, że umiejętności właściwe dla tańca i parkour, takie jak zwinność, równowaga i percepcja, są fundamentalne dla szerokiej gamy zastosowań robotów. Co ważniejsze, znalezienie punktu przecięcia między budowaniem nowych możliwości robota a dobrą zabawą jest receptą Boston Dynamics na robotykę – to świetny sposób na rozwój. Jednym z dobrych przykładów jest to, że kiedy przesuwa się granice, prosząc robota o wykonanie tych dynamicznych ruchów w ciągu kilku dni, można się wiele nauczyć o wytrzymałości sprzętu. Spot, dzięki swojej produktywności, stał się niewiarygodnie wytrzymały i nie wymagał prawie żadnej konserwacji – mógł po prostu tańczyć przez cały dzień, gdy tylko go tego nauczyłeś. Powodem, dla którego jest dziś tak wytrzymały, są wszystkie te lekcje, które wynieśliśmy z poprzednich rzeczy, które mogły wydawać się po prostu dziwne i zabawne. Trzeba zapuścić się na niezbadane terytorium, aby wiedzieć, czego się nie wie.
Często trudno powiedzieć na podstawie oglądania filmów takich jak te, ile czasu zajęło sprawienie, by rzeczy działały tak, jak chciałeś, i na ile są one reprezentatywne dla rzeczywistych możliwości robotów. Czy możesz o tym porozmawiać?
Postaram się odpowiedzieć w kontekście tego filmu, ale myślę, że to samo dotyczy wszystkich filmów, które zamieszczamy. Ciężko pracujemy, aby coś stworzyć, a gdy już to działa, to działa. W przypadku Atlasa większość sterowania robotem pochodzi z naszych wcześniejszych prac, takich jak praca nad parkourem, która skierowała nas na ścieżkę wykorzystania kontrolerów przewidywania modelu, które uwzględniają dynamikę i równowagę. Użyliśmy ich do uruchomienia na robocie zestawu kroków tanecznych, które zaprojektowaliśmy offline z tancerzami i choreografem. Spędziliśmy wiele czasu, miesięcy, myśląc o tańcu, komponując ruchy i iterując je w symulacji.
Taniec wymagał dużej siły i szybkości, więc zmodernizowaliśmy nawet sprzęt Atlasa, aby dać mu więcej mocy. Taniec może być najbardziej energetyczną rzeczą, jaką do tej pory zrobiliśmy – nawet jeśli wydaje ci się, że parkour wygląda bardziej wybuchowo, ilość ruchu i prędkość, jaką masz w tańcu, jest niesamowita. To również zajęło wiele czasu w ciągu miesięcy; tworzenie możliwości maszyny, aby iść w parze z możliwościami algorytmów.
Kiedy mieliśmy już ostateczną sekwencję, którą widzicie na filmie, filmowaliśmy tylko dwa dni. Dużą część tego czasu spędziliśmy na wymyślaniu, jak poruszać kamerą po scenie z mnóstwem robotów, aby uchwycić jedno ciągłe dwuminutowe ujęcie, a kiedy uruchomiliśmy i sfilmowaliśmy układ taneczny wiele razy, mogliśmy powtórzyć go dość wiarygodnie. W tym dwuminutowym ujęciu nie było żadnych cięć ani splatania.
Na pewno były jakieś usterki w sprzęcie, które wymagały konserwacji, a nasze roboty potykały się i upadały czasami. Te zachowania nie są przeznaczone do produkcji i stuprocentowej niezawodności, ale na pewno są powtarzalne. Staramy się być uczciwi, pokazując rzeczy, które potrafimy zrobić, a nie wycinek czegoś, co zrobiliśmy raz. Myślę, że uczciwość jest wymagana w mówieniu, że coś osiągnąłeś i to jest dla nas zdecydowanie ważne.
Wspomniałeś, że Spot jest teraz wystarczająco solidny, aby tańczyć cały dzień. A co z Atlasem? Czy gdybyśmy ciągle wymieniali mu baterie, też mógłby tańczyć cały dzień?
Atlas, jako maszyna, jest nadal, no wiesz… jest ich tylko garstka na świecie, są skomplikowane, a niezawodność nie była głównym celem. Na pewno od czasu do czasu zepsuliśmy robota. Ale solidność sprzętu, w kontekście tego, co próbowaliśmy zrobić, była naprawdę świetna. Bez tej solidności nie bylibyśmy w stanie w ogóle nakręcić tego filmu. Myślę, że Atlas jest trochę bardziej podobny do helikoptera, gdzie istnieje większy stosunek czasu spędzonego na konserwacji do czasu spędzonego na eksploatacji. W przypadku systemu Spot oczekujemy, że będzie on bardziej przypominał samochód, który można eksploatować przez długi czas, zanim trzeba będzie go dotknąć.
Czy podczas uczenia systemu Atlas, aby robił nowe rzeczy, wykorzystuje on jakiś rodzaj uczenia maszynowego? A jeśli nie, to dlaczego?
Jako firma badaliśmy wiele rzeczy, ale Atlas nie korzysta teraz z uczącego się kontrolera. Spodziewam się, że nadejdzie dzień, kiedy to zrobimy. Obecny taniec w Atlasie wykorzystuje mieszankę tego, co lubimy nazywać kontrolą refleksyjną, która jest połączeniem reagowania na siły, optymalizacji trajektorii online i offline oraz kontroli predykcyjnej modelu. Wykorzystujemy te techniki, ponieważ są one niezawodnym sposobem na odblokowanie naprawdę wysokiej wydajności, a my wiemy, jak naprawdę dobrze posługiwać się tymi narzędziami. Nie znaleźliśmy jeszcze końca drogi, jeśli chodzi o to, co możemy z nimi zrobić.
Planujemy wykorzystywać naukę do rozszerzania i budowania na fundamencie oprogramowania i sprzętu, który stworzyliśmy, ale myślę, że my, wraz ze społecznością, wciąż próbujemy dowiedzieć się, gdzie są właściwe miejsca do zastosowania tych narzędzi. Myślę, że zobaczycie to jako część naszego naturalnego postępu.
Większa część dynamicznego ruchu Atlasa pochodzi obecnie z jego dolnej części ciała, ale parkour wykorzystuje również siłę i zwinność górnej części ciała, a my widzieliśmy kilka ostatnich obrazów koncepcyjnych pokazujących Atlasa wykonującego skoki i podciągnięcia. Możesz powiedzieć nam więcej?
Ludzie i zwierzęta robią niesamowite rzeczy używając swoich nóg, ale robią jeszcze bardziej niesamowite rzeczy, gdy używają całego ciała. Myślę, że parkour zapewnia fantastyczne ramy, które pozwalają nam rozwijać się w kierunku mobilności całego ciała. Chodzenie i bieganie było tylko początkiem tej podróży. Obecnie pracujemy nad bardziej złożonymi dynamicznymi zachowaniami, takimi jak skoki i obroty, nad którymi pracowaliśmy przez ostatnie kilka lat. Kolejnym krokiem jest zbadanie, w jaki sposób wykorzystanie ramion do pchania i ciągnięcia świata może zwiększyć tę zwinność.
Jedną z misji, które powierzyłem zespołowi Atlasa, jest rozpoczęcie pracy nad wykorzystaniem ramion w takim samym stopniu, w jakim wykorzystujemy nogi, aby wzmocnić i rozszerzyć naszą mobilność. Jestem naprawdę podekscytowany tym, nad czym będziemy pracować przez następne kilka lat, ponieważ otworzy to przed nami o wiele więcej możliwości robienia ekscytujących rzeczy z Atlasem.
Jakie jest Twoje spojrzenie na siłowniki hydrauliczne i elektryczne dla wysoce dynamicznych robotów?
Przez całą moją karierę w Boston Dynamics czułem się związany z wieloma różnymi rodzajami technologii, ale osiadłem w miejscu, w którym naprawdę nie sądzę, aby była to rozmowa albo-albo. Myślę, że wybór technologii siłowników zależy od wielkości budowanego robota, tego, co ma on robić, gdzie ma się poruszać i wielu innych czynników. W ostatecznym rozrachunku dobrze jest mieć w swojej skrzynce narzędziowej oba rodzaje siłowników, a ja uwielbiam mieć do nich dostęp – używaliśmy ich z wielkim powodzeniem do tworzenia naprawdę imponujących, dynamicznych maszyn.
Jedyna granica pomiędzy siłownikami hydraulicznymi i elektrycznymi, która wydaje mi się wyraźna, dotyczy skali. Tworzenie niewielkich siłowników hydraulicznych jest nie lada wyzwaniem, ponieważ branża nie produkuje ich zbyt wiele, i odwrotnie – branża nie ma tendencji do tworzenia masywnych siłowników elektrycznych. Więc może się okazać, że jest to naturalny podział między tymi dwoma technologiami.
Poza tym, nad czym pracujesz w Boston Dynamics, jakie ostatnie badania w dziedzinie robotyki są dla Ciebie najbardziej ekscytujące?
Dla nas jako firmy, naprawdę uwielbiamy śledzić postępy w wyczuwaniu, wizji komputerowej, percepcji terenu, to wszystko są rzeczy, w których im są lepsze, tym więcej możemy zrobić. Dla mnie osobiście, jedną z rzeczy, które lubię śledzić są badania nad manipulacją, a w szczególności badania nad manipulacją, które zwiększają nasze zrozumienie złożonych, opartych na tarciu interakcji, takich jak przesuwanie i pchanie, lub poruszanie się po rzeczach zgodnych, takich jak liny.
Obserwujemy przejście od zwykłego szczypania rzeczy, podnoszenia ich, przesuwania i upuszczania, do znacznie bardziej znaczących interakcji ze środowiskiem. Badania nad tym typem manipulacji, jak sądzę, odblokują potencjał manipulatorów mobilnych i myślę, że naprawdę otworzą przed robotami możliwość interakcji ze światem w bogaty sposób.
Czy jest coś jeszcze, co chciałbyś, aby ludzie wynieśli z tego filmu?
Dla mnie osobiście, i myślę, że to dlatego, że spędzam tak dużo czasu zanurzony w robotyce i mam głębokie uznanie dla tego, czym jest robot i jakie są jego możliwości i ograniczenia, jednym z moich silnych pragnień jest, aby więcej ludzi spędzało więcej czasu z robotami. Widzimy wiele opinii i pomysłów od ludzi oglądających nasze filmy na YouTube i wydaje mi się, że gdyby więcej osób miało możliwość myślenia o robotach, uczenia się o nich i spędzania z nimi czasu, ten nowy poziom zrozumienia mógłby pomóc im wyobrazić sobie nowe sposoby, w jakie roboty mogłyby być użyteczne w naszym codziennym życiu. Myślę, że możliwości są naprawdę ekscytujące i chcę, aby więcej osób mogło odbyć taką podróż.
Ten artykuł ukazał się w wydaniu drukowanym w marcu 2021 roku jako „Boston Dynamics & Hyundai: Let’s Dance.”