Robotiikan ”ChatGPT-hetki” saattaa koittaa jo kahden vuoden sisällä, arvioi Kiinan robotiikka-alan johtavan yrityksen Unitree Roboticsin perustaja. Edellytys tälle on, että tekoälyteknologia kehittyy riittävästi ohjaamaan robottien liikkeitä. Aiheesta kirjoittaa South China Morning Post -lehti (SCMP).

Wang Xingxing määrittelee tällaisen läpimurron ensimmäiseksi kerraksi, kun robotti kykenee suorittamaan perustehtäviä, kuten siivoamaan huoneen tai tuomaan vesipullon tietylle henkilölle paikassa, jossa se ei ole koskaan aiemmin käynyt.

”Jos kehitys etenee nopeasti, se voi tapahtua seuraavan vuoden tai kahden aikana, tai ehkä kahden tai kolmen vuoden sisällä”, Wang sanoi lauantaina World Robot Conference -tapahtumassa Pekingissä.

Vaikka sekä robottien laitteisto, kuten näppärät kädet, että koulutusdata ovat jo riittävän hyviä mahdollistamaan tämän suoritteen, ratkaiseva tekijä eli ”tekoäly ruumiillista älykkyyttä varten” on Wangin mukaan vielä täysin riittämätön.

Hän epäilee, riittävätkö suositut vision language action (VLA) -mallit, jotka käyttävät melko ”tyhmää” arkkitehtuuria, näihin tehtäviin. VLA-mallien avulla robotit käytännössä oppivat näkemänsä ja kuulemansa kautta. Vaikka Unitree käyttää myös tällaisia malleja yhdessä vahvistusoppimisen kanssa parantaakseen esikoulutettuja VLA-malleja myöhemmissä tehtävissä lähestymistapa vaatii Wangin mukaan paljon optimointia.

Wang pitää todennäköisempänä, että video- tai interaktiivisen mallin luominen tekstikehotusten perusteella on toimivampi tapa robottien liikkeenohjaukseen. Esimerkkinä hän mainitsee Googlen yleiskäyttöisen Genie 3 -”maailmanmallin”, joka lanseerattiin viime viikon tiistaina. Mallin kerrotaan kykenevän luomaan dynaamisten maailmojen malleja, jotka sisältävät tietoa fysikaalisista ominaisuuksista. Unitree kokeilee myös mallinnuslähestymistapaa, mutta ongelmana on, että tällaiset mallit vaativat suuren määrän grafiikkasuorittimia robottikoulutuksen tarpeet vaativan kuvanlaadun varmistamiseksi.

Vuonna 2016 perustettu Unitree aloitti humanoidirobottien parissa työskentelyn vasta vuoden 2023 alussa. Päätös syntyi tekoälyn nopean kasvun innoittamana, erityisesti ChatGPT:n julkaisun jälkeen. Wang jakaa kiitosta myös alan kilpailijoille, kuten Teslalle, joka aikoo tuottaa tuhansia Optimus-robottejaan tänä vuonna. Kilpailu kirittää Unitreetä kehittämään omia ratkaisujaan.

Alan näkymät ovat hyvät. Vahvan markkinakysynnän ansiosta jokainen robottivalmistaja, komponenttitoimittajat mukaan lukien, on nauttinut 50–100 prosentin vuotuisesta tulokasvusta vuoden 2025 ensimmäisellä puoliskolla, Wang kertoo.