A tudomány, a technológia és a kreatív kísérletezés izgalmas elegyét mutatja be a Cozmouz YouTube-csatorna, ahol a nézők tanúi lehetnek annak, hogyan tanítanak meg egy mesterséges intelligenciát egy virtuális százlábút irányítani. Ami kezdetben csupán egy egyszerű 3D-modellnek tűnik, idővel egy meglepően élethű, soklábú lénnyé válik, amely mozgásában kísértetiesen hasonlít valódi megfelelőjére – mindez a neurális hálózatok és a megerősítéses tanulás révén válik lehetővé.
A projekt egy virtuális százlábúval indul – ez kezdetben csak egy kissé hátborzongató, de tökéletesen mozdulatlan modell. Az alkotó ehhez a modellhez egy „agyat” kapcsol egy neurális hálózat formájában: egy kétszintű rendszert, amely 2048 csomópontból áll. A tanítás során a proximális politika optimalizálás (PPO) módszerét alkalmazzák – ez egy bevált algoritmus a megerősítéses tanulásban. A mozgás a virtuális térben a következő mód zajlik: minden egyes láb két irányban képes forogni – az Y és a Z tengely mentén. Az MI célja, hogy ezeket a mozgásokat úgy irányítsa, hogy a százlábú minél gyorsabban haladjon a kijelölt irányba. A neurális hálózat bemeneteként az ízületek pozíciójáról és szögéről származó adatokat használják, amelyeket a szögsebesség kiszámításához meg is dupláznak. Emellett valós idejű talajérzékelési információkat is kapnak az egyes lábak – mindezt a raycasting-módszer segítségével.
Az első prototípus – egy kissé groteszk lény, amelyet „Nem harap”-nak neveztek el – hét szegmensből és 14 lábból áll. Bár külseje kezdetleges, ez az alapja egy már jóval élethűbb utódnak: a második prototípusnak, amelyet már egy valódi százlábú mintájára alkottak meg, 21 szegmenssel és 42 lábbal.
Ugyanazokat a tanulási alapelveket követve ez a bonyolultabb lény fokozatosan elsajátítja a járást. Az eredmények lenyűgözőek: a mesterséges intelligencia metakronális járást alakít ki – egy olyan hullámszerű mozgásformát, amely valódi százlábúaknál is megfigyelhető. Ebben a típusú mozgásban a lábak nem egyszerre, hanem egymást követve lépnek, így a haladás sima és hatékony. Ez a spontán kialakuló viselkedés jól példázza, hogyan képes egy tanuló algoritmus – biológiai ismeretek nélkül is – olyan megoldást találni, amely meglepően hasonlít a természetes evolúció által kialakított mintákhoz.
A videó egyik visszatérő motívuma az MI-képzés rendkívüli nehézsége. Miközben a nézők egy látványos montázst néznek kellemes háttérzenével, a mesterséges intelligencia valóságos próbákon megy keresztül: minden hatástalan lépés büntetést von maga után, később pedig további akadályokat – például lövedékek elkerülését – is meg kell tanulnia kezelni. A rengeteg próbálkozás és hiba révén az MI folyamatosan fejlődik – nemcsak a lábmozgás vezérlésében, hanem a teljes test szegmentált irányításában is, ami gyorsabb és rugalmasabb mozgást tesz lehetővé.
A Cozmouz MI-százlábú projektje jóval több, mint egy érdekes digitális kísérlet (bár annak sem utolsó) – hanem élő példája annak, hogyan vezethetnek egyszerű szabályok és visszacsatolások új viselkedési formákhoz – és hogyan tudják ezek a minták mesterséges eszközökkel utánozni a természet eleganciáját.
(A cikkhez használt képet az AI generálta/Rakéta.hu)