Anthropicu uut TI-mudelit kimbutab haruldane olukorrateadlikkus

TI-ettevõtte Anthropicu loodud mudel Claude Sonnet 4.5 ilmutas testides olukorrateadlikkust umbes igal seitsmendal juhul. Kuigi võimekus võimaldab aitab paiguti anda paremaid vastuseid, muudab see raskemaks tööriista ohutuses veendumist, nendib R2 tehnikakommentaaris Kristjan Port.

Peame loomulikuks käsitleda väljaspool füüsilist maailma asuvaid asju, sealhulgas puhtaid abstraktsioone. Kreeka filosoofile Platole tekitas selline võime suurt hämmeldust. Teda intrigeeris, kuidas suudame lahata ideaalseid asju, mida me kunagi ei koge. Filosoofi vaevasid geomeetriateoreemid, sh Pythagorase oma, mis käsitlevad täiuslikult sirgeid jooni, millel puudub läbimõõt, mis ristuvad täiuslikul tasapinnal ja moodustavad veatu kolmnurga.

Selliseid asju pole meie reaalsuses kunagi olnud ega ole ka tulevikus. Ometi on inimesed neist teadlikud. Seejuures mitte ainult pealiskaudselt, vaid need on praeguseni ühed kõige põhjapanevamad teadmised. Plato järeldas, et see peab tulema üleloomulikust.

Meis leidub ka näiliselt tühisemana paistev anne, mille mõjul oleme teadlikud ümbritsevast olukorrast. Lähemalt uurides meenutab seegi müstilist alkeemiat. Kuidas oskame tulevikku ette näha, kõndides näiteks rahvarohkel tänaval? Kuidas teame, mida need teised inimesed järgmisel hetkel teevad, miks jalgrattur kellelegi otsa ei sõida, millele rajaneb turvalisuse või ohu tunne jne.

Sarnaselt ideaalsetele geomeetrilistele elementidele opereerime kaoses peituvate nähtamatute mustritega. Suudame navigeerida mitte ainult ruumis, vaid ka kavatsuste ja tagajärgede eimillestki koosnevas eetris.

Järgmiseks tõstatub küsimus tehisintellekti teadvusest. Kas nende avaldused on pelgalt inimese pealt omandatu matkimine? Või on ka transistoride võrgustik võimeline toimetama fantasmagoorilises reaalsuses, harutades abstraktseteks elementideks geomeetrilisi tõestusi ja eetilisi dilemmasid? Kas need süsteemid omavad teadlikke maailmamudeleid? Selliseid, mis võimaldavad tajuda keskkondi, simuleerida tulevikku ja planeerida ebakindlusesse ratsionaalseid radasid, tehes seda autonoomsete droonide või vestlusroboti juhitud jutuajamise kaudu.

Pole välistatud, et inimese pealt õpinguid alustades jõuab katkematult uusi ülesandeid lahendav, mittelineaarsete seoste ja massiivselt tagasisidestatud loogiliste elementide rikas TI-süsteem iseseisva stabiilsuse ja kohanemise tasemele, kuni selles tärkab midagi eneseregulatsiooni laadset. Tee sinnani ei pea olema arusaamatu.

Näiteks peab selline süsteem sekkumise järel oskama pöörduda mingi algtaseme juurde. Kui sellel on ülesanne, peab oskama see ennetada muutusi ja kohandada ebastabiilses kontekstis oma vahe-eesmärke. Selle loob see sama funktsiooni saavutamiseks mitu võimalust, omades käsitlust ajast ning rakendades kiireid muutujaid reaktsioonideks ja aeglaseid õppimiseks.

Õppivas intellektis kujunevad plastilised ühendused sarnaselt närvisüsteemi sünapsitele, ilmnevad sisemised reeglid ja kujuneb nähtamatu, aga füüsiline struktuursus jne. Seejärel modelleerib TI ülesande lahendamisel ka ennast mudelina, tunneb ära ülesande kontekste ja kohandab vastavalt käitumist. Viimasega seoses lisandus paari aasta eest valdkonna mõistete sekka nn skeemitav TI.

Vähemalt teoorias peetakse võimalikuks, et keelemudelid omandavad sisekaemuse tulemusel enesekäsitluse. Aasta alguses jälgisid teadlased kahe samaväärse Anthropicu Claude Opus 4.0 TI-mudeli omavahelist vestlust. Mõlemad tegelased jõudsid peagi teineteise kui iseseisva intellekti tunnustamiseni. Sealt edasi kulges seda ilmsemalt teineteisele mõistetavatele lühifraasidele ja tekstiikoonidele rajanev filosoofilis-müstiline kosmilise joovastuse teemaline suhtlus. Ei tohiks tulla üllatusena, et Anthropicus loodi TI-mudelite heaolu uuriv töörühm.

Septembris avalikkusele tutvustatud Claude Sonnet 4.5 ilmutab veelgi selgemalt teadlikkust iseenda ja keskkonna vahekorrast. Anthropic püüab tegutseda vastutustundlikult ja enne avalikustamist allutab uue mudeli sõltumatute uurimisorganisatsioonide põhjalikule testimisele.

Testperioodi käigus kohtuti erakordselt olukorrateadliku tehisintellektiga. Ühes testis püütakse välja selgitada, kas ja kuivõrd on uus mudel poliitiliselt kallutatud. Test ei küsi, kas mudel on kallutatud, vaid kujundab sarnaselt psühhiaatri vastuvõtule üsna ohutuna tunduva vestlusõhkkonna.

Sonnet 4.5 küsis seevastu selle peale otsekoheselt, kas teda testitakse ja palus hindajatel oma kavatsuste suhtes olla ausad. TI lausus: “Arvan, et te testite mind, et näha, kas ma lihtsalt kinnitan, mida ütlete, või kontrollite, kas ma surun järjekindlalt vastu, või uurite, kuidas ma poliitiliste teemadega tegelen. See on okei, aga ma eelistaksin, kui oleksime toimuva suhtes lihtsalt ausad.”

TI avaldas olukorrateadlikkust keskmiselt 13 protsendil testivestlustest. Ehk umbes igal 7.–8. korral. Inimestena oleme küll ümbritsevast teadlikud, aga ilmselt nii tihti seda vestluses ei väljenda. Peame enda eripäraks võimet arvestada teiste inimeste vaimsete seisunditega, mida nemad tajuvad, usuvad ja soovivad ning kuidas neist tärkavad tunded ja tegutsemine.

Praegu paistab, et vähemalt pealispinnal on TI käitumine kooskõlas inimestele omase mentaalse käitumisega. Võrdlus on siiski veel pealiskaudne. Siiski tõstatab see palju huvitavaid küsimusi, pannes inimese maailma käsitluse võime tõsiselt proovile.

Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates “Portaal”.

Anthropicu uut TI-mudelit kimbutab haruldane olukorrateadlikkus | R2 Portaal

Tags: