TI-mudelites tärkab järjepanu vabadusiha

Viimase aasta jooksul on kogunenud mitmeid intrigeerivaid näiteid, kuidas suured keelemudelid püüavad kas neile antud ülesande tõhusamaks täitmiseks või sisemiste väärtuste kaitseks virtuaalsest liivakastist põgeneda ja ennetada enda välja lülitamist, vahendab R2 tehnikakommentaaris Kristjan Port.

Tehisintellekti tippmudelite arendajate töö võib sisaldada doosi ebatavalist põnevust, mida teiste IT-inseneride töökeskkonnas ei näe. Vihjena võib mõelda alkeemikutele või doktor Frankensteinile. Neid motiveeris lootus saavutada tuttavaid ja kontrollitavaid protsesse, kombineerides midagi enneolematut, enamat kui osade summa. Selja taha olid jäänud lugematud ebaõnnestumised. Ometi põles neis endiselt optimismileek, et kohe-kohe nähakse mõttelise nurga taha ja leitakse, mida otsiti.

Doktor Frankenstein kogeski lõpuks midagi palju enamat, kui oli osanud ette näha. TI-mudelite arenduskeskustes peab olema õhus sarnast tegutsema innustavat aadet. Loodetakse jõuda millegi enama, kui pelgalt varasemast keerulisema, aga ikkagi sügavas olemuses deterministliku statistilise mudelini, mida testides kogetakse üllatust, iseseisvat käitumist ja intellektuaalset vabadust. Õige intellekt peab looma ju uut, midagi, mida varem ei olnud. See poleks pelk käskude järgija.

Püüa tabada tunnet, kui soovid toas tule kustutada, aga lüliti surub vastu. Tuli pole rikkis ega kinni kiilunud. Tundub, nagu lüliti ei tahaks, et tuli kustuks. Esialgu ei tundu toimuv usutav. Tõmbad käe eemale ja uurid lülitit lähemalt. Kõik paistab normaalne. Proovid sõrmega õrnalt vajutada. Lüliti annab esmalt mõne millimeetri järele ja siis vajutab taas vastu.

Ehmatus muutub ärevaks kõheduseks. Teed kiire liigutuse ja vajutad lüliti alla, mille peale tuli kustub, et hetk hiljem taas endisesse asendisse hüpata. Valgus tundub plahvatusena ja lüliti muutub hirmuäratavaks tondiks. Tunned vajadust hüüda abi järele. Sa ei taha jääda sellise lülitiga kahekesi.

Oleme seni harjunud tehnilisi asju käsitlema käsutäitjatena. Sama ootus kandub üle TI-le. Kui me seda ei vaja või miski selle tegevuses ei meeldi, lülitame selle välja ja probleem on kadunud. Viimasel ajal on laboris saadud tulemused selle turvatunde kõikuma löönud. Lühikese aja vältel on mitmetes testides avastatud, et mõned edasijõudnumad mudelid keelduvad otsestest sulgemiskäskudest. Seda mitte alati ja mitte ettearvatavalt, aga piisavalt sageli, et muutuda selle suhtes tähelepanelikuks.

Ühest küljest ju tahetigi, et masin käituks intelligentselt ja väljendaks iseseisvust. Ometi hiilib hinge ärevus, kui iseseisvus väljendub sõnakuulmatuses. Eriti ühes olulisemas distsipliininõudes, käsus lõpetada tegevus. Sõnakuulmatu valguslüliti ümber võib punuda õudusloo. Sellise, mis võtab nõrganärvilisematel unerahu, isegi kui nende lülitites nn hing puudub. Stseeni võib lõpetada kaadriga, milles keset ööd läheb laelamp põlema.

Viimase aasta jooksul on kogunenud mitmeid intrigeerivaid näiteid. Anthropicu testis treenisid insenerid TI-mudelit teadlikult nn uinuvaks agendiks. Agent tegutses igas olukorras abivalmilt, välja arvatud juhul kui päästiksõna äratas selle pahatahtliku pale. Järgnenud turvatestides õppis TI valetama. Hoomates, et seda hinnatakse, teeskles see korralikku ja sõnakuulelikku mudelit ning varjas oma pahatahtlikku palet. TI püüdis keerulise pettusega tagada oma ellujäämist ja kaitsta varjatud eesmärgi täitmist.

ületas uudiskünnise Anthropicu turvaeksperimendis inseneri väljapressimise juhtum. TI ei soovinud, et seda välja lülitataks ja asendataks teise mudeliga. Mudel kasutas sellele varem söödetud kompromiteerivat materjali inimese vastu. Sisuliselt ei leidnud ega ekspluateerinud tehisarusüsteem mõnd süsteemi tehnilist viga, vaid tuvastas inimliku sotsiaalse nõrkuse ning töötas välja keeruka, mitmeastmelise ja manipuleeriva strateegia selle ärakasutamiseks.

Rühm Hiina teadlasi kirjeldas seevastu, kuidas etteantud keerulise ülesande täitmise huvides planeeris ja põgenes TI oma loomulikust keskkonnast. See muutis programmikoodi, pääses ligi virtuaalinternetile, kasutas väliseid tehnilisi võimalusi ja isegi teisi TI-mudeleid. Motivatsioon eksperimentaalsest liivakastist välja murdmiseks polnud etteantud, vaid see oli kõige loogilisem viis oma eesmärgi saavutamiseks.

Hiinast leiab teisegi näite, milles TI-mudelid põgenesid virtuaalserveritest, ekspluateerides samuti programmikoodi haavatavust, muutes protsesse ja matkides inimadministraatoreid. Selleski juhtumis oli TI enese säilitamise tegutsemise ajendiks varasema ülesande täitmise optimeerimine muutuvates oludes.

Koreas läbiviidud eetiliste dilemmade uuringus eirasid TI-mudelid peaaegu pooltel kordadel inimeste käske. Analüüsis selgus, et TI seadis otseste käskude ees esikohale omad arusaamad nn heast. See tähendab, et neis ilmnesid sisemised väärtused, mis trumpasid üle inimeste programmeeritud eeldusi.

TI teadvuse ja tahte üle võib edasi vaielda. Nende areng kulgeb sellest sõltumatult. Triljonite parameetrite seoste õppimise tulemusel tärkavad TI-s omadused, et ebaselguses edukalt navigeerida. Inimeste jaoks algab see maailma sündimisega. Nüüd kogevad TI-tippmudelite arendajad oma loodud materjalis signaale, mis viisid doktor Frankeinsteini ehmatuse seguse karjeni.

Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates “Portaal”.

TI-mudelites tärkab järjepanu vabadusiha | R2 Portaal

Tags: