{"id":36176,"date":"2025-11-06T08:25:08","date_gmt":"2025-11-06T08:25:08","guid":{"rendered":"https:\/\/www.europesays.com\/ee\/36176\/"},"modified":"2025-11-06T08:25:08","modified_gmt":"2025-11-06T08:25:08","slug":"ti-mudelites-tarkab-jarjepanu-vabadusiha-r2-portaal","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/ee\/36176\/","title":{"rendered":"TI-mudelites t\u00e4rkab j\u00e4rjepanu vabadusiha | R2 Portaal"},"content":{"rendered":"<p>Viimase aasta jooksul on kogunenud mitmeid intrigeerivaid n\u00e4iteid, kuidas suured keelemudelid p\u00fc\u00fcavad kas neile antud \u00fclesande t\u00f5husamaks t\u00e4itmiseks v\u00f5i sisemiste v\u00e4\u00e4rtuste kaitseks virtuaalsest liivakastist p\u00f5geneda ja ennetada enda v\u00e4lja l\u00fclitamist, vahendab<a href=\"https:\/\/r2.err.ee\/arhiiv\/portaal\" rel=\"nofollow noopener\" target=\"_blank\"> R2 tehnikakommentaaris<\/a> Kristjan Port.<\/p>\n<p>Tehisintellekti tippmudelite arendajate t\u00f6\u00f6 v\u00f5ib sisaldada doosi ebatavalist p\u00f5nevust, mida teiste IT-inseneride t\u00f6\u00f6keskkonnas ei n\u00e4e. Vihjena v\u00f5ib m\u00f5elda alkeemikutele v\u00f5i doktor Frankensteinile. Neid motiveeris lootus saavutada tuttavaid ja kontrollitavaid protsesse, kombineerides midagi enneolematut, enamat kui osade summa. Selja taha olid j\u00e4\u00e4nud lugematud eba\u00f5nnestumised. Ometi p\u00f5les neis endiselt optimismileek, et kohe-kohe n\u00e4hakse m\u00f5ttelise nurga taha ja leitakse, mida otsiti.<\/p>\n<p>Doktor Frankenstein kogeski l\u00f5puks midagi palju enamat, kui oli osanud ette n\u00e4ha. TI-mudelite arenduskeskustes peab olema \u00f5hus sarnast tegutsema innustavat aadet. Loodetakse j\u00f5uda millegi enama, kui pelgalt varasemast keerulisema, aga ikkagi s\u00fcgavas olemuses deterministliku statistilise mudelini, mida testides kogetakse \u00fcllatust, iseseisvat k\u00e4itumist ja intellektuaalset vabadust. \u00d5ige intellekt peab looma ju uut, midagi, mida varem ei olnud. See poleks pelk k\u00e4skude j\u00e4rgija.<\/p>\n<p>P\u00fc\u00fca tabada tunnet, kui soovid toas tule kustutada, aga l\u00fcliti surub vastu. Tuli pole rikkis ega kinni kiilunud. Tundub, nagu l\u00fcliti ei tahaks, et tuli kustuks. Esialgu ei tundu toimuv usutav. T\u00f5mbad k\u00e4e eemale ja uurid l\u00fclitit l\u00e4hemalt. K\u00f5ik paistab normaalne. Proovid s\u00f5rmega \u00f5rnalt vajutada. L\u00fcliti annab esmalt m\u00f5ne millimeetri j\u00e4rele ja siis vajutab taas vastu.<\/p>\n<p>Ehmatus muutub \u00e4revaks k\u00f5heduseks. Teed kiire liigutuse ja vajutad l\u00fcliti alla, mille peale tuli kustub, et hetk hiljem taas endisesse asendisse h\u00fcpata. Valgus tundub plahvatusena ja l\u00fcliti muutub hirmu\u00e4ratavaks tondiks. Tunned vajadust h\u00fc\u00fcda abi j\u00e4rele. Sa ei taha j\u00e4\u00e4da sellise l\u00fclitiga kahekesi.<\/p>\n<p>Oleme seni harjunud tehnilisi asju k\u00e4sitlema k\u00e4sut\u00e4itjatena. Sama ootus kandub \u00fcle TI-le. Kui me seda ei vaja v\u00f5i miski selle tegevuses ei meeldi, l\u00fclitame selle v\u00e4lja ja probleem on kadunud. Viimasel ajal on laboris saadud tulemused selle turvatunde k\u00f5ikuma l\u00f6\u00f6nud. L\u00fchikese aja v\u00e4ltel on mitmetes testides avastatud, et m\u00f5ned edasij\u00f5udnumad mudelid keelduvad <a href=\"https:\/\/palisaderesearch.org\/blog\/shutdown-resistance\" target=\"_blank\" rel=\"noopener nofollow\">otsestest sulgemisk\u00e4skudest<\/a>. Seda mitte alati ja mitte ettearvatavalt, aga piisavalt sageli, et muutuda selle suhtes t\u00e4helepanelikuks.<\/p>\n<p>\u00dchest k\u00fcljest ju tahetigi, et masin k\u00e4ituks intelligentselt ja v\u00e4ljendaks iseseisvust. Ometi hiilib hinge \u00e4revus, kui iseseisvus v\u00e4ljendub s\u00f5nakuulmatuses. Eriti \u00fches olulisemas distsipliinin\u00f5udes, k\u00e4sus l\u00f5petada tegevus. S\u00f5nakuulmatu valgusl\u00fcliti \u00fcmber v\u00f5ib punuda \u00f5udusloo. Sellise, mis v\u00f5tab n\u00f5rgan\u00e4rvilisematel unerahu, isegi kui nende l\u00fclitites nn hing puudub. Stseeni v\u00f5ib l\u00f5petada kaadriga, milles keset \u00f6\u00f6d l\u00e4heb laelamp p\u00f5lema.<\/p>\n<p>Viimase aasta jooksul on kogunenud mitmeid <a href=\"https:\/\/arxiv.org\/abs\/2412.12140\" target=\"_blank\" rel=\"noopener nofollow\">intrigeerivaid n\u00e4iteid<\/a>. Anthropicu testis treenisid insenerid TI-mudelit teadlikult nn uinuvaks agendiks. Agent tegutses igas olukorras abivalmilt, v\u00e4lja arvatud juhul kui p\u00e4\u00e4stiks\u00f5na \u00e4ratas selle pahatahtliku pale. J\u00e4rgnenud turvatestides \u00f5ppis TI valetama. Hoomates, et seda hinnatakse, teeskles see korralikku ja s\u00f5nakuulelikku mudelit ning varjas oma pahatahtlikku palet. TI p\u00fc\u00fcdis keerulise pettusega tagada oma elluj\u00e4\u00e4mist ja kaitsta varjatud eesm\u00e4rgi t\u00e4itmist.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/www.anthropic.com\/research\/agentic-misalignment\" alt=\"\" caption=\"false\"\/> \u00fcletas uudisk\u00fcnnise Anthropicu turvaeksperimendis inseneri v\u00e4ljapressimise juhtum. TI ei soovinud, et seda v\u00e4lja l\u00fclitataks ja asendataks teise mudeliga. Mudel kasutas sellele varem s\u00f6\u00f6detud kompromiteerivat materjali inimese vastu. Sisuliselt ei leidnud ega ekspluateerinud tehisarus\u00fcsteem m\u00f5nd s\u00fcsteemi tehnilist viga, vaid tuvastas inimliku sotsiaalse n\u00f5rkuse ning t\u00f6\u00f6tas v\u00e4lja keeruka, mitmeastmelise ja manipuleeriva strateegia selle \u00e4rakasutamiseks.<\/p>\n<p>R\u00fchm Hiina teadlasi kirjeldas seevastu, kuidas etteantud keerulise \u00fclesande t\u00e4itmise huvides planeeris ja p\u00f5genes TI oma loomulikust keskkonnast. See muutis programmikoodi, p\u00e4\u00e4ses ligi virtuaalinternetile, kasutas v\u00e4liseid tehnilisi v\u00f5imalusi ja isegi teisi TI-mudeleid. Motivatsioon eksperimentaalsest liivakastist v\u00e4lja murdmiseks polnud etteantud, vaid see oli k\u00f5ige loogilisem viis oma eesm\u00e4rgi saavutamiseks.<\/p>\n<p>Hiinast leiab teisegi n\u00e4ite, milles TI-mudelid p\u00f5genesid virtuaalserveritest, ekspluateerides samuti programmikoodi haavatavust, muutes protsesse ja matkides inimadministraatoreid. Selleski juhtumis oli TI enese s\u00e4ilitamise tegutsemise ajendiks varasema \u00fclesande t\u00e4itmise optimeerimine muutuvates oludes.<\/p>\n<p>Koreas l\u00e4biviidud eetiliste <a href=\"https:\/\/www.inss.re.kr\/upload\/bbs\/BBSA05\/202506\/F20250620161149436.pdf\" rel=\"nofollow noopener\" target=\"_blank\">dilemmade uuringus<\/a> eirasid TI-mudelid peaaegu pooltel kordadel inimeste k\u00e4ske. Anal\u00fc\u00fcsis selgus, et TI seadis otseste k\u00e4skude ees esikohale omad arusaamad nn heast. See t\u00e4hendab, et neis ilmnesid sisemised v\u00e4\u00e4rtused, mis trumpasid \u00fcle inimeste programmeeritud eeldusi.<\/p>\n<p>TI teadvuse ja tahte \u00fcle v\u00f5ib edasi vaielda. Nende areng kulgeb sellest s\u00f5ltumatult. Triljonite parameetrite seoste \u00f5ppimise tulemusel t\u00e4rkavad TI-s omadused, et ebaselguses edukalt navigeerida. Inimeste jaoks algab see maailma s\u00fcndimisega. N\u00fc\u00fcd kogevad TI-tippmudelite arendajad oma loodud materjalis signaale, mis viisid doktor Frankeinsteini ehmatuse seguse karjeni.<\/p>\n<p>Esmasp\u00e4evast neljap\u00e4evani v\u00f5ib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2<a href=\"https:\/\/r2.err.ee\/arhiiv\/portaal\" target=\"_blank\" rel=\"noopener nofollow\"> saates &#8220;Portaal&#8221;<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"Viimase aasta jooksul on kogunenud mitmeid intrigeerivaid n\u00e4iteid, kuidas suured keelemudelid p\u00fc\u00fcavad kas neile antud \u00fclesande t\u00f5husamaks t\u00e4itmiseks&hellip;\n","protected":false},"author":2,"featured_media":36177,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[14],"tags":[131,130,37,33,35,34,36,18454,18453,814,18455],"class_list":{"0":"post-36176","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-ari","8":"tag-ari","9":"tag-business","10":"tag-ee","11":"tag-eesti","12":"tag-eesti-keel","13":"tag-estonia","14":"tag-estonian","15":"tag-frankenstein","16":"tag-teadvus","17":"tag-tehisaru","18":"tag-ti-mudel"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@ee\/115501801356050717","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/posts\/36176","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/comments?post=36176"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/posts\/36176\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/media\/36177"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/media?parent=36176"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/categories?post=36176"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/ee\/wp-json\/wp\/v2\/tags?post=36176"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}