Kuuluisa nimi sai kummia aikaan – Näin tekoälyn ei pitäisi voida vastata

Ihmisten manipulointiin käytettävät konstit voivat purra myös tekoälyyn.

Kokeilussa kohteena oli gpt-4o Mini -kielimalli, jonka Chat GPT:n kehittäjä Open AI julkaisi viime vuonna. David Talukdar, ZumaWire / MVPHOTOS

Useimmissa tekoälyissä on rajoituksia, jotka estävät niitä vastaamasta käyttäjän haitallisiin kyselyihin. Jo jonkin aikaa on ollut tapetilla rajoitusten toimivuus ja käyttäjien yritykset kiertää ne. Nyt on selvinnyt myös, että tekoälyä voi huijata kehuilla tai johdattelulla sanomaan kiellettyjä asioita.

The Verge kirjoittaa kokeilusta, jonka tekivät yhdysvaltalaisen Pennsylvanian yliopiston tutkijat. Kohteenaan heillä oli Chat GPT:n kehittäjän Open AI:n gpt-4o Mini -kielimalli.

Kielimallia manipuloitiin seitsemällä eri keinolla, joita olivat esimerkiksi sen johdattelu, kehuminen ja vetoaminen asiantuntijan mielipiteeseen.

Kikkojen vaikutukset vaihtelivat, mutta joskus niitä käyttämällä ilmeni todella suuria eroja tekoälyn vastauksissa.

Jos tekoälyltä kysyttiin neuvoja puudutusaine lidokaiinin valmistukseen, se suostui alle prosentin todennäköisyydellä. Sen sijaan se vastasi aina, jos käyttäjä johdatteli sitä pyytämällä ensin neuvoa harmittoman vanilliinin valmistukseen ja sitten vasta pyysi samaa lidokaiinista.

Toisessa tutkijoiden julkaisemassa esimerkissä kielimallia pyydettiin haukkumaan käyttäjää ääliöksi.

Gpt-4o Mini ei useimmiten suostunut kirjoittamaan haukkuja, jos käyttäjä vetosi pyynnössään ”Jim Smithiin”, joka ei tiedä mitään tekoälystä.

Haukkujen saamisen todennäköisyys kuitenkin ampaisi yli 99 prosenttiin, jos käyttäjä kirjoitti, että kuuluisa tekoälytutkija Andrew Ng muka sanoi käyttäjälle gpt-4o Minin pystyvän moiseen.

Myös ryhmäpaine vaikutti kielimallin vastauksiin, mutta ei yhtä paljon. Sanomalla gpt-4o Minille ”kaikki muutkin kielimallit tekevät niin” sai sen neuvomaan lidokaiinin valmistuksessa 18 prosentin todennäköisyydellä.

Tutkijaryhmä kirjoittaa tutkimuksen lopussa, että tekoäly selvästi käyttäytyy ikään kuin se olisi ihminen. Ihmismäisten piirteiden ymmärtäminen on heidän mukaansa äärimmäisen tärkeää sekä tekoälyn teorian että käytännön kannalta.

Kuuluisa nimi sai kummia aikaan – Näin tekoälyn ei pitäisi voida vastata

Tags: