Tekoälykeskustelut voivat paljastua – Microsoft löysi haavoittuvuuden kielimalleista

Keskustelusi ChatGPT:n ja Google Geminin kaltaisten tekoälyratkaisujen kanssa eivät välttämättä ole niin yksityisiä kuin luulet, kirjoittaa TechXplore.

Microsoft on paljastanut vakavan haavoittuvuuden suurissa kielimalleissa, ja se voi paljastaa keskustelujesi aiheet.

Tutkimus on julkaistu arXiv-esijulkaisupalvelussa.

Tietoturva-aukko löytyi tekoälypalveluja ohjaavista suurista kielimalleista (LLM), ja tutkijat nimesivät sen ”Whisper Leakiksi”. Kyseinen haavoittuvuus vaikuttaa lähes kaikkiin testattuihin malleihin.

Kun käytät suuriin hakukoneisiin tai sovelluksiin rakennettuja tekoälyavustajia, tietosi on suojattu TLS-salauksella (Transport Layer Security). Samaa tekniikkaa käytetään esimerkiksi verkkopankeissa. Nämä turvalliset yhteydet estävät muita lukemasta kirjoittamiasi sanoja. Microsoft kuitenkin havaitsi, että metatieto eli viestien kulkutapa internetissä pysyy näkyvissä. Whisper Leak ei riko salausta, mutta hyödyntää sitä, mitä salaus ei voi piilottaa.

Julkaistussa tutkimuksessa Microsoftin tutkijat selittävät testanneensa 28 kielimallia haavoittuvuuden varalta. He loivat ensin kaksi kysymyssarjaa: toinen sisälsi erilaisia tapoja kysyä yhdestä arkaluontoisesta aiheesta, kuten rahanpesusta, ja toinen koostui tuhansista satunnaisista arkipäivän kysymyksistä.

Tutkijat tallensivat salaa kunkin verkon datan rytmin eli datapakettien koon ja ajoituksen. Seuraavaksi he kouluttivat tekoälyohjelman erottamaan arkaluonteiset aiheet tavallisista kysymyksistä pelkästään datan rytmin perusteella.

Useimmissa malleissa tekoäly arvasi keskustelun aiheen oikein yli 98 prosentin tarkkuudella. Hyökkäys pystyi tunnistamaan arkaluonteiset keskustelut jopa 100 prosentin varmuudella, vaikka niitä esiintyi vain yhdessä kymmenestätuhannesta keskustelusta. Tutkijat testasivat kolmea erilaista puolustuskeinoa, mutta mikään ei pysäyttänyt hyökkäyksiä täysin.

Tutkimusryhmän mukaan ongelma ei ole salauksessa itsessään, vaan siinä, miten vastaukset lähetetään.

”Tämä ei ole TLS:n kryptografinen haavoittuvuus, vaan pikemminkin metatiedon hyväksikäyttöä, jonka TLS paljastaa salatun liikenteen rakenteesta ja ajoituksesta”, tutkijat kirjoittavat.

Vuodon vakavuuden ja hyökkäyksen helppouden vuoksi tutkijat vaativat, että tekoälyssä toimivien tahojen on suojattava tulevat järjestelmät.

”Havaintomme korostavat tarvetta puuttua metatiedon vuotamiseen, koska tekoälyjärjestelmät käsittelevät yhä arkaluonteisempaa tietoa.”

Tekoälykeskustelut voivat paljastua – Microsoft löysi haavoittuvuuden kielimalleista

Tags: