Puheäänen syväväärentäminen on nykyisin mahdollista reaaliaikaisesti. Asiasta varoitti kyberturvallisuusyritys NCC Group.

Yrityksen mukaan avoimen lähdekoodin tekoälytyökalujen ja tavallisten kuluttajien saatavilla olevan laitteiston avulla voidaan tuottaa reaaliaikaisia puheväärennöksiä (deepfakeja) erittäin pienellä viiveellä. Tekniikalla voi luoda uskottavaa puheääntä jopa huonolaatuisista tallenteista.

Tekniikkaa kutsutaan nimellä “deepfake vishing”, ja se hyödyntää tekoälymalleja, jotka on koulutettu ääninäytteillä. Prosessi vaatii vain kohtuullista laskentatehoa, eikä välttämättä tarvita huippuluokan laitteistoa.

Aiemmat äänen väärentämisen soveltuvat työkalut vaativat usein useita minuutteja koulutusdataa. Ne myös tuottivat vain ennakkoon tallennettuja pätkiä, mikä teki niistä vähemmän joustavia improvisoiduissa tilanteissa. Kun puheääni mallinnetaan reaaliaikaisesti, väärennetystä puheesta poistuvat viiveet, jotka todennäköisesti paljastaisivat matkimisyrityksen.

Tutkijat testasivat järjestelmää kannettavalla tietokoneella, jossa oli Nvidia RTX A1000 -näytönohjain. Se on lähtötason työasemanäytönohjain, jonka avustuksella viive oli vain puoli sekuntia.

Kyberturvallisuusyritys The Circuitin perustaja Trevor Wiseman ehdottaa salaisten signaalien tai koodien käyttöä henkilöllisyyden selkeään varmistamiseen etävuorovaikutuksessa. Ilman toimenpiteitä yksilöt ja organisaatiot voivat altistua yhä kehittyneemmille deepfake-huijauksille.