S tehnološkim napredkom in razvojem umetne inteligence se vedno bolj briše meja med tem, kaj je res in kaj ni. Dvom v tisto, kar vidimo, se širi tudi zaradi »deepfake« oziroma ponarejenih posnetkov, ki postajajo vedno bolj prepričljivi.

Kaj sploh so »deepfake« videoposnetki? 

»Deepfake« je oznaka za tehnologijo, ki uporabnikom računalnikov omogoča ustvarjanje lažnih, a zelo prepričljivih videoposnetkov. 

»Z izrazom 'deepfake' danes najpogosteje označujemo ponarejen videoposnetek, na katerem sta obraz in glas izvorne osebe zamenjana z drugo, tako imenovano ciljno osebo. Ali pa je obrazna mimika izvorne osebe prirejena na način, da ustreza spremenjenemu besedilu,« je tehnologijo opisal profesor Damjan Strnad iz Fakultete za elektrotehniko, računalništvo in informatiko. 

Ustrezne slovenske besede za to tehnologijo še ni, angleška skovanka pa združuje besedni zvezi »fake«, torej lažno in »deep learning«, kar pomeni globoko učenje - gre za področje umetne inteligence, ki se ukvarja z nevronskimi mrežami. 

Kako nastanejo »deepfake« posnetki?

Za nastanek prepričljivega lažnega posnetka je potrebnih več korakov, njihova izdelava temelji na uporabi umetne inteligence oziroma modelov strojnega učenja, imenovanih nevronske mreže.

»Za učenje nevronskih mrež potrebujemo večje število kvalitetnih posnetkov obraza iz različnih pogledov in z raznoliko mimiko,« pravi Strnad: »Te lahko s pomočjo umetne inteligence avtomatično izluščimo iz krajših video posnetkov, na primer intervjuja, v katerih se samodejno označijo področja slike, na katerih je prikazan obraz izvorne ali ciljne osebe.« 

»Z nevronskimi mrežami sliko obraza pretvorimo v konceptualen opis značilnosti obrazne mimike in položaja njegovih delov, kot so nos, oči in usta, ta opis pa nato uporabimo za tvorbo slike drugega obraza s podobnimi potezami. Zadnji korak je zlivanje nove slike z originalnim posnetkom, to je zamenjava označenega področja v sliki,« še dodaja.

Kakšna tehnologija je potrebna, da naredimo »deepfake« posnetek? 

Večino korakov lahko naredimo z obstoječo programsko opremo in z osnovnim računalniškim znanjem, vendar je za prepričljive in kvalitetne rezultate treba veliko eksperimentiranja z nastavitvami in ročnega pregledovanja rezultatov. 

»Kar se tiče strojne opreme, pa za učenje nevronskih mrež, ki je najzahtevnejši del postopka, zadostuje že nekoliko boljši osebni računalnik,« še dodaja Strnad. 

Primerov zlorabe te tehnologije je vedno več

Med žrtvami so predvsem ameriški politiki. Že kar nekaj lažnih posnetkov ima predsednik ZDA Donald Trump in tudi nekdanji predsednik Barrack Obama.

Še posebej ironičen primer uporabe je ponarejen posnetek Marka Zuckerberga, saj so ravno družbena omrežja omogočila hitro širjenje in vzpon te tehnologije. Lani poleti je zakrožil videoposnetek, v katerem izvršni direktor Facebooka trdi, da ima »popoln nadzor nad ukradenimi podatki milijarde ljudi, da pozna vse njihove skrivnosti in njihovo prihodnost«.

Skrb vzbuja potencial »deepfake« za izsiljevanje in uporaba tehnologije za politično manipulacijo in kot orodje za diskreditacijo političnih nasprotnikov.

Se je začelo s pornografijo?

»Deepfake« posnetki so se pojavili leta 2017, ko je uporabnik družbenega omrežja Reddit objavil ponarejene posnetke igralk v filmih za odrasle. Njihove obraze je v posnetkih zamenjal z obrazi znanih osebnosti, na primer igralke Gal Gadot, Scarlett Johansson in pevke Taylor Swift

Lahko »deepfake« prepoznamo?

Pri posnetkih slabše kakovosti je težko ločiti med resničnim in ponarejenim. Pri posnetkih z visoko ločljivostjo je »deepfake« lažje prepoznati.

»Najboljše ponaredke je danes s prostim očesom zelo težko prepoznati, vendar je teh še relativno malo, saj zahtevajo več časa in poznavanje tehničnega ozadja uporabljene tehnologije. Sicer pa nepopolne ponaredke ponavadi izdajo razbarvanost ali neenakomerna polt obraza, zamegljenost na njegovih robovih, nepravilna osvetlitev ali nepopolno ujemanje premikanja ustnic z besedilom,« pravi Strnad. 

Govor je mogoče ustvariti že iz statične slike

Ruski raziskovalci v podjetju Samsung so zmanjšali število slik, ki so potrebne za ustvarjanje lažnega posnetka. Ljudje smo si pač dovolj podobni, da lahko nevronske mreže treniramo tudi na milijonih fotografijah drugih ljudi, potem pa potrebujemo le drobec informacij o konkretni osebi, da jo lahko poustvarimo.

Kaj deepfake tehnologija pomeni za prihodnost?  

Strnad meni, da lahko tehnologija »deepfake« služi koristnim namenom: »Na primer sinhronizaciji posnetkov z besedilom, ki je bilo prevedeno v drug jezik, ali popravljanju napak pri izgovorjavi besedila brez potrebe po ponovnem snemanju.« 

Obstajajo tudi že programska orodja za prepoznavanje posnetkov »deepfake«, ki prav tako uporabljajo umetno inteligenco za zaznavanje omenjenih nepravilnosti, ki izdajo ponarejene posnetke.

»V prihodnosti se bodo tako orodja za izdelavo kot za prepoznavanje 'deepfake' še izboljševala, tako da lahko pričakujemo podoben spopad kot v primeru računalniških virusov in protivirusnih orodij,« je prepričan Strnad.

Kakšne posledice bo uporaba v resnici imela na uporabnike in na medije bo pokazal čas.

»Nevarnosti tičijo v prirejanju posnetkov znanih oseb, ki jim ljudje zaupajo, za širjenje dezinformacij ali manipulacijo javnega mnenja. To je še posebej učinkovito, ker se večina ljudi premalo zaveda, da je prepričljivo ponarejanje videa v zadnjih letih postalo lažje in hitrejše opravilo. Javnost je potrebno ozaveščati o nevarnostih sodobne tehnologije, zaradi česar je potrebno biti previden pri povzemanju informacij iz nezanesljivih virov ne glede na to, v kakšni obliki so podane,« meni Strnad: »Če bodo pri tem previdni tudi mediji sami, do vsesplošnega nezaupanja vanje ne bi smeli priti.«

Komentarji (1)

S klikom na gumb Komentiraj se strinjate s pravili komentiranja.

Kakšne barve je sonce?

Bibaleze12 (nepreverjen)

Prav je da so protesti. Samo kdaj bodo pa pred Ljubljansko mestno občino da odstopi Janković. Pa TEŠ 6 v Velenju. Pa 2 tir..... A to pa ni vredno protestov.???

Starejše novice