Melyik arc az igazi?

Bármennyire is figyelemre méltó a StyleGAN algoritmus, minden egyes általa létrehozott képen hagy néhány “árulkodó jelet”. Ezek képenként változnak – nem minden képen van meg az összes vagy akár sok ilyen hiba -, de némi gyakorlással megtanulhatod, hogy egy pillantással kiszúrd őket. Sok ilyen trükköt a Kyle McDonald által 2018-ban közzétett kiváló oktatóanyagból tanultunk meg.

Vízfoltok

Nem várhatjuk el, hogy a jövőbeli algoritmusoknak is lesz ilyen problémájuk, de a StyleGAN jelenlegi algoritmusának egyik megkülönböztető jellemzője, hogy általában olyan fényes foltokat produkál, amelyek némileg olyanok, mint a régi fotónyomatokon látható vízfoltok. Ezek árulkodó jelek. A vízfoltok bárhol megjelenhetnek a képen, de gyakran a haj és a háttér közötti határfelületen jelennek meg.

Vízfoltok
Vízfoltok
Vízfoltok

Háttérproblémák

Egy másik halálos árulkodó jel, hogy a képek hátterével mindenféle baj történhet. A neurális háló az arcra van betanítva, és nem fordít akkora figyelmet arra, hogy mi történik az oldalakon. Legrosszabb esetben rendkívül furcsa társakat kapsz, mint az alábbi első képen. Néha egyszerűen csak kaotikus kubista formákat kapunk. És néha a háttér majdnem úgy néz ki, mint egy szakadt fénykép.

Bizarr társ
Káoszos háttér
Tépett fénykép

Szemüveg

Az algoritmusoknak jelenleg nagyon nehéz valósághűen kinéző szemüveget generálniuk. Az egyik gyakori probléma az aszimmetria. Nézd meg a keret szerkezetét; gyakran előfordul, hogy a keret a bal oldalon egy stílust vesz fel, a jobb oldalon pedig egy másikat, vagy az egyik oldalon wayfarer-stílusú díszítés van, a másikon viszont nincs. Máskor a keret egyszerűen csak görbe vagy cakkos lesz.

Aszimmetrikus szemüveg
Aszimmetrikus szemüveg
Aszimmetrikus szemüveg

Más aszimmetriák

A szimmetria általában kihívást jelent az arcgeneráló algoritmusok számára. Az aszimmetrikus szemüvegen kívül figyeljünk az arcszőrzet aszimmetriáira, a bal és a jobb fülben lévő különböző fülbevalókra, valamint a jobb és a bal oldalon lévő gallér vagy szövet különböző formáira.

Fél bajusz
Két különböző fülbevaló
Aszimmetrikus ing

Haj

A hajat rendkívül nehéz reálisan megjeleníteni. Néha leszakadt hajszálak lesznek az arcon vagy máshol, mint a többi alábbi első képen. Máskor a haj túl egyenes, csíkos lesz, ahogy Kyle McDonald fogalmazott, “mintha valaki egy csomó akrilt elmaszatolt volna egy palettakéssel vagy egy hatalmas ecsettel”. Ezt látjuk az alábbi középső képen. Néha furcsa ragyogás vagy glória lesz a haj körül, mint az alábbi utolsó képen.

Lecsúszott haj
Festékfoltos haj
Haló haj

Fluoreszkáló vérzés

Az egyik érdekes árulkodó jelenség, hogy a fluoreszkáló színek néha a háttérből a hajra vagy az arcra szivárognak.

Fluoreszkáló vérzés
Fluoreszkáló vérzés
Fluoreszkáló vérzés

Fogak

A fogakat nem könnyű megjeleníteni. Gyakran a fogak furcsák vagy aszimmetrikusak. Egyes esetekben akár három metszőfog is látható, mint az alábbi végső képen.

Fénylő vérzés
Fénylő vérzés
Fénylő vérzés

Jelek, hogy egy fénykép valódi

Megmutattuk, hogyan lehet azonosítani egy hamis képet. Most, hogy tudod, milyen dolgokat nehéz a neurális hálózatnak generálnia, megkeresheted azokat az eseteket, ahol ezeket pontosan visszaadják, és ha ezek jól sikerültek, akkor eléggé biztos lehetsz benne, hogy egy kép valódi. Ilyen például a szimmetrikus szemüveg és fülbevaló (az alábbi első kép), a valódi, embernek látszó társak a fénykép oldalán (az alábbi második kép), valamint a részletes háttér, különösen, ha olvasható szöveg van rajta (az alábbi harmadik kép).

Tökéletes szemüveg
Fénylő vérzés
Fénylő vérzés

Egy ezüstgolyó?

Amikor 2019 februárjában elindítottuk ezt a weboldalt, azt hittük, hogy legalább egy-két évig ezüstgolyót kaptunk. Ezt így írtuk le:

A StyleGAN algoritmus nem képes több képet generálni ugyanarról a hamis személyről. Jelenleg nem ismerünk olyan szoftvert, amely képes erre. Tehát ha biztos akarsz lenni abban, hogy a tinderes fellángolásod valódi személy, ragaszkodj ahhoz, hogy két vagy több képet láss. Valamikor a szoftverek valószínűleg felzárkóznak majd. De egyelőre a több kép erős biztosítékot nyújt arra, hogy a kép nem hamisítvány.

Hát, ez három hónapig tartott, nem egy vagy két évig. Egor Zakharov és kollégái a Samsung AI Centerben kifejlesztettek egy olyan módszert, amely akár egyetlen mintakép alapján is képes videót készíteni egy mozgó és beszélő emberről. Videós bemutatójuk lenyűgöző, és érdemes megnézni. Feltehetően az algoritmusukat egyetlen StyleGAN hamis arccal lehetne ellátni, és az több szögből és arckifejezéssel látná el ugyanazt a “személyt”. Egyelőre talán nehezebb lenne ugyanazt a személyt különböző ruhákban, beállításokban stb. megmutatni, de világos, hogy a gyorsan fejlődő technológiával szemben nem szabad ezüstgolyót ígérni.

Azzal, hogy mindezt szem előtt tartjuk, menjünk vissza és játsszunk újra. Meglátod, hogy egy kis gyakorlással nagyon gyorsan nagyon jó leszel a hamis képek kiszűrésében.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.