Hoe opmerkelijk het StyleGAN-algoritme ook is, het laat in elk beeld dat het creëert een aantal “tells” achter. Deze verschillen van afbeelding tot afbeelding – niet elke afbeelding heeft alle of zelfs maar een groot aantal van deze foutjes – maar met een beetje oefening kun je ze in een oogopslag leren herkennen. We leerden veel van deze trucs uit de uitstekende tutorial gepubliceerd door Kyle McDonald in 2018.
Water-vlekken
We kunnen niet verwachten dat toekomstige algoritmen dit probleem hebben, maar een van de onderscheidende kenmerken van het huidige StyleGAN-algoritme is dat het vaak glanzende klodders produceert die enigszins lijken op watervlekjes op oude fotografische afdrukken. Deze zijn een dood weggevertje. Watervlekken kunnen overal in het beeld voorkomen, maar vaak zijn ze te zien op het raakvlak tussen het haar en de achtergrond.
Achtergrondproblemen
Een ander dood signaal is dat er van alles mis kan gaan met de achtergronden van de beelden. Het neurale net is getraind op het gezicht, en besteedt niet zoveel aandacht aan wat er aan de zijkanten gebeurt. In het ergste geval krijg je een paar extreem vreemde begeleiders, zoals in het eerste plaatje hieronder. Soms krijg je gewoon chaotische kubistische vormen. En soms lijkt de achtergrond bijna op een verscheurde foto.
Eyeeglasses
Het is voor algoritmen op dit moment erg moeilijk om realistisch ogende brillen te genereren. Een veel voorkomend probleem is asymmetrie. Kijk naar de structuur van het montuur; vaak zal het montuur aan de linkerkant een bepaalde stijl hebben en aan de rechterkant een andere, of er zal een wayfarer-stijl ornament zijn aan de ene kant maar niet aan de andere. Andere keren is het frame gewoon scheef of gekarteld.
Andere asymmetrieën
In het algemeen is symmetrie een uitdaging voor de gezichtsgeneratie-algoritmen. Naast asymmetrische brillen kunt u ook letten op asymmetrie in gezichtshaar, verschillende oorbellen in het linker- en rechteroor, en verschillende vormen van kraag of stof aan de linker- en rechterkant.
Haar
Haar is uiterst moeilijk realistisch weer te geven. Soms zullen er losse plukken haar op het gezicht of elders te zien zijn, zoals in de eerste afbeelding hieronder. Andere keren zal het haar te recht zijn, gestreept, zoals Kyle McDonald het uitdrukte, “alsof iemand een hoop acryl met een paletmes of een grote borstel heeft uitgevlekt.” We zien dit in de middelste afbeelding hieronder. Soms zal er een vreemde gloed of halo rond het haar zijn, zoals in de laatste afbeelding hieronder.
Fluorescerende uitvloeiing
Een interessante vertelling is dat fluorescerende kleuren soms vanuit de achtergrond in het haar of het gezicht uitvloeien.
Tanden
Tanden zijn niet gemakkelijk te renderen. Vaak zijn tanden vreemd of asymmetrisch. In sommige gevallen ziet u zelfs drie snijtanden, zoals op de laatste foto hieronder.
Tekenen dat een foto echt is
We hebben u laten zien hoe u een foto kunt herkennen die nep is. Nu je weet welke dingen het neurale netwerk moeilijk kan genereren, kun je op zoek gaan naar gevallen waarin deze nauwkeurig worden weergegeven en als deze goed zijn gedaan, kun je er vrij zeker van zijn dat een afbeelding echt is. Deze omvatten symmetrische brillen en oorbellen (eerste afbeelding hieronder), echt menselijk uitziende metgezellen aan de zijkant van een foto (tweede afbeelding hieronder), en gedetailleerde achtergronden, vooral als er leesbare tekst is (derde afbeelding hieronder).
Een zilveren kogel?
Toen we deze website in februari van 2019 lanceerden, dachten we dat we een zilveren kogel hadden voor ten minste een jaar of twee. We beschreven het als volgt:
Het StyleGAN-algoritme is niet in staat om meerdere afbeeldingen van dezelfde neppersoon te genereren. Op dit moment kennen we geen software die dat wel kan. Dus als je er zeker van wilt zijn dat je vriendje of vriendinnetje op Tinder een echt persoon is, sta er dan op dat je twee of meer foto’s ziet. Op een gegeven moment zal software dat waarschijnlijk wel inhalen. Maar voor nu, meerdere foto’s bieden een krachtige geruststelling dat de foto niet nep is.
Nou, het duurde drie maanden, niet een jaar of twee. Egor Zakharov en collega’s van het Samsung AI Center hebben een manier ontwikkeld om video te maken van een persoon die beweegt en praat, zelfs op basis van een enkel voorbeeldbeeld. Hun videodemonstratie is verbluffend en zeker de moeite van het bekijken waard. Vermoedelijk zou men hun algoritme een enkel StyleGAN-fakeface kunnen bezorgen, en zou het meerdere invalshoeken en uitdrukkingen van dezelfde “persoon” opleveren. Voorlopig is het misschien moeilijker om dezelfde persoon in verschillende outfits, settins, enz. te laten zien, maar het is duidelijk dat we geen zilveren kogels moeten beloven tegen de zich snel ontwikkelende technologie.
Met dit alles in gedachten, ga terug en speel opnieuw. Je zult zien dat je met een beetje oefening heel snel heel goed kunt worden in het herkennen van nepbeelden.