どの顔が本物か?

StyleGAN アルゴリズムは注目に値しますが、作成した各イメージにいくつかの「痕跡」を残します。 これらは画像によって異なり、すべての画像にこれらの不具合があるわけではありませんが、少し練習すれば、一目で見分けることができるようになります。 私たちは、2018 年に Kyle McDonald が公開した優れたチュートリアルからこれらのトリックの多くを学びました。

Water-splotches

将来のアルゴリズムにこの問題があるとは思えませんが、現在の StyleGAN アルゴリズムの特徴の 1 つは、古い写真プリントの水玉のように見える輝くブロブをよく生成することです。 これは致命的な問題です。 水滴は画像のどこにでも現れますが、多くの場合、髪と背景の間の境界部分に現れます。

水滴
水滴
水滴

背景の問題

もうひとつの死因は画像の背景でいろいろとうまくいかないことがあることだ。 ニューラルネットは顔について訓練されており、側面で何が起こっているかにはそれほど注意を払いません。 最悪の場合、下の1枚目の写真のように、非常に奇妙な仲間ができてしまいます。 時には、ただ混沌としたキュビズムの形が出来上がることもあります。

Bizarre companion
Chaotic background
Torn photograph

Eyeglasses

Realistic-looking eyeglasses を生成するアルゴリズムは非常に難しいのですが、このような場合はどうすればよいでしょうか。 よくある問題は、非対称性です。 フレームの構造を見てください。多くの場合、フレームは左側と右側で別のスタイルをとったり、片側にウェイファーラー風の装飾があり、もう片側にはないことがあります。 また、フレームが曲がっていたり、ギザギザしていたりすることもあります。

Asymmetric eyeglasses
Asymmetric eyeglasses
Asymmetric eyeglasses

その他の非対称

一般に、対称は顔生成アルゴリズムにとって難題である。 非対称の眼鏡のほか、顔の髪の非対称、左右の耳のピアスの違い、左右の襟や布の形が違う場合なども要注意です。

半分ヒゲ
2種類のイヤリング
非対称のシャツ

髪の毛

髪の毛はリアルなレンダリングが非常に困難です。 下の他の最初の画像のように、顔やその他の場所に不連続な髪の束があることがあります。 また、Kyle McDonald が言うように、「誰かがパレット ナイフや巨大なブラシでアクリルの束を汚したような」、髪がまっすぐすぎて縞模様になっていることもあります。 これは、下の真ん中の画像に見られます。 また、下の最終画像のように、髪の周囲に奇妙な輝きや光輪が生じることもあります。

Disconnected hair
Paint-streak hair
Haloed hair

Fluorescent bleed

面白いことに、背景から毛や顔への蛍光色のにじみは発生することがあるそうです。

蛍光色のにじみ
蛍光色のにじみ
蛍光色のにじみ

歯の表現も簡単ではありません。 多くの場合、歯は奇妙であったり、非対称であったりします。 場合によっては、下の最後の写真のように、3本の門歯が見えることもあります。

蛍光増白
蛍光増白
蛍光増白

写真が本物である兆候

ここまで、偽物である画像を識別する方法についてご紹介しました。 ニューラルネットワークが生成しにくいものがわかったので、これらが正確にレンダリングされているケースを探し、これらがうまくできていれば、その画像は本物であるとかなり確信が持てます。 例えば、左右対称の眼鏡やイヤリング(下の1枚目)、写真の脇にいる実際の人間のような仲間(下の2枚目)、特に読みやすいテキストがある場合の詳細な背景(下の3枚目)などがあります。

パーフェクトメガネ
蛍光灯ブリード
蛍光灯ブリード

A silver bullet? 6709>

このサイトを2019年の2月に開設したとき、少なくとも1~2年は銀の弾丸を持っていると思ったんだ。 私たちはこのように表現しました。

StyleGANアルゴリズムは、同じ偽の人物の画像を複数生成することができません。 今現在、私たちはそのようなことができるソフトを知りません。 ですから、Tinder の恋人が本物であることを確かめたい場合は、2 枚以上の写真を見るように主張してください。 いずれはソフトウェアが追いついてくるでしょう。 しかし、今のところ、複数の写真は、その画像が偽物でないという強力な安心感を与えてくれるのです。

さて、1年や2年ではなく、3ヶ月かかりました。 Samsung AI CenterのEgor Zakharov氏らは、1枚のサンプル画像からでも、人が動いて話している動画を作成する方法を開発しました。 そのデモ映像は圧巻で、一見の価値があります。 おそらく、彼らのアルゴリズムにStyleGANのフェイクフェイスを1つ与えれば、同じ「人」の複数のアングルと表情を提供することができるのでしょう。 当面は、同じ人物を異なる衣装や設定で表示することは難しいかもしれませんが、急速に進化するテクノロジーに対して、私たちが銀の弾丸を約束してはいけないことは明らかです。 少し練習すれば、すぐにフェイク画像を見破ることができるようになることがわかるはずです

コメントを残す

メールアドレスが公開されることはありません。