Abstract
Az írisz lokalizáció az egyik legfontosabb folyamat az íriszfelismerésben. Az íriszképben lévő különböző zajok miatt a lokalizációs eredmény téves lehet. Emellett a lokalizációs folyamat időigényes. E problémák megoldására ez a cikk egy hatékony írisz lokalizációs algoritmust fejleszt ki optimalizációs modellen keresztül. Először is, a lokalizációs problémát egy optimalizációs modellel modellezzük. Ezután a SIFT jellemzőt választjuk ki az írisz külső határának és a szemhéjnak a lokalizációra jellemző információinak reprezentálására. És SDM (Supervised Descent Method) algoritmust alkalmazunk a külső határ és a szemhéj végső pontjainak megoldására. Végül az IRLS (Iterative Reweighted Least-Square) algoritmust használjuk a külső határ és a felső és alsó szemhéj paramétereinek meghatározására. A kísérleti eredmények azt mutatják, hogy a javasolt algoritmus hatékony és eredményes.
1. Bevezetés
A szemhéjfelismerés az egyik legmegbízhatóbb biometria . Széles körben használják különböző alkalmazásokban.
Egy tipikus íriszfelismerő rendszer több lépést tartalmaz, amelyek az íriszkép felvétele, szegmentálása, jellemzőkinyerés, illesztés és felismerés . Ezekben a lépésekben a szegmentálás a legfontosabb és legalapvetőbb folyamat. Ez a lépés elsősorban az írisz négy határát lokalizálja, amelyek az írisz belső és külső határai, valamint a felső és alsó szemhéjak.
Tény, hogy nehéz pontos és stabil íriszhatárokat kapni különböző körülmények között, mint például változó és nem egyenletes fényerő, a szempillák és szemhéjak elfedése, tükörreflexek és szemüvegfedés. Ezek a meghatározatlan tényezők megnehezítik az írisz szegmentálását. A szegmentálás az íriszfelismerő rendszer egyik fő szűk keresztmetszetévé vált.
A két legismertebb írisz lokalizációs algoritmus az integrodifferenciális (Itg-Diff) operátor és a Hough-transzformációval kombinált élérzékelés . Ezeket a különböző publikációk széles körben jóváhagyták. Ez a két módszer azonban főként gradiens információt használ, amelyet könnyen befolyásolnak a különböző típusú zajok. Valószínűleg nem hatékonyak, és bizonyos körülmények között téves lokalizációt generálnak.
(1) Számítási bonyolultság. Az Itg-Diff operátor hatékonyságát elsősorban a határparaméterek tartománya befolyásolja. Ha a paraméterek keresési tere nagy, a lokalizációs folyamatnak nagy számítási komplexitása van. A Hough-transzformáció hatékonyságát elsősorban a paramétertér mérete és a detektált élpixelek száma befolyásolja. Az észlelt él általában sok zajt tartalmaz. Ha túl sok zaj van benne, vagy nagy paraméterteret használunk, a számítási folyamat időigényes.
(2) Az írisz külső határának pontatlan lokalizálása. Mivel az Itg-Diff operátor és az élérzékelési folyamat csak a gradiens információtól függ, érzékenyek a szempillákra, a fényfoltra, a szemüvegkeretre és más zajokra, ami helytelen lokalizációt eredményez.
(3) A felső és alsó szemhéj helytelen szegmentálása. A berendezések, a környezet és az egyének sokfélesége miatt a rögzített képeken a szemhéjak nagymértékben eltérnek egymástól. Ez a szemhéjak helytelen szegmentálásához vezet.
Az elmúlt években számos algoritmust javasoltak a fenti két klasszikus algoritmus alapján. Cui et al. az íriszkép alacsony frekvenciájú információit wavelet transzformációval vonják ki. Itg-Diff operátort használnak az írisz szegmentálására. Sundaram és társai a komplexitás csökkentése érdekében csökkentik az írisz és a pupilla keresési tartományát; majd Hough-transzformációt használnak a lokalizációhoz. Más algoritmusok, mint például a Hooke-törvény , az aktív kontúr és a hisztogramelemzés szintén kielégítő eredményeket kapnak. Több írisz szegmentálási módszert vizsgál Jan .
Tény, hogy ezek a javasolt írisz szegmentálási módszerek elsősorban a gradiens információtól függenek. Így a lokalizációs folyamatot könnyen befolyásolják a különböző típusú zajok, téves szegmentációkat generálva. Másrészt a meglévő zaj megnehezíti a határparaméterek tartományának becslését. Ez a keresési folyamat számítási bonyolultságát növeli.
Figyelembe véve, hogy a gradiens információt könnyen befolyásolják a zajok, megpróbálunk robusztusabb jellemzőket választani az írisz határának reprezentálására.
A SIFT (scale-invariant features transform) egy robusztus és skála-invariáns helyi jellemző leíró. Xiong és de la Torre javasolta az arc kulcspontjainak lokalizálását SIFT és SDM (Supervised Descend Method) algoritmussal. E cikk által inspirálva megpróbáljuk a SIFT-et használni az írisz határának helyi jellemzőinek kinyerésére. A lokalizációs folyamatot SDM-mel oldjuk meg .
Az 1. ábra mutatja a javasolt írisz lokalizációs módszer folyamatábráját. Először a pupillát durván lokalizáljuk az RST (Radial Symmetry Transform) segítségével, a finom határt pedig az Itg-Diff operátorral határozzuk meg. Ezután kivonjuk az írisz külső határán és a szemhéjakon (felső és alsó) lévő kulcspontok SIFT-jellemzőjét. Ezen kulcspontok alapján a kifejlesztett optimalizálási modellt SDM segítségével oldjuk meg. Ezt követően néhány kulcspontot kapunk az írisz külső határán és a szemhéjakon (felső és alsó). A végleges szemhéjak és az írisz határa az IRLS (Iterative Reweighted Least-Square) segítségével kerül meghatározásra.
A 2. ábra a javasolt algoritmus teljes folyamatát mutatja be. A 3. ábra az ideális és a javasolt algoritmus által kapott lokalizációs eredmény összehasonlítását mutatja.
(a)
(b)
(a)
(b)
A dolgozat a következőképpen szerveződik: A 2. szakasz a lokalizációs algoritmus matematikai modelljét mutatja be. A 3. szakasz bemutatja a javasolt írisz lokalizációs módszert. A 4. szakasz a kísérleti eredményt és az elemzést mutatja be. Az 5. szakasz zárja az egész dolgozatot.
2.1. Az Irisszűrés és az Irisszűrés. Az írisz lokalizáció matematikai modellje
Legyen egy íriszkép és legyen a képen lévő pixelek koordinátáinak vektora, . a célhatárok vektora, amely a kulcspontok koordinátáiból áll, . Ekkor a lokalizációs folyamat egyenlő a , kiszámításával, amelyet a 4. ábra szemléltet.
(a) Az írisz külső határának kezdeti alakja
(b) A külső határ kezdeti és végső alakja
(a) Az írisz külső határának kezdeti alakja
(b) A külső határ kezdeti és végső alakja
Meghatározzuk a jellemzővektort , amely a jellemzők csoportjaiból áll a . Itt, egy feature extraction függvény, amely a pixeleket a hozzájuk tartozó feature descriptorhoz vetíti.
Ezzel a definícióval, a feature vektora . Akkor a lokalizációs folyamat egyenlő a leghasonlóbb feature vektor keresésével . Ideális esetben, ha a különbség a két feature vektor és között kicsi, közel lenne a cél alakvektorhoz , ami a várt lokalizáció.
Itt az euklideszi távolságot használjuk két feature vektor hasonlóságának mérésére. Ekkor az írisz lokalizációs eljárás egyenértékű a következő célfüggvény minimalizálásával:
Let , ahol a kezdeti koordináta vektor, az eltolás a , és (1) átírható
Ha a jellemző kinyerő függvény nemlineáris, a (2) minimalizálása egy nemlineáris programozási probléma. A végső alakvektort a következő optimalizálási probléma megoldásával kaphatjuk meg:
A végső lokalizációs alakvektor ekkor
2.2. A végső lokalizációs alakvektor
. SIFT Feature of Boundary
A SIFT egy általánosan használt képi helyi jellemző leíró . Széles körben használják számos különböző számítógépes látásproblémában . Ebben a dokumentumban hasonló stratégiát fogadunk el, mint , kivonat SIFT jellemző vektorok a kulcsfontosságú pontok írisz határán a lokalizációhoz. Az 5. ábra szemlélteti az írisz határán lévő különböző pontok SIFT-jellemzőit. Ez az ábra azt mutatja, hogy az írisz külső határán lévő négy pont (1-4. jelöléssel) hasonló SIFT-jellemzőkkel rendelkezik.
(a)
(b)
(a)
(b)
2.3. A kiválasztott négy pont SIFT-jellemzője. SDM algoritmus
A SIFT jellemzővektort behelyettesítve a (3) optimálási problémába, egy nemlineáris programozási problémát kapunk. Az SDM algoritmus felügyelt tanulást alkalmaz, hogy az aktuális alakvektortól a célhoz vezető optimális iterációs vektorhoz jusson. Ez egy iteratív algoritmus az optimalizálási probléma megoldására.
Ez az algoritmus egy lineáris regressziós modellt hoz létre az alakvektor eltolódása és az aktuális alakvektor jellemzője között
Ezután az aktuális alakvektor és az eltolásvektor iteratív módon kiszámítható, hogy megkapjuk a kívánt pozícióvektort: .
A helyi minimumba esés lehetőségének csökkentése érdekében az SDM több iterációt fogad el, hogy egy sorozatot kapjunk és ahol az iterációk száma és az alakvektor th pontjának koordinátája a th iterációban.
3. Javasolt módszer
3.1. Az SDM az alakvektor th pontjának koordinátája a th iterációban. Pupilla meghatározása
Az íriszképek közeli infravörös berendezéssel történő készítésekor a pupilla és az írisz között nagy különbség van. Itt a “durvától a finomig” pupilla lokalizációs stratégiát alkalmazzuk. Először egy durva pupillapozíciót kapunk az RST segítségével; majd a pontos lokalizációt az Itg-Diff operátorral kapjuk meg.
Az Itg-Diff operátort Daugman javasolta. A képlet a következő: ahol a sima függvény, a konvolúciós operátor, a kép, a körkörös határ középpontja, és a sugár.
Az operátor kiszámítja a gyűrűs szürke különbséget a radiális irány mentén az íriszképben, és megkeresi a maximális különbséget.
3.2. Az operátor az íriszképben a gyűrűs szürke különbséget számítja ki. SDM tanulás
Ebben a dolgozatban 32 kulcspontot választunk ki az írisz külső határán. A 6. ábra szemlélteti ezeknek a pontoknak a helyzetét. Ezek közül a felső és az alsó szemhéj külön-külön 13 pontot tartalmaz, az írisz határának bal és jobb ívén pedig 4 pont található. A 6. a) ábra a felső és az alsó szemhéjakon jelölt pontokkal rendelkező tréningkép, ahol az 1., 13., 14. és 26. pontok a szemhéjak és az írisz külső szélének metszéspontjai; a 6. b) ábra az alsó szemhéjak és az írisz metszéspontja nélküli tréningkép, ahol az írisz külső szélének legalacsonyabb pontja a 14-26. pontként van jelölve; A 6. (c) ábra a felső szemhéj és az írisz metszéspontja nélküli gyakorló kép, ahol az írisz külső szélének legmagasabb pontja az 1-13. pontként van jelölve; a 6. (d) ábra az összes gyakorló minta átlagos alakvektorát mutatja. A jelölt pontok SIFT-jellemzőit az adatbázis minden egyes képére kiszámítjuk, és és , amelyeket a lineáris regresszió megtanult paramétereiként tárolunk, a (6) megoldásával kapjuk meg.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
3.3. A felcímkézett kulcspontok átlagos alakja. Kulcspontok lokalizációja
A lokalizációs folyamat során az írisz külső határait a pupilla lokalizációjának paraméterei és az átlagos alak alapján inicializáljuk. A 7. ábra szemlélteti az alakváltozási folyamatot a különböző iterációs lépések után. A 7. a) ábra a kezdeti kulcspontokat mutatja be. A 7(b), 7(c) és 7(d) ábrák a lokalizált alakzatokat mutatják, amelyeket egyszeri, kétszeri és háromszori iteráció után kapunk.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
A felhasznált íriszképet oldalhosszúra méreteztük. Az iterációs szám .
3,4. Határok becslése
Ezekkel az SDM által kapott kulcspontokkal az IRLS algoritmust alkalmazzuk az írisz és a szemhéj határának meghatározására. Az írisz és a szemhéj külső határait (felfelé és lefelé) külön-külön körrel és parabolával illesztjük be.
3.4.1. A kör egyenletének linearizálása
A kör standard egyenlete a következő, ahol és és a körön lévő pont vízszintes és függőleges koordinátái és , , és a paraméterek. A kör egyenlete így írható fel:
Let , , , ; akkor a kör egyenlete így írható fel:
3.4.2. A kör egyenletének linearitása. Parabolikus függvény linearizálása
A szabványos parabolikus függvény a következőképpen adható meg:
A függvény így alakul:
Legyen , , , ; akkor a parabolikus függvényt a következőképpen lehet megadni:
3.4.3. A parabolikus függvény linearitása:
. A paraméterek becslése IRLS
Mikor a körkörös és parabolikus függvényeket (10) és (13) formában ábrázoljuk, az eredeti nemlineáris függvények lineárissá válnak. E függvények paraméterei a legkisebb négyzettel kapcsolatos módszerekkel oldhatók meg. Itt az IRLS-t használjuk ezen ismeretlen paraméterek becslésére.
Tegyük fel, hogy a th pont eltérése , . Annak érdekében, hogy a regresszió robusztus legyen, bisquare függvényt használunk súlyfüggvényként, amely ; sávszélesség. Ezután a következő optimalizálási problémát kapnánk a súlyozott négyzetes hiba minimalizálásával,ahol a th kulcspontok SDM által kapott koordinátái.
Itt IRLS-t használunk a (14) megoldására. Az iteratív függvény
A megoldási folyamatot egy Matlab beépített függvénnyel valósítjuk meg. A 8. ábra szemlélteti a kulcspontokat és a végső lokalizált határokat. A külső íriszhatáron és a felső és alsó szemhéjakon lévő kulcspontokat SDM segítségével kapjuk. A folytonos határokat az IRLS számítja ki.
4. ábra. Kísérleti eredmény és elemzés
A javasolt algoritmust a Techshino Technology Inc. által gyártott TCI 311 monokuláris íriszgyűjtő eszközön teszteltük, Pekingben készült. Ez egy közeli infravörös kamera primer objektívvel. A felvételi távolság 8-10 cm. Az íriszkép felbontása . Ezzel az eszközzel 700 képet tartalmazó írisz-adatbázist építünk.
A kísérletet Intel Core i5 CPU-val és 2 GB RAM-mal rendelkező számítógépen végezzük, az operációs rendszer pedig Windows 7 Professional 32 bites. Az algoritmust Matlab 2014b és C++ nyelven kódoltuk.
Kísérletünkben a képadatbázisból véletlenszerűen választjuk ki a képzési és az ellenőrző képeket a keresztellenőrzéshez. A gyakorló és az ellenőrzött képek aránya 7 : 3.
A lokalizációs pontosság hibaarányát és a hibaarányt a következőképpen határozzuk meg: ahol és a j-edik mintaképen az i-edik pont tesztpozícióját, illetve valódi pozícióját jelöli. az euklideszi távolságot jelenti. és a th mintaképen lévő összes kulcspontot tartalmazó minimálisan körülírt téglalap hosszát és szélességét jelöli. A definíció szerint a mintapont hibáját méri, és a helymeghatározási hibaarány.
A kumulatív hibaarányt a következőképpen határozzuk meg:
A kumulatív hibaarányt a következőképpen határozzuk meg:
Itt és az értékelési kritériumok, és egy indikátorfüggvény:
A 9. ábra a és görbéket mutatja. A 10. ábra a javasolt módszerrel kapott lokalizációs eredményt mutatja. Az 1. táblázat az íriszhatár és a szemhéj lokalizációjának Itg-Diff és a javasolt algoritmus általi teljesítmény-összehasonlítását szemlélteti. A 11. ábra az Itg-Diff operátor és a javasolt módszer által kapott eredményeket hasonlítja össze, ahol az első sor az Itg-Diff operátor eredménye, a második sor pedig a javasolt módszer eredménye. Ezek az összehasonlítások azt mutatják, hogy a javasolt módszer stabilabb lokalizációs teljesítményt nyújt, mint az Itg-Diff operátor zajos íriszkép esetén, különösen nagy fényfoltok, szemüvegkeretek stb. esetén.
|
(a)
(b)
(a)
(b)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
Ez azért van, mert az Itg-Diff operátor a szomszédságra vonatkozó gradiens információkra támaszkodik. Érzékeny a helyi intenzitásváltozásokra. Ha az íriszképek fényfoltot, szemhéjat, szempillát, szemüvegkeretet stb. tartalmaznak, az Itg-Diff operátor valószínűleg rossz szegmentációkat eredményez.
Míg a SIFT jellemző viszonylag nagy helyi területen jön létre, a gradiens információnál robusztusabb a kép elforgatásával, a fényerő változásával, a méretarányos skálázással és a zajjal szemben. Ez növeli a lokalizációs algoritmus robusztusságát.
A 2. táblázat a javasolt módszer és a másik két módszer futási idejét mutatja. Egy íriszkép lokalizálása kísérletünkben átlagosan 26,7 ms-ot vesz igénybe, ami sokkal hatékonyabb, mint az összehasonlított algoritmusoké.
|
5. táblázat. Következtetések
Ez a dolgozat egy hatékony, optimalizációs modellen alapuló íriszhelymeghatározó algoritmust javasol. Először az RST és az Itg-Diff operátort használjuk a pupilla lokalizálására; majd az írisz külső határán lévő kulcspontokat SIFT jellemzőkkel reprezentáljuk és SDM segítségével lokalizáljuk. Végül az írisz külső határának paramétereit az IRLS segítségével határozzuk meg.
Az írás fő hozzájárulása a következőkben foglalható össze. Optimalizálási modellt fejlesztünk ki az írisz lokalizációjához. Az írisz határának ábrázolásához SIFT jellemzőt használunk, amely robusztusabb, mint a gradiens információ. SDM algoritmust vezetünk be az írisz lokalizációs problémájának megoldására, amely képes generálni az írisz külső határának kulcspontjait.
A kísérleti eredmények azt mutatják, hogy a javasolt módszer hatékonyan és robusztusan lokalizálja az írisz külső határát, valamint a felső és alsó szemhéjakat.
Érdekütközések
A szerzők kijelentik, hogy nincsenek érdekellentétek.
Megköszönések
Ezt a munkát a Kínai Nemzeti Természettudományi Alapok 61703088 számú, a Liaoning tartomány 20170520326 számú doktori tudományos kutatási alapja és “a központi egyetemek alapkutatási alapja”, N160503003 támogatta.