Effektiv irislokalisering via optimeringsmodel

Abstract

Irislokalisering er en af de vigtigste processer i irisgenkendelse. På grund af forskellige former for støj i irisbilledet kan lokaliseringsresultatet være forkert. Udover dette er lokaliseringsprocessen tidskrævende. For at løse disse problemer udvikler dette papir en effektiv irislokaliseringsalgoritme via en optimeringsmodel. For det første modelleres lokaliseringsproblemet ved hjælp af en optimeringsmodel. Derefter vælges SIFT-funktionen til at repræsentere de karakteristiske oplysninger om iris’ ydre grænse og øjenlåg til lokalisering. Og SDM-algoritmen (Supervised Descent Method) anvendes til at løse de endelige punkter for ydre grænse og øjenlåg. Endelig anvendes IRLS (Iterative Reweighted Least-Square) til at opnå parametrene for den ydre grænse og de øvre og nedre øjenlåg. Eksperimentelle resultater viser, at den foreslåede algoritme er effektiv og virkningsfuld.

1. Indledning

Irisgenkendelse er en af de mest pålidelige biometriske . Den anvendes i vid udstrækning i forskellige former for applikationer.

Et typisk irisgenkendelsessystem indeholder flere trin, som er erhvervelse af irisbilleder, segmentering, udtrækning af funktioner, matchning og genkendelse . I disse trin er segmentering den vigtigste og mest grundlæggende proces. Dette trin lokaliserer hovedsageligt fire grænser for iris, som er indre og ydre grænser for iris og øvre og nedre øjenlåg.

Det er faktisk vanskeligt at opnå nøjagtige og stabile irisgrænser under forskellige forhold, såsom variabel og uensartet lysstyrke, tildækning af øjenvipper og øjenlåg, spejlreflektioner og brilleafdækning. Disse ubestemte faktorer gør det vanskeligt at segmentere iris. Segmentering er blevet en væsentlig flaskehals i irisgenkendelsessystemet.

De to mest kendte irislokaliseringsalgoritmer er integrodifferential (Itg-Diff)-operatoren og kantdetektion kombineret med Hough-transformation . De er bredt godkendt af forskellige publikationer. Disse to metoder bruger imidlertid hovedsagelig gradientinformation, som let påvirkes af forskellige former for støj. De er sandsynligvis ikke effektive og genererer forkert lokalisering under visse betingelser.

(1) Beregningskompleksitet. Itg-Diff-operatorens effektivitet påvirkes hovedsagelig af rækkevidden af grænseparametre. Når søgeområdet for parameteren er stort, har lokaliseringsprocessen en stor beregningskompleksitet. Hough-transformationens effektivitet påvirkes hovedsagelig af parameterrummets størrelse og antallet af detekterede kantpixels. Den detekterede kant indeholder generelt en masse støj. Når der indgår for meget støj, eller der anvendes et stort parameterrum, er beregningsprocessen tidskrævende.

(2) Upræcis lokalisering af den ydre grænse af iris. Da Itg-Diff-operatoren og kantdetektionsprocessen kun afhænger af gradientoplysninger, er de sårbare over for øjenvipper, lyspletter, brillestel og anden støj, hvilket resulterer i forkert lokalisering.

(3) Ukorrekt segmentering af øvre og nedre øjenlåg. Med mangfoldigheden af udstyr, miljø og personer er øjenlågene i de optagne billeder meget forskellige. Dette fører til ukorrekt segmentering af øjenlåg.

I de seneste år er der blevet foreslået mange algoritmer baseret på de to ovennævnte klassiske algoritmer. Cui et al. uddrager de lavfrekvente oplysninger i irisbilledet ved hjælp af wavelettransformation. De bruger Itg-Diff-operatoren til at segmentere iris. Sundaram et al. reducerer søgeområdet for iris og pupil for at reducere kompleksiteten; derefter anvender de Hough-transformation til lokalisering. Andre algoritmer som Hooke’s Law , aktiv kontur og histogramanalyse giver også tilfredsstillende resultater. Flere irissegmenteringsmetoder er undersøgt af Jan .

Disse foreslåede irissegmenteringsmetoder afhænger faktisk hovedsagelig af gradientoplysninger. Så lokaliseringsprocessen påvirkes let af forskellige former for støj, hvilket genererer forkerte segmenteringer. På den anden side gør den eksisterende støj det vanskeligt at vurdere rækkevidden af grænseparametre. Dette gør søgeprocessen kompleks.

I betragtning af at gradientinformationer let påvirkes af støj, forsøger vi at vælge mere robuste funktioner til at repræsentere irisgrænsen.

SIFT (scale-invariant features transform) er en robust og skalainvariant lokal funktionsdeskriptor. Xiong og de la Torre foreslog at lokalisere nøglepunkter i ansigtet med SIFT og SDM-algoritmen (Supervised Descend Method). Inspireret af dette dokument forsøger vi at bruge SIFT til at udtrække lokale træk ved irisgrænsen. Lokaliseringsprocessen løses ved hjælp af SDM .

Figur 1 viser flowdiagrammet for den foreslåede irislokaliseringsmetode. Først lokaliseres pupillen groft ved hjælp af RST (Radial Symmetry Transform), og den fine grænse bestemmes ved hjælp af Itg-Diff-operatoren. Derefter udtrækkes SIFT-elementet af nøglepunkter på iris’ ydre grænse og øjenlåg (øvre og nedre). På grundlag af disse nøglepunkter løses den udviklede optimeringsmodel ved hjælp af SDM. Herefter fås nogle nøglepunkter på iris’ ydre grænse og øjenlåg (øvre og nedre). De endelige øjenlåg og iris’ grænse bestemmes ved hjælp af IRLS (Iterative Reweighted Least-Square).

Figur 1

Flowdiagram over den foreslåede iris-lokaliseringsmetode.

Figur 2 illustrerer hele proceduren for den foreslåede algoritme. Figur 3 viser sammenligningen mellem det ideelle og det opnåede lokaliseringsresultat ved hjælp af den foreslåede algoritme.

Figur 2

En illustration af iris-lokaliseringsprocessen. De blå kurver er de passende cirkler og parabler. De grønne punkter er den initialiserede form for lokaliseringen. De røde punkter er den endelige form af proceduren.

(a)

(b)

(a)

(b)

Figur 3

Iris-segmentering. (a) Ideel irislokalisering og (b) lokaliseringsresultat ved hjælp af den foreslåede metode.

Afhandlingen er organiseret som følger: Afsnit 2 illustrerer den matematiske model for lokaliseringsalgoritmen. Afsnit 3 præsenterer den foreslåede iris-lokaliseringsmetode. Afsnit 4 viser det eksperimentelle resultat og analysen. Afsnit 5 konkluderer hele papiret.

2.1. Matematisk model for irislokalisering

Lad være et irisbillede og være en vektor af koordinaterne for pixels i billedet, . er vektoren af destinationsgrænser, som består af koordinater for nøglepunkter, . Så er lokaliseringsprocessen lig med at beregne , hvilket er illustreret i figur 4.

(a) Oprindelig form af iris ydre grænse

(b) Oprindelig og endelig form af ydre grænse

(a) Initial form af iris ydre grænse

(b) Initial og endelig form af ydre grænse

Figur 4

Illustration af lokaliseringsprocessen for iris: (a) den oprindelige form af irisgrænsen; (b) den relative position af den oprindelige og den lokaliserede irisgrænse.

Den defineres som funktionsvektor for , der er sammensat af grupper af funktioner på . Her er er en funktion til ekstraktion af funktioner, som projicerer pixels til deres tilsvarende funktionsbeskrivelse.

Med denne definition er funktionsvektoren af . Så er lokaliseringsprocessen lig med at søge efter den mest lignende funktionsvektor til . Ideelt set, når forskellen mellem de to funktionsvektorer og er lille, vil den ligge tæt på målformvektoren , hvilket er den forventede lokalisering.

Her bruger vi euklidisk afstand til at måle ligheden mellem to funktionsvektorer. Derefter svarer irislokaliseringsproceduren til at minimere følgende målfunktion:

Let , hvor er den indledende koordinatvektor, er forskydningen fra til , og (1) kan omskrives som

Når funktionen til udtræk af egenskaber er ikke-lineær, er minimeringen af (2) et ikke-lineært programmeringsproblem. Den endelige formvektor kan opnås ved at løse følgende optimeringsproblem:

Den endelige lokaliseringsformvektor er

2.2. SIFT Feature of Boundary

SIFT er en almindeligt anvendt billede lokal feature descriptor . Den er meget anvendt i mange forskellige computer vision-problemer . I dette papir vedtager vi en lignende strategi som , udtrække SIFT-featurevektorer af nøglepunkterne på irisgrænsen til lokalisering . Figur 5 illustrerer SIFT-funktionen af forskellige punkter på irisgrænsen. Figuren viser, at de fire givne punkter (mærket 1-4) på iris’ ydre grænse har lignende SIFT-funktioner.

(a)

(b)

(a)

(b)

Figur 5

SIFT-elementet for forskellige punkter. (a) positioner af udvalgte kantpunkter; (b) SIFT-feature af udvalgte fire punkter.

2.3. SDM-algoritme

Gennem at indsætte SIFT-featurevektoren i optimeringsproblemet i (3) fås et ikke-lineært programmeringsproblem. SDM-algoritmen anvender superviseret læring for at opnå den optimale iterationsvektor fra den aktuelle formvektor til målet. Det er en iterativ algoritme til løsning af optimeringsproblemet.

Denne algoritme etablerer en lineær regressionsmodel mellem forskydningen af formvektoren og funktionen af den aktuelle formvektor

Derpå kan den aktuelle formvektor og forskydningsvektoren beregnes iterativt, for at opnå den ønskede positionsvektor: .

For at reducere muligheden for at falde i et lokalt minimum anvender SDM flere iterationer for at opnå en serie af og hvor er antallet af iterationer og er koordinaten for det th. punkt af formvektoren ved den th. iteration.

3. Foreslået metode

3.1. Bestemmelse af pupil

Når irisbilleder tages af nær-infrarødt udstyr, er der en stor forskel mellem pupil og iris. Her anvender vi en “grov-til-fint” pupillokaliseringsstrategi. Først opnås en grov pupilposition ved hjælp af RST ; derefter opnås den nøjagtige lokalisering ved hjælp af Itg-Diff-operatoren.

Itg-Diff-operatoren er foreslået af Daugman. Formlen er som følger: hvor er en glat funktion, er konvolutionsoperatør, er billedet, er centrum af den cirkulære grænse, og er radius.

Operatoren beregner den ringformede grå forskel langs den radiale retning i irisbilledet og søger den maksimale forskel.

3.2. SDM Learning

I dette papir vælger vi 32 nøglepunkter på den ydre grænse af iris. Figur 6 illustrerer disse punkters positioner. Blandt dem indeholder øvre og nedre øjenlåg 13 punkter hver for sig, og venstre og højre bue af irisgrænsen har henholdsvis 4 punkter. Figur 6(a) er et træningsbillede med markerede punkter på både øvre og nedre øjenlåg, hvor punkterne 1., 13., 14. og 26. er henholdsvis skæringspunkterne mellem øjenlågene og iris’ ydre kant; figur 6(b) er et træningsbillede uden skæringspunktet mellem de nedre øjenlåg og iris, hvor det laveste punkt på iris’ ydre kant er markeret som punkterne 14. til 26; Figur 6(c) er træningsbilledet uden skæringspunktet mellem de øvre øjenlåg og iris, hvor det højeste punkt på iris’ ydre kant er markeret som punkt 1 til 13. Figur 6(d) viser den gennemsnitlige formvektor for alle træningsprøver. SIFT-egenskaberne for de markerede punkter beregnes for hvert billede i databasen, og og og , som gemmes som de indlærte parametre for lineær regression, fås ved at løse (6).

(a)

(b)

(c)

(d)

(a)

(b)

(c)

(d)

Figur 6

Eksempler på mærkning af nøglepunkter. (a) Mærkede nøglepunkter på iris, der er tildækket af øvre og nedre øjenlåg. (b) Mærkede nøglepunkter på iris, der er tildækket af det øverste øjenlåg. (c) Mærkede nøglepunkter på iris, der er tildækket af det nedre øjenlåg. (d) Gennemsnitlig form af alle mærkede nøglepunkter.

3.3. Lokalisering af nøglepunkter

I lokaliseringsprocessen initialiseres den ydre grænse for iris på grundlag af parametrene for pupillelokalisering og den gennemsnitlige form. Figur 7 illustrerer den ændrede proces for formen efter forskellige iterationstrin. Figur 7(a) demonstrerer de indledende nøglepunkter. Figur 7(b), 7(c) og 7(d) viser henholdsvis de lokaliserede former, som er opnået efter en, to og tre iterationer.

(a)

(b)

(c)

(d)

(a)

(b)

(c)

(d)

Figur 7

Illustration af iterationstrin. (a) Initialisering af nøglepunkter. (b) Nøglepunkter efter én iteration. (c) Nøglepunkter efter to iterationer. (d) Nøglepunkter efter tredobbelt iteration.

Det irisbillede, vi har anvendt, er nedskaleret til sidelængde. Iterationsnummeret .

3.4. Estimering af grænser

Med disse nøglepunkter, der er opnået ved SDM, anvendes IRLS-algoritmen til at lokalisere iris- og øjenlågsgrænsen. Den ydre grænse for iris og øjenlåg (op og ned) tilpasses separat ved hjælp af cirkler og parabler.

3.4.1. Linearisering af cirkelligning

En standardligning for en cirkel er hvor og er de horisontale og vertikale koordinater for punktet på cirklen og , , og er parametrene. Cirkelligningen kan skrives som

Let , , ; så kan cirklens ligning skrives som

3.4.2. Linearisering af parabolisk funktion

En standard parabolisk funktion kan gives som følger:

Så bliver funktionen til

Let , , , ; så kan den parabolske funktion gives som

3.4.3. Estimering af parameter ved hjælp af IRLS

Når de cirkulære og paraboliske funktioner illustreres som (10) og (13), bliver de oprindelige ikke-lineære funktioner til lineære. Parametrene for disse funktioner kan løses ved hjælp af metoder baseret på mindste kvadratmeter. Her bruger vi IRLS til at estimere disse ukendte parametre.

Antag, at afvigelsen for det th punkt er , . For at gøre regressionen robust bruger vi bisquare-funktionen som vægtfunktion, som er ; er båndbredde. Derefter vil følgende optimeringsproblem blive opnået ved at minimere den vægtede kvadratfejl,hvor er koordinaterne for de th nøglepunkter, der er opnået ved SDM.

Her bruger vi IRLS til at løse (14). Den iterative funktion er

Løsningsprocessen realiseres ved hjælp af en indbygget funktion i Matlab. Figur 8 illustrerer nøglepunkterne og de endelige lokaliserede grænser. Nøglepunkterne på den ydre irisgrænse og de øvre og nedre øjenlåg er opnået ved SDM. De kontinuerlige grænser beregnes ved hjælp af IRLS.

Figur 8

Segmenteringsresultatet.

4. Eksperimentelt resultat og analyse

Den foreslåede algoritme blev testet på en monokulær irisindsamlingsanordning TCI 311, som er fremstillet af Techshino Technology Inc, Beijing. Det er et nærinfrarødt kamera med prime-linse. Optagelsesafstanden er 8-10 cm. Opløsningen af irisbilledet er . Vi konstruerer en irisdatabase med 700 billeder ved hjælp af denne enhed.

Eksperimentet udføres på en computer med Intel Core i5 CPU, 2 GB RAM, og styresystemet er Windows 7 Professional 32-bit. Algoritmen er kodet i Matlab 2014b og C++.

I vores eksperiment er trænings- og verifikationsbillederne tilfældigt udvalgt fra billeddatabasen til krydsvalidering. Forholdet mellem trænings- og verifikationsbilleder er 7 : 3.

Fejlprocenten og fejlprocenten for lokaliseringsnøjagtigheden er defineret som følger: hvor og betegner henholdsvis testpositionen og den sande position for det i-te punkt på det j-te prøvebillede. repræsenterer den euklidiske afstand. og betegner længden og bredden af det mindste omskrevne rektangel af alle nøglepunkterne på det th-te prøvebillede. Ifølge definitionen måler fejl i prøvepunktet og er fejlprocenten for lokaliseringsfejl.

Den kumulative fejlprocent er defineret som følger:

Den kumulative fejlfrekvens er defineret som følger:

Her er og evalueringskriterierne, og er en indikatorfunktion:

Figur 9 viser og kurver. Figur 10 viser lokaliseringsresultatet ved hjælp af den foreslåede metode. Tabel 1 illustrerer ydelsessammenligningen af irisgrænsen og øjenlågslokalisering ved Itg-Diff og den foreslåede algoritme. Figur 11 sammenligner de resultater, der er opnået ved hjælp af Itg-Diff-operatoren og den foreslåede metode, hvor den første linje er resultatet af Itg-Diff-operatoren og den anden linje er resultatet af den foreslåede metode. Disse sammenligninger viser, at den foreslåede metode har en mere stabil lokaliseringsydelse end Itg-Diff-operatoren i et støjfyldt irisbillede, især med store lyspletter, brillegrammer osv.


Lokaliseret del	Itg-Diff	Forseslået algoritme

Iris	99.2%	99,5%
Eyelids	99.6%	99,6%

Tabel 1

Segmenteringsnøjagtighed for de forskellige metoder.

(a)

(b)

(a)

(b)

Figur 9

Kumulative fejlkurver på testsæt. (a) Fejlproportion ved hjælp af kumulativ Root Mean Square. (b) Fejlprocent via kumulativ fejlprocent.

Figur 10

Segmenteringsresultater ved hjælp af den foreslåede metode.

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

Figur 11

Segmenteringsresultater efter forskellige metoder (den første og anden række er opnået ved Itg-Diff og den foreslåede metode hver for sig).

Det skyldes, at Itg-Diff-operatoren er afhængig af gradientoplysningerne om nabolaget. Den er følsom over for lokale intensitetsvariationer. Når irisbilleder indeholder lyspletter, øjenlåg, øjenvipper, øjenbrillestel og så videre, giver Itg-Diff-operatoren sandsynligvis forkerte segmenteringer.

Mens SIFT-funktionen genereres på et relativt stort lokalt område, er den mere robust over for billedrotation, lysstyrkevariation, skalaskalering og støj end gradientoplysninger. Dette øger robustheden af lokaliseringsalgoritmen.

Tabel 2 viser køretiden for den foreslåede metode og de to andre metoder. Det tager i gennemsnit 26,7 ms at lokalisere et irisbillede i vores eksperiment, hvilket er meget mere effektivt end sammenlignede algoritmer.


Metoder	Itg-Diff	ED + Radon	Forseslået algoritme

Tid	600 ms	153.7 ms	26,7 ms

Tabel 2

Beregningstid for forskellige metoder.

5. Konklusioner

I denne artikel foreslås en effektiv algoritme til placering af iris baseret på en optimeringsmodel. Først anvendes RST og Itg-Diff-operatoren til at lokalisere pupillen; derefter repræsenteres nøglepunkterne på irisens ydre grænse af SIFT-egenskaber og lokaliseres ved hjælp af SDM. Endelig bestemmes parametrene for irisens ydre grænse ved hjælp af IRLS.

Det vigtigste bidrag fra denne artikel kan sammenfattes som følger. Der er udviklet en optimeringsmodel til lokalisering af iris. SIFT-funktionen anvendes til repræsentation af irisgrænsen, som er mere robust end gradientinformation. SDM-algoritme introduceres til at løse irislokaliseringsproblemet, som kan generere nøglepunkterne for iris’ ydre grænse.

Eksperimentelle resultater viser, at den foreslåede metode kan lokalisere den ydre grænse for iris og de øvre og nedre øjenlåg effektivt og robust.

Interessekonflikter

Forfatterne erklærer, at de ikke har nogen interessekonflikter.

Anerkendelser

Dette arbejde er støttet af National Natural Science Funds of China, no. 61703088, Doctoral Scientific Research Foundation of Liaoning Province, no. 20170520326, og “the Fundamental Research Funds for the Central Universities,” N160503003.