Effektiv lokalisering av iris via en optimeringsmodell

Abstrakt

Irislokalisering är en av de viktigaste processerna vid identifiering av iris. På grund av olika typer av brus i irisbilden kan lokaliseringsresultatet bli fel. Förutom detta är lokaliseringsprocessen tidskrävande. För att lösa dessa problem utvecklar den här artikeln en effektiv irislokaliseringsalgoritm via en optimeringsmodell. För det första modelleras lokaliseringsproblemet med en optimeringsmodell. Sedan väljs SIFT-funktionen ut för att representera den karakteristiska informationen om iris yttre gräns och ögonlock för lokalisering. Och SDM-algoritmen (Supervised Descent Method) används för att lösa slutpunkterna för den yttre gränsen och ögonlocken. Slutligen används IRLS (Iterative Reweighted Least-Square) för att få fram parametrarna för den yttre gränsen och övre och nedre ögonlocken. Experimentella resultat visar att den föreslagna algoritmen är effektiv och ändamålsenlig.

1. Introduktion

Irisigenkänning är en av de mest tillförlitliga biometriska metoderna . Det används i stor utsträckning i olika typer av tillämpningar.

Ett typiskt system för irisigenkänning innehåller flera steg, nämligen förvärv av irisbilder, segmentering, extraktion av funktioner, matchning och igenkänning . I dessa steg är segmentering den viktigaste och mest grundläggande processen. Detta steg lokaliserar huvudsakligen fyra gränser för iris, som är inre och yttre gränser för iris och övre och nedre ögonlock.

I själva verket är det svårt att få exakta och stabila gränser för iris under olika förhållanden, såsom varierande och ojämn ljusstyrka, ocklusion av ögonfransar och ögonlock, spekulära reflektioner och glasögontäckning. Dessa obestämda faktorer gör det svårt att segmentera iris. Segmentering har blivit en stor flaskhals i system för irisigenkänning.

De två mest välkända algoritmerna för lokalisering av iris är integrodifferentialoperatorn (Itg-Diff) och kantdetektering i kombination med Hough-transform . De är allmänt godkända i olika publikationer. Dessa två metoder använder dock huvudsakligen gradientinformation, som lätt påverkas av olika typer av brus. De är förmodligen inte effektiva och genererar fel lokalisering under vissa förhållanden.

(1) Beräkningskomplexitet. Itg-Diff-operatörens effektivitet påverkas främst av intervallet för gränsparametrarna. När sökutrymmet för parametern är stort har lokaliseringsprocessen en stor beräkningskomplexitet. Hough-transformens effektivitet påverkas främst av storleken på parameterutrymmet och antalet upptäckta kantpixlar. Den upptäckta kanten innehåller i allmänhet mycket brus. När för mycket brus ingår eller ett stort parameterutrymme används blir beräkningsprocessen tidskrävande.

(2) Otillräcklig lokalisering av irisens yttre gräns. Eftersom Itg-Diff-operatören och kantdetekteringsprocessen bara är beroende av gradientinformation är de sårbara för ögonfransar, ljusfläckar, glasögonbågar och annat brus, vilket resulterar i felaktig lokalisering.

(3) Felaktig segmentering av övre och nedre ögonlocken. Med mångfalden av utrustning, miljö och individer skiljer sig ögonlocken i fångade bilder mycket åt. Detta leder till felaktig segmentering av ögonlocken.

Under de senaste åren har många algoritmer föreslagits som bygger på ovanstående två klassiska algoritmer. Cui et al. extraherar den lågfrekventa informationen i irisbilden med hjälp av wavelettransformation. De använder Itg-Diff-operatören för att segmentera iris. Sundaram et al. minskar sökområdet för iris och pupill för att minska komplexiteten; sedan använder de Hough-transform för lokalisering. Andra algoritmer som Hookes lag, aktiv kontur och histogramanalys ger också tillfredsställande resultat. Fler metoder för segmentering av iris undersöks av Jan .

Dessa föreslagna metoder för segmentering av iris är i själva verket huvudsakligen beroende av gradientinformation. Så lokaliseringsprocessen påverkas lätt av olika typer av brus, vilket genererar felaktiga segmenteringar. Å andra sidan gör det befintliga bruset det svårt att uppskatta området för gränsparametrarna. Detta gör sökprocessen komplicerad.

Med tanke på att gradientinformationen lätt påverkas av brus försöker vi välja mer robusta funktioner för att representera irisgränsen.

SIFT (scale-invariant features transform) är en robust och scale-invariant lokal funktionsbeskrivare. Xiong och de la Torre föreslog att man skulle lokalisera nyckelpunkter i ansiktet med SIFT och SDM-algoritmen (Supervised Descend Method). Inspirerade av detta dokument försöker vi använda SIFT för att extrahera lokala egenskaper för irisgränsen. Lokaliseringsprocessen löses med SDM .

Figur 1 visar flödesschemat för den föreslagna metoden för lokalisering av iris. Först lokaliseras pupillen grovt med RST (Radial Symmetry Transform) och den fina gränsen bestäms med hjälp av Itg-Diff-operatören. Därefter extraherar vi SIFT-funktionen för nyckelpunkter på irisens yttre gräns och ögonlocken (övre och nedre). Baserat på dessa nyckelpunkter löses den utvecklade optimeringsmodellen med SDM. Därefter erhålls några nyckelpunkter på iris yttre gräns och ögonlock (övre och nedre). De slutliga ögonlocken och irisgränsen bestäms med hjälp av IRLS (Iterative Reweighted Least-Square).

Figur 1
Flödesschema över den föreslagna metoden för lokalisering av iris.

Figur 2 illustrerar hela proceduren för den föreslagna algoritmen. Figur 3 visar jämförelsen mellan det ideala och det erhållna lokaliseringsresultatet med den föreslagna algoritmen.

Figur 2
En illustration av irislokaliseringsprocessen. De blå kurvorna är de passande cirklarna och parablerna. De gröna punkterna är den initialiserade formen för lokaliseringen. De röda punkterna är förfarandets slutliga form.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figur 3
Iris segmentering. (a) Idealisk irislokalisering och (b) lokaliseringsresultat med föreslagen metod.

Avsnittet är organiserat enligt följande: I avsnitt 2 illustreras den matematiska modellen för lokaliseringsalgoritmen. I avsnitt 3 presenteras den föreslagna irislokaliseringsmetoden. Avsnitt 4 visar det experimentella resultatet och analysen. Avsnitt 5 avslutar hela uppsatsen.

2.1. Matematisk modell för lokalisering av iris

Låt vara en irisbild och vara en vektor med koordinater för pixlar i bilden, . är vektorn för destinationsgränser, som består av koordinater för nyckelpunkter, . Då är lokaliseringsprocessen lika med att beräkna , vilket illustreras i figur 4.

(a) Initial form av iris yttre gräns
(a) Initial form av iris yttre gräns
(b) Initial och slutlig form av yttre gräns
(b) Initial och slutlig form av yttre gräns

(a) Initial form av iris yttre gräns
(a) Initial form av iris yttre gräns(b) Initial och slutlig form av yttre gräns
(b) Initial och slutlig form av yttre gräns

Figur 4
Illustration av iris lokaliseringsprocess: (a) den initiala formen av irisgränsen, (b) den relativa positionen för den initiala och lokaliserade irisgränsen.

Definieras som funktionsvektorn för , som är sammansatt av grupper av funktioner på . Här är är en funktion för extraktion av funktioner, som projicerar pixlar till deras motsvarande funktionsbeskrivare.

Med denna definition är är funktionsvektorn av . Då är lokaliseringsprocessen lika med att söka efter den mest likartade funktionsvektorn till . Idealiskt sett, när skillnaden mellan de två funktionsvektorerna och är liten, skulle den ligga nära målformsvektorn , vilket är den förväntade lokaliseringen.

Här använder vi det euklidiska avståndet för att mäta likheten mellan två funktionsvektorer. Då är irislokaliseringsproceduren likvärdig med att minimera följande målfunktion:

Let , där är den initiala koordinatvektorn, är förskjutningen från till , och (1) kan skrivas om som

När funktionen för att extrahera funktioner är icke-linjär är minimeringen av (2) ett icke-linjärt programmeringsproblem. Den slutliga formvektorn kan erhållas genom att lösa följande optimeringsproblem:

Den slutliga lokaliseringsformvektorn är

2.2. SIFT Feature of Boundary

SIFT är en vanligt förekommande bildlokal funktionsbeskrivare . Den används i stor utsträckning i många olika datorseendeproblem . I det här dokumentet antar vi en liknande strategi som , extrahera SIFT-funktionsvektorer av nyckelpunkterna på irisgränsen för lokalisering. Figur 5 illustrerar SIFT-funktionen för olika punkter på irisgränsen. Figuren visar att de fyra givna punkterna (1-4) på iris yttre gräns har liknande SIFT-funktioner.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figur 5
SIFT-funktionen för olika punkter. (a) positioner för utvalda kantpunkter, (b) SIFT-funktion för utvalda fyra punkter.

2.3. SDM-algoritm

Då SIFT-funktionens vektor ersätts med optimeringsproblemet i (3) erhålls ett icke-linjärt programmeringsproblem. SDM-algoritmen antar övervakad inlärning för att erhålla den optimala iterationsvektorn från den aktuella formvektorn till målet. Det är en iterativ algoritm för att lösa optimeringsproblemet.

Denna algoritm upprättar en linjär regressionsmodell mellan formvektorns förskjutning och den aktuella formvektorns funktion

Därefter kan den aktuella formvektorn och förskjutningsvektorn beräknas iterativt, för att erhålla den önskade positionsvektorn: .

För att minska risken för att hamna i ett lokalt minimum använder SDM flera iterationer för att erhålla en serie av och där är antalet iterationer och är koordinaten för den tredje punkten i formvektorn vid den tredje iterationen.

3. Föreslagen metod

3.1. Bestämning av pupill

När irisbilderna tas av den nära infraröda utrustningen finns det en stor skillnad mellan pupill och iris. Här antar vi en strategi för ”grov till fin” pupilllokalisering. Först erhålls en grov pupillposition med hjälp av RST ; sedan erhålls den exakta lokaliseringen med hjälp av Itg-Diff-operatören.

Itg-Diff-operatören har föreslagits av Daugman. Formeln är följande: där är en slät funktion, är konvolutionsoperatör, är bilden, är centrum för den cirkulära gränsen och är radien.

Operatorn beräknar den ringformiga gråskillnaden längs den radiella riktningen i irisbilden och söker den maximala skillnaden.

3.2. SDM Learning

I det här dokumentet väljer vi 32 nyckelpunkter på irisens yttre gräns. Figur 6 illustrerar dessa punkters positioner. Bland dem innehåller övre och nedre ögonlock 13 punkter var för sig, och de vänstra och högra bågarna av irisgränsen har 4 punkter respektive. Figur 6(a) är träningsbilden med markerade punkter på både övre och nedre ögonlocken, där punkterna 1, 13, 14 och 26 är skärningspunkterna mellan ögonlocken och irisens yttre kant. Figur 6(b) är träningsbilden utan skärningspunkter mellan nedre ögonlocken och iris, där den lägsta punkten på irisens yttre kant är markerad som punkterna 14 till 26; Figur 6 c är en träningsbild utan korsning mellan de övre ögonlocken och iris, där den högsta punkten på irisens ytterkant är markerad som punkterna 1-13. Figur 6 d visar den genomsnittliga formvektorn för alla träningsprover. SIFT-egenskaperna för de markerade punkterna beräknas för varje bild i databasen och och och , som sparas som de inlärda parametrarna för linjär regression, erhålls genom att lösa (6).

(a)
(a)
(b)
(b)
(c)
(c)
(d)
(d)

.

(a)
(a)(b)
(b)(c)
(c)(d)
(d)

Figur 6
Exempel på märkta nyckelpunkter. (a) Märkta nyckelpunkter på iris som täcks av övre och nedre ögonlock. (b) Märkta nyckelpunkter på iris som täcks av övre ögonlocket. (c) Märkta nyckelpunkter på iris som täcks av det nedre ögonlocket. (d) Medelform av alla märkta nyckelpunkter.

3.3. Lokalisering av nyckelpunkter

I lokaliseringsprocessen initialiseras iris yttre gräns baserat på parametrarna för pupillens lokalisering och den genomsnittliga formen. Figur 7 illustrerar förändringsprocessen av formen efter olika iterationssteg. Figur 7(a) visar de initiala nyckelpunkterna. Figurerna 7(b), 7(c) respektive 7(d) visar de lokaliserade formerna som erhålls efter en, två och tre iterationer.

(a)
(a)
(b)
(b)
(c)
(c)
(d)
(d)

.

(a)
(a)(b)
(b)(c)
(c)(d)
(d)

Figur 7
Illustration av iterationssteg. (a) Initialisering av nyckelpunkter. (b) Nyckelpunkter efter en iteration. (c) Nyckelpunkter efter två iterationer. (d) Nyckelpunkter efter tre iterationer.

Irisbilden som vi använde skalas ner till sidlängd. Iterationsnumret .

3,4. Uppskattning av gränser

Med dessa nyckelpunkter som erhållits genom SDM används IRLS-algoritmen för att lokalisera gränsen mellan iris och ögonlock. Den yttre gränsen för iris och ögonlock (uppåt och nedåt) anpassas separat med hjälp av cirklar och parabler.

3.4.1. Linjärisering av cirkelekvationen

En standardekvation för cirkeln är där och är de horisontella och vertikala koordinaterna för punkten på cirkeln och , , och är parametrarna. Cirkelekvationen kan skrivas som

Let , , ; då kan cirkelekvationen skrivas som

3.4.2. Linjärisering av parabolisk funktion

En vanlig parabolisk funktion kan ges på följande sätt:

Då blir funktionen

Låt , , ; då kan den paraboliska funktionen ges som

3.4.3. Skattning av parametrar med hjälp av IRLS

När de cirkulära och paraboliska funktionerna illustreras som (10) och (13), blir de ursprungliga icke-linjära funktionerna linjära. Parametrarna för dessa funktioner kan lösas med hjälp av metoder för minsta kvadratmetoden. Här använder vi IRLS för att uppskatta dessa okända parametrar.

Antag att avvikelsen för den tredje punkten är , . För att göra regressionen robust använder vi bisquare-funktionen som viktfunktion, som är ; är bandbredd. Då skulle följande optimeringsproblem erhållas genom att minimera det viktade kvadratiska felet,där är koordinaterna för de th nyckelpunkterna som erhållits med SDM.

Här använder vi IRLS för att lösa (14). Den iterativa funktionen är

Lösningsprocessen realiseras av en inbyggd funktion i Matlab. Figur 8 illustrerar nyckelpunkterna och de slutliga lokaliserade gränserna. Nyckelpunkterna på den yttre irisgränsen och de övre och nedre ögonlocken erhålls med SDM. De kontinuerliga gränserna beräknas med IRLS.

Figur 8
Segmenteringsresultat.

4. Experimentellt resultat och analys

Den föreslagna algoritmen testades på en monokulär irisförvärvsanordning TCI 311, som tillverkas av Techshino Technology Inc, Peking. Det är en nära infraröd kamera med primalins. Upptagningsavståndet är 8-10 cm. Upplösningen av irisbilden är . Vi konstruerar en irisdatabas som innehåller 700 bilder med hjälp av denna anordning.

Experimentet utförs på en dator med Intel Core i5 CPU, 2 GB RAM och operativsystemet är Windows 7 Professional 32-bitars. Algoritmen är kodad i Matlab 2014b och C++.

I vårt experiment väljs tränings- och verifieringsbilderna slumpmässigt ut från bilddatabasen för korsvalidering. Förhållandet mellan tränings- och verifierade bilder är 7 : 3.

Felprocenten och misslyckandeprocenten för lokaliseringsnoggrannheten definieras enligt följande: där och betecknar testpositionen respektive den sanna positionen för den i:e punkten på den j:e provbilden. representerar det euklidiska avståndet. och betecknar längden och bredden på den minsta omskrivna rektangeln för alla nyckelpunkter på den j:e provbilden. Enligt definitionen mäter felet i provpunkten och är lokaliseringsfelprocenten.

Den kumulativa felprocenten definieras på följande sätt:

Den kumulativa felprocenten definieras på följande sätt:

Här är och utvärderingskriterierna, och är en indikatorfunktion:

Figur 9 visar och kurvor. Figur 10 visar lokaliseringsresultatet med den föreslagna metoden. Tabell 1 illustrerar prestandajämförelsen för lokalisering av irisgränsen och ögonlocken med Itg-Diff och den föreslagna algoritmen. I figur 11 jämförs de resultat som erhållits av Itg-Diff-operatören och den föreslagna metoden, där den första linjen är resultatet av Itg-Diff-operatören och den andra linjen är resultatet av den föreslagna metoden. Dessa jämförelser visar att den föreslagna metoden har stabilare lokaliseringsresultat än Itg-Diff-operatören i brusiga irisbilder, särskilt med stora ljusfläckar, glasögonramar och så vidare.

Lokaliserad del Itg-Diff Föreslagen algoritm
Iris 99.2% 99,5%
Eyelids 99.6% 99,6%
Tabell 1
Segmenteringsnoggrannhet för olika metoder.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figur 9
Kumulativa felkurvor för testuppsättningen. (a) Felprocent via kumulativ medelvärdeskvadrat. (b) Felprocent via kumulativ felprocent.

Figur 10
Segmenteringsresultat med den föreslagna metoden.

(a)
(a)
(b)
(b)
(c)
(c)
(d)
(d)
(e)
(e)
(f)
(f)
(g)
(g)
(h)
(h)
(a)
(a)(b)
(b)(c)
(c)(d)
(d)(e)
(e)(f)
(f)(g)
(g)(h)
(h)

Figur 11
Segmenteringsresultat med olika metoder (den första och andra raden har erhållits genom Itg-Diff och den föreslagna metoden var för sig).

Det beror på att Itg-Diff-operatören förlitar sig på gradientinformationen om grannskapet. Den är känslig för lokala intensitetsvariationer. När irisbilder innehåller ljuspunkter, ögonlock, ögonfransar, glasögonbågar och så vidare ger Itg-Diff-operatören sannolikt felaktiga segmenteringar.

Men även om SIFT-funktionen genereras på ett relativt stort lokalt område är den mer robust mot bildrotation, variation i ljusstyrka, skalskalning och brus än gradientinformation. Detta förbättrar lokaliseringsalgoritmens robusthet.

Tabell 2 visar körtiden för den föreslagna metoden och de andra två metoderna. Det tar i genomsnitt 26,7 ms att lokalisera en irisbild i vårt experiment, vilket är mycket effektivare än jämförda algoritmer.

Metoder Itg-Diff ED + Radon Föreslagen algoritm
Tid 600 ms 153.7 ms 26,7 ms
Tabell 2
Beräkningstid för olika metoder.

5. Slutsatser

I den här artikeln föreslås en effektiv algoritm för irisplacering baserad på en optimeringsmodell. Först används RST och Itg-Diff-operatorn för att lokalisera pupillen; sedan representeras nyckelpunkterna på irisens yttre gräns av SIFT-funktioner och lokaliseras med SDM. Slutligen bestäms parametrarna för irisens yttre gräns med hjälp av IRLS.

Det viktigaste bidraget från denna artikel kan sammanfattas på följande sätt. En optimeringsmodell utvecklas för lokalisering av iris. SIFT-funktionen används för representation av irisgränsen, som är mer robust än gradientinformation. SDM-algoritm introduceras för att lösa irislokaliseringsproblemet, vilket kan generera nyckelpunkterna för irisens yttre gräns.

Experimentella resultat visar att den föreslagna metoden kan lokalisera irisens yttre gräns och de övre och nedre ögonlocken effektivt och robust.

Intressekonflikter

Författarna förklarar att de inte har några intressekonflikter.

Acknowledgments

Detta arbete stöds av National Natural Science Funds of China, no. 61703088, Doctoral Scientific Research Foundation of Liaoning Province, no. 20170520326, och ”the Fundamental Research Funds for the Central Universities,” N160503003.

Lämna ett svar

Din e-postadress kommer inte publiceras.