Localizarea eficientă a irisului prin intermediul modelului de optimizare

Abstract

Localizarea irisului este unul dintre cele mai importante procese în recunoașterea irisului. Din cauza diferitelor tipuri de zgomote din imaginea irisului, rezultatul localizării poate fi greșit. Pe lângă aceasta, procesul de localizare necesită mult timp. Pentru a rezolva aceste probleme, această lucrare dezvoltă un algoritm eficient de localizare a irisului prin intermediul unui model de optimizare. În primul rând, problema localizării este modelată cu ajutorul unui model de optimizare. Apoi, caracteristica SIFT este selectată pentru a reprezenta informațiile caracteristice ale limitei exterioare a irisului și ale pleoapei pentru localizare. Iar algoritmul SDM (Supervised Descent Method) este utilizat pentru a rezolva punctele finale ale limitei exterioare și ale pleoapelor. În cele din urmă, IRLS (IRLS (Iterative Reweighted Least-Square) este utilizat pentru a obține parametrii limitei exterioare și ai pleoapelor superioare și inferioare. Rezultatul experimental indică faptul că algoritmul propus este eficient și eficace.

1. Introducere

Recunoașterea irisului este una dintre cele mai fiabile metode biometrice . Este utilizată pe scară largă în diferite tipuri de aplicații.

Un sistem tipic de recunoaștere a irisului conține mai multe etape, care sunt achiziția imaginii irisului, segmentarea, extragerea caracteristicilor, potrivirea și recunoașterea . În aceste etape, segmentarea este cel mai important și cel mai de bază proces. Această etapă localizează în principal patru limite ale irisului, care sunt limitele interioare și exterioare ale irisului și ale pleoapelor superioare și inferioare.

De fapt, este dificil să se obțină limite precise și stabile ale irisului în diferite condiții, cum ar fi luminozitatea variabilă și neuniformă, ocluzia genelor și a pleoapelor, reflexiile speculare și acoperirea ochelarilor. Acești factori nedeterminați fac dificilă segmentarea irisului. Segmentarea a devenit un blocaj major în sistemul de recunoaștere a irisului.

Cei mai cunoscuți doi algoritmi de localizare a irisului sunt operatorul integrodiferențial (Itg-Diff) și detectarea marginilor combinată cu transformarea Hough . Aceștia sunt aprobați pe scară largă de diferite publicații. Cu toate acestea, aceste două metode utilizează în principal informații de gradient, care sunt ușor afectate de diferite tipuri de zgomote. Probabil că acestea nu sunt eficiente și generează o localizare greșită în anumite condiții.

(1) Complexitatea de calcul. Eficiența operatorului Itg-Diff este afectată în principal de intervalul de parametri de frontieră. Atunci când spațiul de căutare a parametrilor este mare, procesul de localizare are o complexitate de calcul mare. Eficiența transformării Hough este afectată în principal de dimensiunea spațiului parametrilor și de numărul de pixeli de margine detectați. Marginea detectată conține, în general, o mulțime de zgomote. Atunci când sunt incluse prea multe zgomote sau când se utilizează un spațiu mare de parametri, procesul de calcul este consumator de timp.

(2) Localizarea inexactă a limitei exterioare a irisului. Deoarece operatorul Itg-Diff și procesul de detectare a marginilor depind doar de informațiile de gradient, acestea sunt vulnerabile la gene, pete de lumină, rame de ochelari și alte zgomote, ceea ce duce la o localizare greșită.

(3) Segmentarea incorectă a pleoapelor superioare și inferioare. Având în vedere diversitatea echipamentelor, a mediului și a indivizilor, pleoapele din imaginile capturate diferă foarte mult. Acest lucru duce la segmentarea incorectă a pleoapelor.

În ultimii ani, au fost propuși mulți algoritmi bazați pe cei doi algoritmi clasici de mai sus. Cui et al. extrag informațiile de frecvență joasă ale imaginii irisului prin transformarea wavelet. Aceștia utilizează operatorul Itg-Diff pentru a segmenta irisul. Sundaram et al. reduc intervalul de căutare al irisului și al pupilei pentru a reduce complexitatea; apoi utilizează transformarea Hough pentru localizare. Alți algoritmi, cum ar fi legea lui Hooke, conturul activ și analiza histogramei, obțin, de asemenea, rezultate satisfăcătoare. Mai multe metode de segmentare a irisului sunt analizate de Jan .

De fapt, aceste metode de segmentare a irisului propuse depind în principal de informațiile de gradient. Astfel, procesul de localizare este ușor afectat de diferite tipuri de zgomote, generând segmentări greșite. Pe de altă parte, zgomotul existent îngreunează estimarea intervalului de parametri de delimitare. Acest lucru face ca procesul de căutare să fie mai complex din punct de vedere al calculului.

Considerând că informațiile de gradient sunt ușor afectate de zgomote, încercăm să selectăm caracteristici mai robuste pentru a reprezenta limita irisului.

SIFT (scale-invariant features transform) este un descriptor de caracteristici locale robust și invariant de scară. Xiong și de la Torre au propus să localizeze punctele cheie ale feței cu ajutorul algoritmului SIFT și SDM (Supervised Descend Method). Inspirându-ne din această lucrare, încercăm să folosim SIFT pentru a extrage caracteristica locală a limitei irisului. Procesul de localizare este rezolvat prin SDM .

Figura 1 prezintă diagrama de flux a metodei propuse de localizare a irisului. În primul rând, pupila este localizată grosier prin RST (Radial Symmetry Transform), iar limita fină este determinată de operatorul Itg-Diff. Apoi, extragem caracteristica SIFT a punctelor cheie de pe limita exterioară a irisului și a pleoapelor (superioară și inferioară). Pe baza acestor puncte cheie, modelul de optimizare dezvoltat este rezolvat prin SDM. După aceea, se obțin unele puncte cheie de pe limita exterioară a irisului și de pe pleoape (superioară și inferioară). Pleoapele finale și limita finală a irisului sunt determinate prin IRLS (IRLS (Iterative Reweighted Least-Square).

Figura 1

Flow chart of proposed iris localization method.

Figura 2 ilustrează întreaga procedură a algoritmului propus. Figura 3 prezintă comparația dintre rezultatul localizării ideale și cel obținut prin algoritmul propus.

Figura 2

O ilustrare a procesului de localizare a irisului. Curbele albastre sunt cercurile și parabolele de ajustare. Punctele verzi sunt forma inițializată a localizării. Punctele roșii sunt forma finală a procedurii.

(a)

(b)

(a)

(b)

Figura 3

Segmentarea irisului. (a) Localizarea ideală a irisului și (b) rezultatul localizării prin metoda propusă.

Articolul este organizat după cum urmează: Secțiunea 2 ilustrează modelul matematic al algoritmului de localizare. Secțiunea 3 prezintă metoda de localizare a irisului propusă. Secțiunea 4 prezintă rezultatul și analiza experimentală. Secțiunea 5 concluzionează întreaga lucrare.

2.1. Modelul matematic al localizării irisului

Să fie o imagine a irisului și să fie un vector al coordonatelor pixelilor din imagine, . este vectorul limitelor de destinație, care este compus din coordonatele punctelor cheie, . Atunci, procesul de localizare este egal cu calcularea , care este ilustrat în figura 4.

(a) Forma inițială a limitei exterioare a irisului

(b) Forma inițială și finală a limitei exterioare

(a) Forma inițială a limitei exterioare a irisului

(b) Forma inițială și finală a limitei exterioare

Figura 4

Ilustrarea procesului de localizare a irisului: (a) forma inițială a limitei irisului; (b) poziția relativă a limitei inițiale și a limitei localizate a irisului.

Se definește ca fiind vectorul caracteristic al , care este compus din grupuri de caracteristici pe . Aici, este o funcție de extragere a trăsăturilor, care proiectează pixelii în funcție de descriptorul de trăsături corespunzător.

Cu această definiție, este vectorul de trăsături al . Atunci, procesul de localizare este egal cu căutarea celui mai asemănător vector de trăsături cu . În mod ideal, atunci când diferența dintre cei doi vectori de trăsături și este mică, ar fi aproape de vectorul de formă țintă , care este localizarea așteptată.

Aici folosim distanța euclidiană pentru a măsura similitudinea a doi vectori de trăsături. Atunci procedura de localizare a irisului este echivalentă cu minimizarea următoarei funcții obiectiv:

Let , unde este vectorul de coordonate inițial, este decalajul de la la , iar (1) poate fi rescrisă sub forma

Când funcția de extragere a caracteristicilor este neliniară, minimizarea lui (2) este o problemă de programare neliniară. Vectorul de formă final poate fi obținut prin rezolvarea următoarei probleme de optimizare:

Atunci vectorul de formă de localizare final este

2.2. Caracteristica SIFT a limitei

SIFT este un descriptor de caracteristici locale de imagine utilizat în mod obișnuit . Acesta este utilizat pe scară largă în multe probleme diferite de viziune pe calculator . În această lucrare, adoptăm o strategie similară cu , extragem vectorii de caracteristici SIFT ai punctelor cheie de pe limita irisului pentru localizare. Figura 5 ilustrează caracteristica SIFT a diferitelor puncte de la granița irisului. Această figură indică faptul că cele patru puncte date (etichetate ca 1-4) de pe limita exterioară a irisului au caracteristici SIFT similare.

(a)

(b)

(a)

(b)

Figura 5

Caracteristica SIFT a diferitelor puncte. (a) pozițiile punctelor de margine selectate; (b) caracteristica SIFT a celor patru puncte selectate.

2.3. Algoritmul SDM

Înlocuind vectorul caracteristicilor SIFT în problema de optimizare din (3), se obține o problemă de programare neliniară. Algoritmul SDM adoptă învățarea supravegheată pentru a obține vectorul optim de iterație de la vectorul de formă curent la țintă. Este un algoritm iterativ pentru rezolvarea problemei de optimizare.

Acest algoritm stabilește un model de regresie liniară între decalajul vectorului de formă și caracteristica vectorului de formă curent

Apoi, vectorul de formă curent și vectorul de decalaj pot fi calculate iterativ, pentru a obține vectorul de poziție dorit: .

Pentru a reduce posibilitatea de a cădea într-un minim local, SDM adoptă mai multe iterații pentru a obține o serie de și unde este numărul de iterații și este coordonata celui de-al th-lea punct al vectorului de formă la cea de-a th-a iterație.

3. Metoda propusă

3.1. Determinarea pupilei

Când imaginile irisului sunt preluate de echipamentul în infraroșu apropiat, există o diferență mare între pupila și iris. Aici, adoptăm o strategie de localizare a pupilei „de la grosier la fin”. În primul rând, o poziție aproximativă a pupilei este obținută prin RST ; apoi localizarea exactă este obținută prin operatorul Itg-Diff.

Operatorul Itg-Diff este propus de Daugman. Formula este dată după cum urmează: unde este o funcție netedă, este operatorul de convoluție, este imaginea, este centrul limitei circulare și este raza.

Operatorul calculează diferența de gri inelară de-a lungul direcției radiale în imaginea irisului și caută diferența maximă.

3.2. Învățare SDM

În această lucrare, selectăm 32 de puncte cheie pe limita exterioară a irisului. Figura 6 ilustrează pozițiile acestor puncte. Dintre acestea, pleoapele superioare și inferioare conțin 13 puncte separat, iar arcurile din stânga și din dreapta ale limitei irisului au 4 puncte, respectiv. Figura 6(a) este imaginea de antrenament cu puncte marcate atât pe pleoapele superioare, cât și pe cele inferioare, unde punctele 1, 13, 14 și 26 sunt punctele de intersecție ale pleoapelor și, respectiv, ale marginii exterioare a irisului; figura 6(b) este imaginea de antrenament fără intersecția dintre pleoapele inferioare și iris, unde cel mai de jos punct de pe marginea exterioară a irisului este marcat ca fiind punctele de la 14 la 26; Figura 6(c) este imaginea de formare fără intersecția dintre pleoapele superioare și iris, în care punctul cel mai înalt de pe marginea exterioară a irisului este marcat ca fiind punctele de la 1 la 13; Figura 6(d) prezintă vectorul de formă mediu al tuturor eșantioanelor de formare. Caracteristicile SIFT ale punctelor marcate sunt calculate pentru fiecare imagine din baza de date și și , care sunt salvate ca parametri învățați ai regresiei liniare, sunt obținute prin rezolvarea (6).

(a)

(b)

(c)

(d)

(a)

(b)

(c)

(d)

Figura 6

Exemple de puncte cheie etichetate. (a) Puncte cheie etichetate pe irisul ocolit de pleoapele superioare și inferioare. (b) Puncte cheie etichetate pe irisul ocolit de pleoapa superioară. (c) Punctele cheie etichetate de pe irisul ocolit de pleoapa inferioară. (d) Forma medie a tuturor punctelor cheie etichetate.

3.3. Localizarea punctelor cheie

În procesul de localizare, limita exterioară a irisului este inițializată pe baza parametrilor de localizare a pupilei și a formei medii. Figura 7 ilustrează procesul de schimbare a formei după diferite etape de iterație. Figura 7(a) demonstrează punctele cheie inițiale. Figurile 7(b), 7(c) și, respectiv, 7(d), prezintă formele localizate, care sunt obținute după o dată, de două ori și trei iterații.

(a)

(b)

(c)

(d)

(a)

(b)

(c)

(d)

Figura 7

Ilustrarea etapelor de iterație. (a) Inițializarea punctelor cheie. (b) Punctele cheie după o iterație. (c) Punctele cheie după două iterații. (d) Punctele cheie după trei iterații.

Imaginea irisului pe care am folosit-o este redimensionată la lungimea laturii. Numărul de iterații .

3.4. Estimarea limitelor

Cu aceste puncte cheie obținute prin SDM, algoritmul IRLS este adoptat pentru a localiza limita irisului și a pleoapelor. Limita exterioară a irisului și a pleoapelor (în sus și în jos) este ajustată de cercuri și parabole separat.

3.4.1. Linearizarea ecuației cercului

O ecuație standard a cercului este unde și sunt coordonatele orizontale și verticale ale punctului de pe cerc și , , , și sunt parametrii. Ecuația cercului poate fi scrisă sub forma

Let , , ; atunci ecuația cercului poate fi scrisă sub forma

3.4.2. Linearizarea funcției parabolice

O funcție parabolică standard poate fi dată după cum urmează:

Apoi funcția se transformă în

Let , , , ; atunci funcția parabolică poate fi dată sub forma

3.4.3. Estimarea parametrilor prin IRLS

Când funcțiile circulară și parabolică sunt ilustrate ca (10) și (13), funcțiile neliniare inițiale se transformă în funcții liniare. Parametrii acestor funcții pot fi rezolvați prin metode legate de cele mai mici pătrate. Aici folosim IRLS pentru a estima acești parametri necunoscuți.

Să presupunem că abaterea celui de-al treilea punct este , . Pentru a face ca regresia să fie robustă, folosim funcția bisquare ca funcție de ponderare, care este ; este lățimea de bandă. Apoi, următoarea problemă de optimizare ar fi obținută prin minimizarea erorii pătratice ponderate unde este coordonatele celui de-al th-lea punct cheie obținute prin SDM.

Aici folosim IRLS pentru a rezolva (14). Funcția iterativă este

Procesul de rezolvare este realizat de o funcție încorporată în Matlab. Figura 8 ilustrează punctele cheie și limitele finale localizate. Punctele cheie de pe limita exterioară a irisului și de pe pleoapele superioare și inferioare sunt obținute prin SDM. Limitele continue sunt calculate de IRLS.

Figura 8

Rezultatul segmentării.

4. Rezultat experimental și analiză

Argitmul propus a fost testat pe un dispozitiv monocular de achiziție a irisului TCI 311, care este fabricat de Techshino Technology Inc., Beijing. Este o cameră în infraroșu apropiat cu obiectiv principal. Distanța de captură este de 8-10 cm. Rezoluția imaginii irisului este de . Construim o bază de date a irisului care conține 700 de imagini cu ajutorul acestui dispozitiv.

Experimentul este realizat pe un computer cu procesor Intel Core i5, 2 GB RAM, iar sistemul de operare este Windows 7 Professional pe 32 de biți. Algoritmul este codificat în Matlab 2014b și C++.

În experimentul nostru, imaginile de instruire și de verificare sunt selectate aleatoriu din baza de date de imagini pentru validarea încrucișată. Raportul dintre imaginile de instruire și cele verificate este de 7 : 3.

Rata de eroare și rata de eșec a preciziei de localizare sunt definite după cum urmează: unde și denotă poziția de testare și, respectiv, poziția reală a celui de-al i-lea punct de pe cea de-a j-a imagine de probă. reprezintă distanța euclidiană. și denotă lungimea și lățimea dreptunghiului minim circumscris tuturor punctelor cheie de pe cea de-a j-a imagine de probă. Conform definiției, măsoară eroarea punctului de eșantionare și reprezintă rata de eșec de localizare.

Rata de eroare cumulativă se definește după cum urmează:

Rata cumulativă de eșec se definește după cum urmează:

Aici, și sunt criteriile de evaluare, iar și este o funcție indicatoare:

Figura 9 prezintă și curbele. Figura 10 prezintă rezultatul localizării prin metoda propusă. Tabelul 1 ilustrează comparația performanțelor de localizare a limitei irisului și a pleoapelor prin Itg-Diff și algoritmul propus. Figura 11 compară rezultatele obținute prin operatorul Itg-Diff și metoda propusă, unde prima linie este rezultatul operatorului Itg-Diff, iar a doua linie este rezultatul metodei propuse. Aceste comparații demonstrează că metoda propusă are o performanță de localizare mai stabilă decât operatorul Itg-Diff în cazul unei imagini zgomotoase a irisului, în special cu pete mari de lumină, rame de ochelari etc.


Partea localizată	Itg-Diff	Algoritmul propus

Iris	99.2%	99,5%
Peisici	99.6%	99,6%

Tabelul 1

Precizia de segmentare a diferitelor metode.

(a)

(b)

(a)

(b)

Figura 9

Curbe de eroare cumulativă pe setul de testare. (a) Proporția de eroare prin metoda Root Mean Square cumulativă. (b) Proporția de eroare prin rata de eșec cumulată.

Figura 10

Rezultatele segmentării prin metoda propusă.

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

Figura 11

Rezultatele segmentării prin diferite metode (primul și al doilea rând sunt obținute prin Itg-Diff și metoda propusă separat).

Acest lucru se datorează faptului că operatorul Itg-Diff se bazează pe informațiile de gradient pe vecinătate. Acesta este sensibil la variațiile locale de intensitate. Atunci când imaginile irisului conțin pete de lumină, pleoape, gene, rame de ochelari și așa mai departe, operatorul Itg-Diff produce probabil segmentări greșite.

În timp ce caracteristica SIFT este generată pe o zonă locală relativ mare, aceasta este mai robustă la rotația imaginii, variația luminozității, scalarea la scară și zgomot decât informațiile de gradient. Acest lucru sporește robustețea algoritmului de localizare.

Tabelul 2 prezintă timpul de execuție al metodei propuse și al celorlalte două metode. Este nevoie de o medie de 26,7 ms pentru a localiza o imagine a irisului în experimentul nostru, ceea ce este mult mai eficient decât algoritmii comparați.

ED + Radon


Metode	Itg.Diff	Algoritm propus

Timp	600 ms	153.7 ms	26.7 ms

Tabelul 2

Timp de calcul al diferitelor metode.

5. Concluzii

În această lucrare, este propus un algoritm eficient de localizare a irisului bazat pe un model de optimizare. În primul rând, RST și operatorul Itg-Diff sunt utilizate pentru a localiza pupila; apoi, punctele cheie de pe granița exterioară a irisului sunt reprezentate de caracteristicile SIFT și localizate prin SDM. În cele din urmă, parametrii limitei exterioare a irisului sunt determinați prin IRLS.

Principala contribuție a acestei lucrări ar putea fi rezumată după cum urmează. Este dezvoltat un model de optimizare pentru localizarea irisului. Caracteristica SIFT este utilizată pentru reprezentarea limitei irisului, care este mai robustă decât informațiile de gradient. Algoritmul SDM este introdus pentru a rezolva problema localizării irisului, care poate genera punctele cheie ale limitei exterioare a irisului.

Rezultatele experimentale indică faptul că metoda propusă poate localiza în mod eficient și robust limita exterioară a irisului și a pleoapelor superioare și inferioare.

Conflicte de interese

Autorii declară că nu au conflicte de interese.

Recunoștințe

Acestă lucrare este susținută de Fondurile Naționale de Științe Naturale din China, nr. 61703088, Fundația de Cercetare Științifică de Doctorat a Provinciei Liaoning, nr. 20170520326, și „Fondurile de Cercetare Fundamentală pentru Universitățile Centrale”, N160503003.