Abstract
Die Irislokalisierung ist einer der wichtigsten Prozesse bei der Iriserkennung. Aufgrund von verschiedenen Arten von Rauschen im Irisbild kann das Lokalisierungsergebnis falsch sein. Außerdem ist der Lokalisierungsprozess zeitaufwändig. Um diese Probleme zu lösen, wird in diesem Papier ein effizienter Algorithmus zur Irislokalisierung mit Hilfe eines Optimierungsmodells entwickelt. Zunächst wird das Lokalisierungsproblem mit Hilfe eines Optimierungsmodells modelliert. Dann wird das SIFT-Merkmal ausgewählt, um die charakteristischen Informationen der äußeren Begrenzung der Iris und des Augenlids für die Lokalisierung darzustellen. Der SDM-Algorithmus (Supervised Descent Method) wird eingesetzt, um die Endpunkte der äußeren Begrenzung und der Augenlider zu bestimmen. Schließlich wird IRLS (Iterative Reweighted Least-Square) verwendet, um die Parameter der äußeren Begrenzung und der oberen und unteren Augenlider zu bestimmen. Experimentelle Ergebnisse zeigen, dass der vorgeschlagene Algorithmus effizient und effektiv ist.
1. Einleitung
Die Iriserkennung ist eine der zuverlässigsten biometrischen Verfahren. Ein typisches Iriserkennungssystem besteht aus mehreren Schritten, nämlich der Erfassung des Irisbildes, der Segmentierung, der Merkmalsextraktion, dem Abgleich und der Erkennung. Bei diesen Schritten ist die Segmentierung der wichtigste und grundlegendste Prozess. In diesem Schritt werden hauptsächlich vier Grenzen der Iris lokalisiert, nämlich die inneren und äußeren Grenzen der Iris und die oberen und unteren Augenlider.
In der Tat ist es schwierig, genaue und stabile Iris-Grenzen unter verschiedenen Bedingungen zu erhalten, wie z. B. variable und ungleichmäßige Helligkeit, Okklusion von Wimpern und Augenlidern, spiegelnde Reflexionen und Brillenabdeckung. Diese unbestimmten Faktoren erschweren die Segmentierung der Regenbogenhaut. Die Segmentierung ist zu einem der größten Engpässe in Iriserkennungssystemen geworden.
Die beiden bekanntesten Algorithmen zur Irislokalisierung sind der Integrodifferential-Operator (Itg-Diff) und die Kantendetektion in Kombination mit der Hough-Transformation. Sie sind in verschiedenen Publikationen anerkannt. Diese beiden Methoden verwenden jedoch hauptsächlich Gradienteninformationen, die leicht durch verschiedene Arten von Rauschen beeinträchtigt werden. Sie sind wahrscheinlich nicht effizient und erzeugen unter bestimmten Bedingungen eine falsche Lokalisierung.
(1) Berechnungsaufwand. Die Effizienz des Itg-Diff-Operators wird hauptsächlich durch den Bereich der Randparameter beeinflusst. Wenn der Suchraum der Parameter groß ist, hat der Lokalisierungsprozess eine große Berechnungskomplexität. Die Effizienz der Hough-Transformation wird hauptsächlich von der Größe des Parameterraums und der Anzahl der erkannten Kantenpixel beeinflusst. Die erkannte Kante enthält im Allgemeinen eine Menge Rauschen. Wenn zu viel Rauschen enthalten ist oder ein großer Parameterraum verwendet wird, ist der Berechnungsprozess zeitaufwändig.
(2) Ungenaue Lokalisierung der äußeren Begrenzung der Iris. Da der Itg-Diff-Operator und der Kantenerkennungsprozess nur von Gradienteninformationen abhängen, sind sie anfällig für Wimpern, Lichtflecken, Brillengestell und andere Geräusche, was zu einer falschen Lokalisierung führt.
(3) Falsche Segmentierung der oberen und unteren Augenlider. Aufgrund der unterschiedlichen Geräte, Umgebungen und Personen unterscheiden sich die Augenlider in den aufgenommenen Bildern stark. Dies führt zu einer falschen Segmentierung der Augenlider.
In den letzten Jahren wurden viele Algorithmen vorgeschlagen, die auf den beiden oben genannten klassischen Algorithmen basieren. Cui et al. extrahieren die niederfrequenten Informationen des Irisbildes durch Wavelet-Transformation. Sie verwenden den Itg-Diff-Operator zur Segmentierung der Iris. Sundaram et al. reduzieren den Suchbereich von Iris und Pupille, um die Komplexität zu verringern, und verwenden dann die Hough-Transformation zur Lokalisierung. Andere Algorithmen wie das Hooke’sche Gesetz, die aktive Kontur und die Histogrammanalyse liefern ebenfalls zufriedenstellende Ergebnisse. Weitere Methoden zur Segmentierung der Iris wurden von Jan untersucht.
Diese vorgeschlagenen Methoden zur Segmentierung der Iris hängen hauptsächlich von der Gradienteninformation ab. Daher wird der Lokalisierungsprozess leicht durch verschiedene Arten von Rauschen beeinträchtigt, was zu falschen Segmentierungen führt. Andererseits ist es aufgrund des vorhandenen Rauschens schwierig, den Bereich der Randparameter abzuschätzen. Dadurch wird der Suchprozess komplexer.
In Anbetracht der Tatsache, dass die Gradienteninformation leicht durch Rauschen beeinträchtigt wird, versuchen wir, robustere Merkmale zur Darstellung der Irisgrenze auszuwählen.
SIFT (scale-invariant features transform) ist ein robuster und skaleninvarianter lokaler Merkmalsdeskriptor. Xiong und de la Torre schlugen vor, Schlüsselpunkte des Gesichts mit SIFT und dem SDM-Algorithmus (Supervised Descend Method) zu lokalisieren. Inspiriert von dieser Arbeit versuchen wir, SIFT zu verwenden, um lokale Merkmale der Irisgrenze zu extrahieren. Der Lokalisierungsprozess wird durch SDM gelöst.
Abbildung 1 zeigt das Flussdiagramm der vorgeschlagenen Irislokalisierungsmethode. Zunächst wird die Pupille durch RST (Radial Symmetry Transform) grob lokalisiert und die feine Grenze durch den Itg-Diff-Operator bestimmt. Dann extrahieren wir die SIFT-Merkmale von Schlüsselpunkten am äußeren Rand der Iris und an den Augenlidern (oben und unten). Auf der Grundlage dieser Schlüsselpunkte wird das entwickelte Optimierungsmodell durch SDM gelöst. Anschließend werden einige Schlüsselpunkte auf der äußeren Begrenzung der Iris und den Augenlidern (oben und unten) ermittelt. Die endgültigen Augenlider und Irisgrenzen werden durch IRLS (Iterative Reweighted Least-Square) bestimmt.
Abbildung 2 zeigt das gesamte Verfahren des vorgeschlagenen Algorithmus. Abbildung 3 zeigt den Vergleich zwischen dem idealen und dem durch den vorgeschlagenen Algorithmus erzielten Lokalisierungsergebnis.
(a)
(b)
(a)
(b)
Das Papier ist wie folgt aufgebaut: Abschnitt 2 veranschaulicht das mathematische Modell des Lokalisierungsalgorithmus. Abschnitt 3 stellt die vorgeschlagene Iris-Lokalisierungsmethode vor. Abschnitt 4 zeigt die experimentellen Ergebnisse und Analysen. Abschnitt 5 schließt die gesamte Arbeit ab.
2.1. Mathematisches Modell der Irislokalisierung
Sei ein Irisbild und sei ein Vektor der Koordinaten von Pixeln im Bild, . ist der Vektor der Zielgrenzen, der sich aus den Koordinaten von Schlüsselpunkten zusammensetzt, . Dann ist der Lokalisierungsprozess gleich der Berechnung von , was in Abbildung 4 dargestellt ist.
(a) Ursprüngliche Form der äußeren Begrenzung der Iris
(b) Ursprüngliche und endgültige Form der äußeren Begrenzung
(a) Ursprüngliche Form der äußeren Begrenzung der Iris
(b) Ursprüngliche und endgültige Form der äußeren Begrenzung
Definieren Sie als den Merkmalsvektor von , der aus Gruppen von Merkmalen auf zusammengesetzt ist. Hier ist eine Merkmalsextraktionsfunktion, die Pixel auf ihren entsprechenden Merkmalsdeskriptor projiziert.
Mit dieser Definition ist der Merkmalsvektor von . Dann ist der Lokalisierungsprozess gleich der Suche nach dem ähnlichsten Merkmalsvektor zu . Idealerweise, wenn der Unterschied zwischen den beiden Merkmalsvektoren und klein ist, wäre nahe am Zielformvektor, was die erwartete Lokalisierung ist.
Hier verwenden wir den euklidischen Abstand, um die Ähnlichkeit von zwei Merkmalsvektoren zu messen. Dann ist das Iris-Lokalisierungsverfahren gleichbedeutend mit der Minimierung der folgenden Zielfunktion:
Let , wobei der anfängliche Koordinatenvektor ist, der Offset von bis ist und (1) umgeschrieben werden kann als
Wenn die Funktion zur Merkmalsextraktion nichtlinear ist, ist die Minimierung von (2) ein nichtlineares Programmierproblem. Der endgültige Formvektor kann durch Lösen des folgenden Optimierungsproblems erhalten werden:
Dann ist der endgültige Formvektor der Lokalisierung
2.2. SIFT-Merkmal von Boundary
SIFT ist ein häufig verwendeter Deskriptor für lokale Bildmerkmale. Er wird in vielen verschiedenen Computer-Vision-Problemen verwendet. In dieser Arbeit verwenden wir eine ähnliche Strategie wie bei der Extraktion von SIFT-Merkmalsvektoren der Schlüsselpunkte am Irisrand zur Lokalisierung. Abbildung 5 zeigt die SIFT-Merkmale verschiedener Punkte am Rand der Irisblende. Diese Abbildung zeigt, dass die vier Punkte (mit 1-4 bezeichnet) auf der äußeren Begrenzung der Iris ähnliche SIFT-Merkmale aufweisen.
(a)
(b)
(a)
(b)
2.3. SDM-Algorithmus
Durch Einsetzen des SIFT-Merkmalsvektors in das Optimierungsproblem in (3) ergibt sich ein nichtlineares Programmierproblem. Der SDM-Algorithmus verwendet überwachtes Lernen, um den optimalen Iterationsvektor vom aktuellen Formvektor zum Ziel zu erhalten. Es handelt sich um einen iterativen Algorithmus zur Lösung des Optimierungsproblems.
Dieser Algorithmus erstellt ein lineares Regressionsmodell zwischen dem Offset des Formvektors und dem Merkmal des aktuellen Formvektors
Dann können der aktuelle Formvektor und der Offsetvektor iterativ berechnet werden, um den gewünschten Positionsvektor zu erhalten: .
Um die Möglichkeit zu verringern, in ein lokales Minimum zu fallen, nimmt SDM mehrere Iterationen an, um eine Reihe von und zu erhalten, wobei die Anzahl der Iterationen und die Koordinate des dritten Punktes des Formvektors bei der dritten Iteration ist.
3. Vorgeschlagene Methode
3.1. Bestimmung der Pupille
Wenn die Irisbilder mit Nahinfrarotgeräten aufgenommen werden, besteht ein großer Unterschied zwischen Pupille und Iris. In diesem Fall wird eine „Grob-zu-Fein“-Lokalisierungsstrategie für die Pupille angewandt. Zunächst wird eine grobe Pupillenposition durch RST ermittelt; die genaue Lokalisierung erfolgt dann durch den Operator Itg-Diff.
Der Operator Itg-Diff wurde von Daugman vorgeschlagen. Die Formel lautet wie folgt: ist eine glatte Funktion, ist Faltungsoperator, ist das Bild, ist der Mittelpunkt der kreisförmigen Begrenzung, und ist der Radius.
Der Operator berechnet die ringförmige Graudifferenz entlang der radialen Richtung im Irisbild und sucht die maximale Differenz.
3.2. SDM-Lernen
In dieser Arbeit werden 32 Schlüsselpunkte an der äußeren Begrenzung der Iris ausgewählt. Abbildung 6 veranschaulicht die Positionen dieser Punkte. Darunter befinden sich 13 Punkte auf dem oberen und unteren Augenlid und jeweils 4 Punkte auf dem linken und rechten Bogen der Irisbegrenzung. Abbildung 6(a) ist das Trainingsbild mit markierten Punkten auf den oberen und unteren Augenlidern, wobei die Punkte 1, 13, 14 und 26 die Schnittpunkte der Augenlider bzw. des äußeren Randes der Iris sind; Abbildung 6(b) ist das Trainingsbild ohne Schnittpunkt der unteren Augenlider und der Iris, wobei der niedrigste Punkt am äußeren Rand der Iris als die Punkte 14 bis 26 markiert ist; Abbildung 6(c) ist das Trainingsbild ohne Überschneidung der oberen Augenlider und der Iris, bei dem der höchste Punkt am äußeren Rand der Iris als die Punkte 1 bis 13 markiert ist; Abbildung 6(d) zeigt den durchschnittlichen Formvektor aller Trainingsmuster. Die SIFT-Merkmale der markierten Punkte werden für jedes Bild in der Datenbank berechnet und und , die als die gelernten Parameter der linearen Regression gespeichert werden, werden durch Lösen von (6) erhalten.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
3.3. Lokalisierung der Schlüsselpunkte
Bei der Lokalisierung wird die äußere Begrenzung der Iris auf der Grundlage der Parameter der Pupillenlokalisierung und der durchschnittlichen Form initialisiert. Abbildung 7 veranschaulicht den Prozess der Formänderung nach verschiedenen Iterationsschritten. Abbildung 7(a) zeigt die anfänglichen Schlüsselpunkte. Die Abbildungen 7(b), 7(c) und 7(d) zeigen die lokalisierten Formen, die nach ein-, zwei- und dreimaliger Iteration erhalten werden.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
Das von uns verwendete Irisbild ist auf Seitenlänge skaliert. Die Iterationszahl .
3.4. Schätzung der Grenzen
Mit diesen durch SDM erhaltenen Schlüsselpunkten wird der IRLS-Algorithmus verwendet, um die Grenzen der Iris und der Augenlider zu bestimmen. Die äußeren Begrenzungen der Iris und der Augenlider (oben und unten) werden durch Kreise und Parabeln getrennt angepasst.
3.4.1. Linearisierung der Kreisgleichung
Eine Standardgleichung des Kreises lautet, wobei und die horizontalen und vertikalen Koordinaten des Punktes auf dem Kreis und , , und die Parameter sind. Die Kreisgleichung kann geschrieben werden als
Lass , , ; dann kann die Gleichung des Kreises geschrieben werden als
3.4.2. Linearisierung einer parabolischen Funktion
Eine parabolische Standardfunktion kann wie folgt angegeben werden:
Dann wird die Funktion zu
Lassen Sie , , ; dann könnte die parabolische Funktion gegeben sein als
3.4.3. Schätzung der Parameter durch IRLS
Wenn die kreisförmigen und parabolischen Funktionen als (10) und (13) dargestellt werden, werden die ursprünglichen nichtlinearen Funktionen zu linearen Funktionen. Die Parameter dieser Funktionen können durch Methoden der kleinsten Quadrate gelöst werden. Hier verwenden wir IRLS, um diese unbekannten Parameter zu schätzen.
Angenommen, die Abweichung des dritten Punktes ist , . Um die Regression robust zu machen, verwenden wir die Bisquadratfunktion als Gewichtsfunktion, die ; Bandbreite ist. Dann ergibt sich das folgende Optimierungsproblem durch Minimierung des gewichteten quadratischen Fehlers, wobei die Koordinaten der durch SDM erhaltenen th-Schlüsselpunkte sind.
Hier verwenden wir IRLS zur Lösung von (14). Die Iterationsfunktion ist
Der Lösungsprozess wird durch eine in Matlab eingebaute Funktion realisiert. Abbildung 8 veranschaulicht die Schlüsselpunkte und die endgültigen lokalisierten Grenzen. Die Schlüsselpunkte an der äußeren Irisgrenze und an den oberen und unteren Augenlidern werden durch SDM ermittelt. Die kontinuierlichen Grenzen werden mit IRLS berechnet.
4. Experimentelles Ergebnis und Analyse
Der vorgeschlagene Algorithmus wurde an einem monokularen Iris-Erfassungsgerät TCI 311 getestet, das von Techshino Technology Inc. hergestellt wird, Peking. Es handelt sich um eine Nahinfrarotkamera mit Prime-Objektiv. Der Erfassungsabstand beträgt 8-10 cm. Die Auflösung des Irisbildes beträgt . Wir erstellen mit diesem Gerät eine Iris-Datenbank mit 700 Bildern.
Das Experiment wird auf einem Computer mit Intel Core i5 CPU, 2 GB RAM und dem Betriebssystem Windows 7 Professional 32-bit durchgeführt. Der Algorithmus ist in Matlab 2014b und C++ kodiert.
In unserem Experiment werden die Trainings- und Verifikationsbilder zufällig aus der Bilddatenbank für die Kreuzvalidierung ausgewählt. Das Verhältnis von Trainings- und Verifikationsbildern beträgt 7 : 3.
Die Fehlerrate und die Ausfallrate der Lokalisierungsgenauigkeit sind wie folgt definiert: wobei und die Testposition bzw. die wahre Position des i-ten Punktes auf dem j-ten Beispielbild bezeichnen. stellt den euklidischen Abstand dar. und bezeichnen die Länge und Breite des minimalen umschriebenen Rechtecks aller Schlüsselpunkte auf dem th-ten Beispielbild. Gemäß der Definition misst der Wert den Stichprobenpunktfehler und ist die Standortfehlerrate.
Die kumulative Fehlerrate ist wie folgt definiert:
Die kumulative Fehlerrate ist wie folgt definiert:
Hier sind und die Bewertungskriterien, und ist eine Indikatorfunktion:
Abbildung 9 zeigt und Kurven. Abbildung 10 zeigt das Ergebnis der Lokalisierung mit der vorgeschlagenen Methode. Tabelle 1 veranschaulicht den Leistungsvergleich der Lokalisierung von Irisgrenzen und Augenlidern durch Itg-Diff und den vorgeschlagenen Algorithmus. In Abbildung 11 werden die mit dem Itg-Diff-Operator und der vorgeschlagenen Methode erzielten Ergebnisse verglichen, wobei die erste Zeile das Ergebnis des Itg-Diff-Operators und die zweite Zeile das Ergebnis der vorgeschlagenen Methode darstellt. Diese Vergleiche zeigen, dass die vorgeschlagene Methode eine stabilere Lokalisierungsleistung als der Itg-Diff-Operator bei verrauschten Irisbildern hat, insbesondere bei großen Lichtflecken, Brillengestellen usw.
|
(a)
(b)
(a)
(b)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
Das liegt daran, dass sich der Itg-Diff-Operator auf die Gradienteninformationen der Nachbarschaft stützt. Er ist empfindlich gegenüber lokalen Intensitätsschwankungen. Wenn Irisbilder Lichtpunkte, Augenlider, Wimpern, Brillenrahmen usw. enthalten, führt der Itg-Diff-Operator wahrscheinlich zu falschen Segmentierungen.
Das SIFT-Merkmal wird zwar auf einem relativ großen lokalen Bereich erzeugt, ist aber robuster gegenüber Bildrotation, Helligkeitsschwankungen, Skalierung und Rauschen als Gradienteninformationen. Dies erhöht die Robustheit des Lokalisierungsalgorithmus.
Tabelle 2 zeigt die Laufzeit der vorgeschlagenen Methode und der beiden anderen Methoden. In unserem Experiment werden durchschnittlich 26,7 ms für die Lokalisierung eines Irisbildes benötigt, was wesentlich effizienter ist als die Vergleichsalgorithmen.
|
5. Schlussfolgerungen
In dieser Arbeit wird ein effizienter Algorithmus zur Lokalisierung der Iris basierend auf einem Optimierungsmodell vorgeschlagen. Zunächst werden RST und Itg-Diff-Operator zur Lokalisierung der Pupille verwendet; dann werden die Schlüsselpunkte am äußeren Rand der Iris durch SIFT-Merkmale dargestellt und durch SDM lokalisiert. Schließlich werden die Parameter der äußeren Begrenzung der Iris durch IRLS bestimmt.
Der Hauptbeitrag dieser Arbeit lässt sich wie folgt zusammenfassen. Es wird ein Optimierungsmodell für die Lokalisierung der Iris entwickelt. Für die Darstellung der Irisgrenzen wird das SIFT-Merkmal verwendet, das robuster ist als Gradienteninformationen. Es wird ein SDM-Algorithmus zur Lösung des Iris-Lokalisierungsproblems eingeführt, der die Schlüsselpunkte der äußeren Begrenzung der Iris generieren kann.
Experimentelle Ergebnisse zeigen, dass die vorgeschlagene Methode die äußere Begrenzung der Iris sowie die oberen und unteren Augenlider effizient und robust lokalisieren kann.
Interessenkonflikte
Die Autoren erklären, dass sie keine Interessenkonflikte haben.
Danksagungen
Diese Arbeit wurde von den National Natural Science Funds of China, Nr. 61703088, der Doctoral Scientific Research Foundation of Liaoning Province, Nr. 20170520326, und „the Fundamental Research Funds for the Central Universities,“ N160503003, unterstützt.