Abstract
Iris localization is one of the most important processes in iris recognition. Ze względu na różne rodzaje szumów w obrazie tęczówki, wynik lokalizacji może być błędny. Poza tym, proces lokalizacji jest czasochłonny. Aby rozwiązać te problemy, niniejszy artykuł opracowuje efektywny algorytm lokalizacji tęczówki oka poprzez model optymalizacyjny. Po pierwsze, problem lokalizacji jest modelowany przez model optymalizacyjny. Następnie wybierana jest cecha SIFT do reprezentowania charakterystycznych informacji o zewnętrznej granicy tęczówki i powieki w celu lokalizacji. I SDM (Supervised Descent Method) algorytm jest zatrudniony do rozwiązania końcowych punktów zewnętrznej granicy i powiek. Wreszcie, IRLS (Iterative Reweighted Least-Square) jest używany do uzyskania parametrów zewnętrznej granicy i górnej i dolnej powieki. Wynik eksperymentalny wskazuje, że proponowany algorytm jest wydajny i skuteczny.
1. Wstęp
Rozpoznawanie tęczówki jest jedną z najbardziej niezawodnych biometrii. Jest szeroko stosowany w różnych rodzajach aplikacji.
Typowy system rozpoznawania tęczówki zawiera kilka kroków, które są akwizycja obrazu tęczówki, segmentacja, ekstrakcja cech, dopasowanie i rozpoznawanie. W tych krokach, segmentacja jest najważniejszym i podstawowym procesem. Ten krok głównie zlokalizować cztery granice tęczówki, które są wewnętrzne i zewnętrzne granice tęczówki i górnej i dolnej powieki.
W rzeczywistości trudno jest uzyskać dokładne i stabilne granice tęczówki w różnych warunkach, takich jak zmienna i niejednolita jasność, okluzja rzęs i powiek, odbicia spekularne i okulary pokrycia. Te nieokreślone czynniki sprawiają, że segmentacja tęczówki jest trudna. Segmentacja stała się głównym wąskim gardłem w systemie rozpoznawania tęczówki.
Najbardziej znane dwa algorytmy lokalizacji tęczówki są integrodifferential (Itg-Diff) operator i wykrywanie krawędzi w połączeniu z transformaty Hough . Są one szeroko zatwierdzone przez różne publikacje. Jednak te dwie metody wykorzystują głównie informacje gradientowe, które łatwo ulegają wpływowi różnego rodzaju szumów. Prawdopodobnie nie są one wydajne i generują błędną lokalizację w pewnych warunkach.
(1) Złożoność obliczeniowa. Na efektywność operatora Itg-Diff wpływa głównie zakres parametrów brzegowych. Gdy przestrzeń wyszukiwania parametrów jest duża, proces lokalizacji ma dużą złożoność obliczeniową. Na wydajność transformaty Hougha wpływa głównie rozmiar przestrzeni parametrów oraz liczba wykrytych pikseli krawędzi. Wykryta krawędź zawiera zazwyczaj wiele szumów. Gdy zbyt wiele szumów jest uwzględnionych lub użyta jest duża przestrzeń parametrów, proces obliczeniowy jest czasochłonny.
(2) Niedokładna lokalizacja zewnętrznej granicy tęczówki. Ponieważ operator Itg-Diff i proces wykrywania krawędzi zależy tylko od informacji gradientu, są one podatne na rzęsy, plamki światła, oprawki okularów i inne zakłócenia, co skutkuje błędną lokalizacją.
(3) Nieprawidłowa segmentacja górnej i dolnej powieki. Ze względu na różnorodność sprzętu, środowiska i osób, powieki na przechwyconych obrazach znacznie się różnią. Prowadzi to do nieprawidłowej segmentacji powiek.
W ostatnich latach, wiele algorytmów zostało zaproponowanych w oparciu o powyższe dwa klasyczne algorytmy. Cui et al. wyodrębnić niskie częstotliwości informacji obrazu tęczówki przez transformatę falkową. Używają operatora Itg-Diff do segmentacji tęczówki. Sundaram et al. zmniejszają zakres wyszukiwania tęczówki i źrenicy w celu zmniejszenia złożoności, a następnie wykorzystują transformatę Hougha do lokalizacji. Inne algorytmy, takie jak prawo Hooke’a, aktywny kontur i analiza histogramu również dają zadowalające rezultaty. Więcej metod segmentacji tęczówki jest badanych przez Jana .
W rzeczywistości, te proponowane metody segmentacji tęczówki głównie zależą od informacji gradientu. Więc proces lokalizacji jest łatwo dotknięte przez różne rodzaje szumów, generując złe segmentacji. Z drugiej strony, istniejący szum utrudnia oszacowanie zakresu parametrów brzegowych. To sprawia, że proces wyszukiwania złożoność obliczeniowa.
Rozważając, że informacja gradientu jest łatwo dotknięte przez szumy, staramy się wybrać bardziej odporne cechy do reprezentowania granicy tęczówki.
SIFT (transformacja skalowo-niezmiennych cech) jest solidny i skali-niezmienny deskryptor cech lokalnych. Xiong i de la Torre zaproponowali lokalizację kluczowych punktów twarzy za pomocą algorytmu SIFT i SDM (Supervised Descend Method). Zainspirowani tą pracą, próbujemy wykorzystać SIFT do ekstrakcji lokalnych cech granicy tęczówki. Proces lokalizacji jest rozwiązywany przez SDM .
Rysunek 1 pokazuje schemat przepływu proponowanej metody lokalizacji tęczówki. Po pierwsze, źrenica jest zgrubnie zlokalizowana przez RST (Radial Symmetry Transform), a cienka granica jest określona przez operator Itg-Diff. Następnie, wyodrębniamy cechy SIFT kluczowych punktów na zewnętrznej granicy tęczówki i powiek (górnej i dolnej). W oparciu o te punkty kluczowe, opracowany model optymalizacyjny jest rozwiązywany przez SDM. Po tym, niektóre kluczowe punkty na zewnętrznej granicy tęczówki i powiek (górna i dolna) są uzyskane. Ostateczna granica powiek i tęczówki jest wyznaczana za pomocą IRLS (Iterative Reweighted Least-Square).
Rysunek 2 ilustruje całą procedurę proponowanego algorytmu. Rysunek 3 przedstawia porównanie idealnego i uzyskanego wyniku lokalizacji za pomocą proponowanego algorytmu.
(a)
(b)
(a)
(b)
Artykuł jest zorganizowany w następujący sposób: Rozdział 2 ilustruje model matematyczny algorytmu lokalizacji. Sekcja 3 przedstawia proponowaną metodę lokalizacji tęczówki oka. Sekcja 4 przedstawia wynik eksperymentalny i analizę. Sekcja 5 podsumowuje całą pracę.
2.1. Mathematical Model of Iris Localization
Let be an iris image and be a vector of the coordinates of pixels in the image, . is the vector of destination boundaries, which is composed of coordinates of key points, . Wówczas proces lokalizacji jest równy obliczeniu , co zostało zilustrowane na rysunku 4.
(a) Początkowy kształt zewnętrznej granicy tęczówki
(b) Początkowy i końcowy kształt zewnętrznej granicy
(a) Początkowy kształt zewnętrznej granicy tęczówki
(b) Początkowy i końcowy kształt zewnętrznej granicy
Zdefiniuj jako wektor cech , który składa się z grup cech na . Tutaj, jest funkcją ekstrakcji cech, która rzutuje piksele do odpowiadającego im deskryptora cech.
Zgodnie z tą definicją, jest wektorem cech . Następnie proces lokalizacji jest równy poszukiwaniu najbardziej podobnego wektora cech do . Idealnie, gdy różnica między dwoma wektorami cech i jest mała, będzie blisko wektora kształtu docelowego , co jest oczekiwaną lokalizacją.
Tutaj używamy odległości euklidesowej do pomiaru podobieństwa dwóch wektorów cech. Następnie procedura lokalizacji tęczówki jest równoważna minimalizacji następującej funkcji celu:
Let , gdzie jest początkowym wektorem współrzędnych, jest przesunięciem od do , a (1) można przepisać jako
Gdy funkcja ekstrakcji cech jest nieliniowa, minimalizacja (2) jest problemem programowania nieliniowego. Ostateczny wektor kształtu można uzyskać rozwiązując następujący problem optymalizacyjny:
Wtedy ostateczny wektor kształtu lokalizacji wynosi
2.2. SIFT Feature of Boundary
SIFT jest powszechnie stosowanym deskryptorem cech lokalnych obrazu. Jest on szeroko stosowany w wielu różnych problemach związanych z widzeniem komputerowym. W tym artykule, przyjmujemy podobną strategię jak , wyodrębnić SIFT wektory cech kluczowych punktów na granicy tęczówki do lokalizacji. Rysunek 5 ilustruje cechy SIFT różnych punktów na granicy tęczówki. Rysunek ten wskazuje, że dane cztery punkty (oznaczone jako 1-4) na zewnętrznej granicy tęczówki mają podobne cechy SIFT.
(a)
(b)
(a)
(b)
2.3. Algorytm SDM
Przez podstawienie wektora cech SIFT do problemu optymalizacyjnego w (3), otrzymuje się nieliniowy problem programistyczny. Algorytm SDM przyjmuje uczenie nadzorowane, aby uzyskać optymalny wektor iteracji od bieżącego wektora kształtu do celu. Jest to iteracyjny algorytm rozwiązywania problemu optymalizacji.
Algorytm ten ustanawia model regresji liniowej między przesunięciem wektora kształtu a cechą bieżącego wektora kształtu
Wtedy bieżący wektor kształtu i wektor przesunięcia mogą być obliczane iteracyjnie, aby uzyskać pożądany wektor pozycji: .
W celu zmniejszenia możliwości wpadnięcia w lokalne minimum, SDM przyjmuje kilka iteracji, aby uzyskać serię i gdzie jest liczbą iteracji i jest współrzędną punktu th wektora kształtu w th iteracji.
3. Proponowana metoda
3.1. Pupil Determination
Gdy obrazy tęczówki są wykonywane przez urządzenia w bliskiej podczerwieni, istnieje duża różnica między źrenicą a tęczówką. Tutaj, przyjmujemy strategię lokalizacji źrenicy „od zgrubnej do dokładnej”. Po pierwsze, przybliżona pozycja źrenicy jest uzyskiwana przez RST; następnie dokładna lokalizacja jest uzyskiwana przez operator Itg-Diff.
Operator Itg-Diff został zaproponowany przez Daugmana. Wzór jest podany w następujący sposób: gdzie jest gładką funkcją, jest operatorem konwolucji, jest obrazem, jest środkiem okrągłej granicy i jest promieniem.
Operator oblicza pierścieniową różnicę szarości wzdłuż kierunku radialnego w obrazie tęczówki i wyszukuje maksymalną różnicę.
3.2. SDM Learning
W tym artykule, wybieramy 32 kluczowe punkty na zewnętrznej granicy tęczówki. Rysunek 6 ilustruje położenie tych punktów. Wśród nich, górne i dolne powieki zawierają 13 punktów oddzielnie, a lewe i prawe łuki granicy tęczówki mają odpowiednio 4 punkty. Rysunek 6(a) to obraz treningowy z zaznaczonymi punktami na górnej i dolnej powiece, gdzie punkty 1, 13, 14 i 26 są punktami przecięcia odpowiednio powiek i zewnętrznej krawędzi tęczówki; Rysunek 6(b) to obraz treningowy bez przecięcia dolnej powieki i tęczówki, gdzie najniższy punkt na zewnętrznej krawędzi tęczówki jest zaznaczony jako punkty od 14 do 26; Rysunek 6(c) jest obrazem treningowym bez przecięcia górnych powiek i tęczówki, gdzie najwyższy punkt na zewnętrznej krawędzi tęczówki jest oznaczony jako punkty od 1. do 13. Rysunek 6(d) pokazuje średni wektor kształtu wszystkich próbek treningowych. Cechy SIFT zaznaczonych punktów są obliczane dla każdego obrazu w bazie danych i i , które są zapisywane jako wyuczone parametry regresji liniowej, są otrzymywane przez rozwiązanie (6).
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
3.3. Lokalizacja punktów kluczowych
W procesie lokalizacji, zewnętrzna granica tęczówki jest inicjalizowana na podstawie parametrów lokalizacji źrenicy i średniego kształtu. Rysunek 7 ilustruje proces zmiany kształtu po różnych krokach iteracji. Rysunek 7(a) demonstruje początkowe punkty kluczowe. Rysunki 7(b), 7(c) i 7(d) przedstawiają odpowiednio zlokalizowane kształty, które są otrzymywane po jednokrotnej, dwukrotnej i trzykrotnej iteracji.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
Użyty przez nas obraz tęczówki jest przeskalowany do długości boku. Liczba iteracji .
3.4. Estimating Boundaries
With these key points obtained by SDM, IRLS algorithm is adopted to locate the iris and eyelids boundary. Zewnętrzna granica tęczówki i powiek (w górę i w dół) są dopasowane przez okrąg i parabole oddzielnie.
3.4.1. Linearyzacja równania okręgu
Standardowe równanie okręgu to gdzie i są współrzędnymi poziomymi i pionowymi punktu na okręgu, a , , i są parametrami. Równanie okręgu może być zapisane jako
Let , , , ; wtedy równanie okręgu może być zapisane jako
3.4.2. Linearyzacja funkcji parabolicznej
Standardowa funkcja paraboliczna może być podana w następujący sposób:
Wtedy funkcja zmienia się w
Let , , ; wtedy funkcja paraboliczna może być dana jako
3.4.3. Estimating Parameter by IRLS
Gdy funkcje kołowe i paraboliczne są zilustrowane jako (10) i (13), oryginalne funkcje nieliniowe stają się liniowe. Parametry tych funkcji mogą być rozwiązane za pomocą metod związanych z najmniejszymi kwadratami. Tutaj używamy IRLS do oszacowania tych nieznanych parametrów.
Zakładamy, że odchylenie punktu th jest , . Aby regresja była solidna, używamy funkcji bisquare jako funkcji wagowej, która jest ; jest przepustowością. Następnie następujący problem optymalizacyjny zostałby uzyskany przez minimalizację ważonego błędu kwadratowegowhere jest współrzędnymi punktów kluczowych th uzyskanych przez SDM.
Tutaj używamy IRLS do rozwiązania (14). Funkcja iteracyjna to
Proces rozwiązywania jest realizowany przez wbudowaną funkcję Matlaba. Rysunek 8 ilustruje kluczowe punkty i ostateczne zlokalizowane granice. Kluczowe punkty na zewnętrznej granicy tęczówki oraz górnej i dolnej powieki są uzyskiwane przez SDM. Granice ciągłe są obliczane przez IRLS.
4. Experimental Result and Analysis
Proponowany algorytm został przetestowany na monokularnym urządzeniu do akwizycji tęczówki TCI 311, które jest produkowane przez Techshino Technology Inc, Beijing. Jest to kamera na bliską podczerwień z obiektywem typu prime. Odległość przechwytywania wynosi 8-10 cm. Rozdzielczość obrazu tęczówki wynosi . Konstruujemy bazę danych tęczówki zawierającą 700 obrazów przez to urządzenie.
Eksperyment przeprowadzany jest na komputerze z procesorem Intel Core i5, 2 GB RAM, a system operacyjny to Windows 7 Professional 32-bit. Algorytm jest zakodowany w Matlab 2014b i C++.
W naszym eksperymencie obrazy treningowe i weryfikacyjne są losowo wybierane z bazy obrazów do walidacji krzyżowej. Stosunek obrazów treningowych i zweryfikowanych wynosi 7 : 3.
Stopień błędu i stopa niepowodzenia dokładności lokalizacji są zdefiniowane w następujący sposób: gdzie i oznaczają odpowiednio pozycję testową i prawdziwą pozycję i-tego punktu na j-tym obrazie próbki. reprezentuje odległość euklidesową. i oznaczają długość i szerokość minimalnego prostokąta obwodowego wszystkich kluczowych punktów na th obrazie próbki. Zgodnie z definicją, mierzy błąd punktu próbki i jest wskaźnikiem błędu lokalizacji.
Kumulatywna stopa błędu jest zdefiniowana w następujący sposób:
Kumulatywna stopa błędu jest zdefiniowana następująco:
Tutaj, i są kryteriami oceny, i jest funkcją wskaźnika:
Rysunek 9 przedstawia i krzywe. Na rysunku 10 przedstawiono wynik lokalizacji za pomocą proponowanej metody. Tabela 1 ilustruje porównanie wydajności lokalizacji granicy tęczówki i powiek za pomocą Itg-Diff i proponowanego algorytmu. Na rysunku 11 porównano wyniki uzyskane za pomocą operatora Itg-Diff i proponowanej metody, gdzie pierwsza linia to wynik działania operatora Itg-Diff, a druga linia to wynik działania proponowanej metody. Porównania te pokazują, że proponowana metoda ma bardziej stabilną wydajność lokalizacji niż operator Itg-Diff w zaszumionym obrazie tęczówki, zwłaszcza z dużymi jasnymi plamami, oprawkami okularów i tak dalej.
|
(a)
(b)
(a)
(b)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
Wynika to z faktu, że operator Itg-Diff opiera się na informacji o gradiencie w sąsiedztwie. Jest on wrażliwy na lokalne zmiany intensywności. Gdy obrazy tęczówki zawierają plamki światła, powieki, rzęsy, oprawki okularów i tak dalej, operator Itg-Diff prawdopodobnie produkuje błędne segmentacje.
Choć funkcja SIFT jest generowana na względnie dużym obszarze lokalnym, jest bardziej odporna na rotację obrazu, zmiany jasności, skalowanie skali i szum niż informacje gradientowe. Zwiększa to odporność algorytmu lokalizacyjnego.
Tabela 2 pokazuje czas działania proponowanej metody i dwóch pozostałych metod. To zajmuje średnio 26.7 ms do lokalizacji obrazu tęczówki w naszym eksperymencie, który jest znacznie wydajny niż porównywane algorytmy.
|
5. Wnioski
W niniejszej pracy zaproponowano wydajny algorytm lokalizacji tęczówki oka oparty na modelu optymalizacyjnym. Po pierwsze, RST i operator Itg-Diff są używane do lokalizacji źrenicy; następnie kluczowe punkty na zewnętrznej granicy tęczówki są reprezentowane przez cechy SIFT i lokalizowane przez SDM. Wreszcie, parametry zewnętrznej granicy tęczówki są określane przez IRLS.
Główny wkład tego artykułu można podsumować w następujący sposób. Model optymalizacji jest opracowany dla lokalizacji tęczówki. Cecha SIFT jest używana do reprezentacji granic tęczówki, która jest bardziej odporna niż informacje gradientowe. Algorytm SDM jest wprowadzony w celu rozwiązania problemu lokalizacji tęczówki, który może generować kluczowe punkty zewnętrznej granicy tęczówki.
Wyniki eksperymentalne wskazują, że proponowana metoda może zlokalizować zewnętrzną granicę tęczówki oraz górną i dolną powiekę skutecznie i solidnie.
Konflikty interesów
Autorzy deklarują, że nie mają konfliktów interesów.
Podziękowania
Ta praca jest wspierana przez National Natural Science Funds of China, nr 61703088, Doctoral Scientific Research Foundation of Liaoning Province, nr 20170520326, oraz „the Fundamental Research Funds for the Central Universities,” N160503003.