Localización eficiente del iris mediante un modelo de optimización

Resumen

La localización del iris es uno de los procesos más importantes en el reconocimiento del iris. Debido a los diferentes tipos de ruidos en la imagen del iris, el resultado de la localización puede ser erróneo. Además, el proceso de localización requiere mucho tiempo. Para resolver estos problemas, este trabajo desarrolla un algoritmo eficiente de localización del iris mediante un modelo de optimización. En primer lugar, el problema de localización se modela mediante un modelo de optimización. A continuación, se selecciona la característica SIFT para representar la información característica del límite exterior del iris y del párpado para la localización. Y se emplea el algoritmo SDM (Supervised Descent Method) para resolver los puntos finales de los límites exteriores y los párpados. Por último, se utiliza el algoritmo IRLS (Iterative Reweighted Least-Square) para obtener los parámetros del límite exterior y de los párpados superiores e inferiores. Los resultados experimentales indican que el algoritmo propuesto es eficiente y eficaz.

1. Introducción

El reconocimiento del iris es una de las biometrías más fiables . Es ampliamente utilizado en diferentes tipos de aplicaciones.

Un típico sistema de reconocimiento del iris contiene varios pasos, que son la adquisición de la imagen del iris, la segmentación, la extracción de características, la coincidencia, y el reconocimiento . En estos pasos, la segmentación es el proceso más importante y básico. Este paso localiza principalmente cuatro límites del iris, que son los límites internos y externos del iris y los párpados superiores e inferiores.

De hecho, es difícil obtener límites del iris precisos y estables bajo diferentes condiciones, como el brillo variable y no uniforme, la oclusión de las pestañas y los párpados, los reflejos especulares y la cobertura de las gafas. Estos factores indeterminados dificultan la segmentación del iris. La segmentación se ha convertido en un importante cuello de botella en el sistema de reconocimiento del iris.

Los dos algoritmos de localización del iris más conocidos son el operador integrodiferencial (Itg-Diff) y la detección de bordes combinada con la transformada de Hough . Están ampliamente aprobados por diferentes publicaciones. Sin embargo, estos dos métodos utilizan principalmente información de gradiente, que se ve fácilmente afectada por diferentes tipos de ruidos. Probablemente no sean eficientes y generen una localización errónea bajo algunas condiciones.

(1) Complejidad computacional. La eficiencia del operador Itg-Diff se ve afectada principalmente por el rango de los parámetros de frontera. Cuando el espacio de búsqueda del parámetro es grande, el proceso de localización tiene una gran complejidad de cálculo. La eficacia de la transformación de Hough depende principalmente del tamaño del espacio de los parámetros y del número de píxeles de los bordes detectados. El borde detectado suele contener muchos ruidos. Cuando se incluye demasiado ruido o se utiliza un espacio de parámetros grande, el proceso de cálculo consume mucho tiempo.

(2) Localización inexacta del límite exterior del iris. Como el operador Itg-Diff y el proceso de detección de bordes sólo dependen de la información del gradiente, son vulnerables a las pestañas, al punto de luz, a la montura de las gafas y a otros ruidos, lo que resulta en una localización incorrecta.

(3) Segmentación incorrecta de los párpados superior e inferior. Con la diversidad del equipo, el entorno y los individuos, los párpados en las imágenes capturadas difieren mucho. Esto conduce a una segmentación incorrecta de los párpados.

En los últimos años, se han propuesto muchos algoritmos basados en los dos algoritmos clásicos anteriores. Cui et al. extraen la información de baja frecuencia de la imagen del iris mediante la transformación wavelet. Utilizan el operador Itg-Diff para segmentar el iris. Sundaram et al. reducen el rango de búsqueda del iris y la pupila para reducir la complejidad; luego utilizan la transformada de Hough para la localización. Otros algoritmos como la ley de Hooke, el contorno activo y el análisis del histograma también obtienen resultados satisfactorios. Más métodos de segmentación del iris son estudiados por Jan.

De hecho, estos métodos de segmentación del iris propuestos dependen principalmente de la información del gradiente. Por tanto, el proceso de localización se ve fácilmente afectado por diferentes tipos de ruido, generando segmentaciones erróneas. Por otro lado, el ruido existente dificulta la estimación del rango de los parámetros de los límites. Esto hace que el proceso de búsqueda sea complejo.

Considerando que la información del gradiente se ve fácilmente afectada por los ruidos, tratamos de seleccionar características más robustas para representar el límite del iris.

SIFT (scale-invariant features transform) es un descriptor de características locales robusto e invariable en escala. Xiong y de la Torre propusieron localizar los puntos clave de la cara con SIFT y el algoritmo SDM (Supervised Descend Method). Inspirados en este trabajo, intentamos utilizar SIFT para extraer la característica local del límite del iris. El proceso de localización se resuelve mediante SDM.

La figura 1 muestra el diagrama de flujo del método de localización del iris propuesto. En primer lugar, la pupila se localiza a grandes rasgos mediante RST (Transformación de Simetría Radial) y el límite fino se determina mediante el operador Itg-Diff. A continuación, se extrae la característica SIFT de los puntos clave del límite exterior del iris y de los párpados (superior e inferior). A partir de estos puntos clave, el modelo de optimización desarrollado se resuelve mediante SDM. A continuación, se obtienen algunos puntos clave en el límite exterior del iris y en los párpados (superior e inferior). El límite final de los párpados y del iris se determina mediante IRLS (Iterative Reweighted Least-Square).

Figura 1

Gráfico de flujo del método de localización del iris propuesto.

La Figura 2 ilustra todo el procedimiento del algoritmo propuesto. La figura 3 muestra la comparación entre el resultado de localización ideal y el obtenido por el algoritmo propuesto.

Figura 2

Una ilustración del proceso de localización del iris. Las curvas azules son los círculos y parábolas de ajuste. Los puntos verdes son la forma inicial de la localización. Los puntos rojos son la forma final del procedimiento.

(a)

(b)

(a)

(b)

Figura 3

Segmentación del iris. (a) Localización ideal del iris y (b) resultado de la localización mediante el método propuesto.

El artículo se organiza como sigue: La sección 2 ilustra el modelo matemático del algoritmo de localización. La sección 3 presenta el método de localización del iris propuesto. La sección 4 muestra el resultado y el análisis experimental. La sección 5 concluye todo el artículo.

2.1. Modelo matemático de localización del iris

Sea una imagen del iris y sea un vector de las coordenadas de los píxeles de la imagen, . es el vector de los límites de destino, que se compone de las coordenadas de los puntos clave, . Entonces el proceso de localización es igual al cálculo de , que se ilustra en la Figura 4.

(a) Forma inicial del límite exterior del iris

(b) Forma inicial y final del límite exterior

(a) Forma inicial del límite exterior del iris

(b) Forma inicial y final del límite exterior

Figura 4

Ilustración del proceso de localización del iris: (a) forma inicial del límite del iris; (b) la posición relativa del límite inicial y localizado del iris.

Define como el vector de características de , que está compuesto por grupos de características en . Aquí, es una función de extracción de características, que proyecta los píxeles a su correspondiente descriptor de características.

Con esta definición, es el vector de características de . Entonces el proceso de localización es igual a la búsqueda del vector de características más similar a . Idealmente, cuando la diferencia entre los dos vectores de características y es pequeña, estaría cerca del vector de forma objetivo , que es la localización esperada.

Aquí usamos la distancia euclidiana para medir la similitud de dos vectores de características. Entonces el procedimiento de localización del iris es equivalente a minimizar la siguiente función objetivo:

Let , donde es el vector de coordenadas inicial, es el desplazamiento de a , y (1) puede reescribirse como

Cuando la función de extracción de características es no lineal, la minimización de (2) es un problema de programación no lineal. El vector de forma final se puede obtener resolviendo el siguiente problema de optimización:

Entonces el vector de forma de localización final es

2.2. SIFT Feature of Boundary

SIFT es un descriptor de características locales de imagen comúnmente utilizado . Es ampliamente utilizado en muchos problemas de visión por ordenador diferentes . En este trabajo, adoptamos una estrategia similar a , extraer vectores de características SIFT de los puntos clave en el límite del iris para la localización. La figura 5 ilustra la característica SIFT de diferentes puntos en el límite del iris. Esta figura indica que los cuatro puntos dados (etiquetados como 1-4) en el límite exterior del iris tienen características SIFT similares.

(a)

(b)

(a)

(b)

Figura 5

CaracterísticaSIFT de diferentes puntos. (a) posiciones de los puntos de borde seleccionados; (b) característica SIFT de los cuatro puntos seleccionados.

2.3. Algoritmo SDM

Sustituyendo el vector de características SIFT en el problema de optimización en (3), se obtiene un problema de programación no lineal. El Algoritmo SDM adopta el aprendizaje supervisado para obtener el vector de iteración óptimo desde el vector de forma actual hasta el objetivo. Es un algoritmo iterativo para resolver el problema de optimización.

Este algoritmo establece un modelo de regresión lineal entre el desplazamiento del vector de forma y la característica del vector de forma actual

Entonces el vector de forma actual y el vector de desplazamiento pueden ser calculados iterativamente, para obtener el vector de posición deseado: .

Para reducir la posibilidad de caer en un mínimo local, el SDM adopta varias iteraciones para obtener una serie de y donde es el número de iteraciones y es la coordenada del punto th del vector de forma en la th iteración.

3. Método propuesto

3.1. Determinación de la pupila

Cuando las imágenes del iris son tomadas por el equipo de infrarrojo cercano, hay una gran diferencia entre la pupila y el iris. En este caso, adoptamos una estrategia de localización de la pupila «de grueso a fino». En primer lugar, se obtiene una posición aproximada de la pupila mediante RST; a continuación, la localización precisa se obtiene mediante el operador Itg-Diff.

El operador Itg-Diff es propuesto por Daugman. La fórmula es la siguiente: donde es una función suave, es el operador de convolución, es la imagen, es el centro del límite circular, y es el radio.

El operador calcula la diferencia de gris anular a lo largo de la dirección radial en la imagen del iris y busca la diferencia máxima.

3.2. Aprendizaje SDM

En este trabajo, seleccionamos 32 puntos clave en el límite exterior del iris. La figura 6 ilustra las posiciones de estos puntos. Entre ellos, los párpados superior e inferior contienen 13 puntos por separado, y los arcos izquierdo y derecho del límite del iris tienen 4 puntos, respectivamente. La figura 6(a) es la imagen de entrenamiento con puntos marcados en los párpados superiores e inferiores, donde los puntos 1, 13, 14 y 26 son los puntos de intersección de los párpados y el borde exterior del iris, respectivamente; la figura 6(b) es la imagen de entrenamiento sin la intersección de los párpados inferiores y el iris, donde el punto más bajo del borde exterior del iris está marcado como los puntos 14 a 26; La figura 6(c) es la imagen de entrenamiento sin la intersección de los párpados superiores y el iris, donde el punto más alto en el borde exterior del iris está marcado como los puntos 1 a 13; la figura 6(d) muestra el vector de forma promedio de todas las muestras de entrenamiento. Las características SIFT de los puntos marcados se calculan para cada imagen de la base de datos y y , que se guardan como los parámetros aprendidos de la regresión lineal, se obtienen resolviendo (6).

(a)

(b)

(c)

(d)
(d)

(a)

(b)

(c)(d)
(d)

Figura 6

Ejemplos de puntos clave etiquetados. (a) Puntos clave etiquetados en el iris ocluido por los párpados superiores e inferiores. (b) Puntos clave etiquetados en el iris ocluido por el párpado superior. (c) Puntos clave etiquetados en el iris ocluido por el párpado inferior. (d) Forma media de todos los puntos clave etiquetados.

3.3. Localización de puntos clave

En el proceso de localización, el límite exterior del iris se inicializa basándose en los parámetros de localización de la pupila y la forma media. La figura 7 ilustra el proceso de cambio de forma después de diferentes pasos de iteración. La figura 7(a) muestra los puntos clave iniciales. Las figuras 7(b), 7(c) y 7(d), respectivamente, muestran las formas localizadas, que se obtienen después de una, dos y tres iteraciones.

(a)

(b)

(c)

(d)

(a)

(b)

(c)

(d)

Figura 7

Ilustración de los pasos de iteración. (a) Inicialización de los puntos clave. (b) Puntos clave después de una iteración. (c) Puntos clave después de dos iteraciones. (d) Puntos clave después de tres iteraciones.

La imagen del iris que utilizamos se reduce a la longitud del lado. El número de iteración.

3.4. Estimación de los límites

Con estos puntos clave obtenidos por SDM, se adopta el algoritmo IRLS para localizar el límite del iris y los párpados. Los límites exteriores del iris y de los párpados (arriba y abajo) se ajustan mediante círculos y parábolas por separado.

3.4.1. Linealización de la ecuación del círculo

Una ecuación estándar del círculo es donde y son las coordenadas horizontales y verticales del punto en el círculo y , , y son los parámetros. La ecuación circular se puede escribir como

Dejemos , , ; entonces la ecuación del círculo se puede escribir como

3.4.2. Linealización de la función parabólica

Una función parabólica estándar puede darse de la siguiente manera:

Entonces la función pasa a ser

Deja que , , ; entonces la función parabólica podría darse como

3.4.3. Cuando las funciones circular y parabólica se ilustran como (10) y (13), las funciones no lineales originales se convierten en lineales. Los parámetros de estas funciones pueden ser resueltos por métodos relacionados con los mínimos cuadrados. Aquí usamos IRLS para estimar estos parámetros desconocidos.

Supongamos que la desviación del punto th es , . Para que la regresión sea robusta, utilizamos la función bicuadrada como función de peso, que es ; es el ancho de banda. Entonces el siguiente problema de optimización se obtendría minimizando el error cuadrado ponderadodonde son las coordenadas de los puntos clave th obtenidos por SDM.

Aquí usamos IRLS para resolver (14). La función iterativa es

El proceso de resolución se realiza mediante una función incorporada en Matlab. La figura 8 ilustra los puntos clave y los límites finales localizados. Los puntos clave del límite exterior del iris y de los párpados superiores e inferiores se obtienen mediante SDM. Los límites continuos se calculan mediante IRLS.

Figura 8

Resultado de la segmentación.

4. Resultado y análisis experimental

El algoritmo propuesto fue probado en un dispositivo de adquisición de iris monocular TCI 311, que es fabricado por Techshino Technology Inc, Pekín. Se trata de una cámara de infrarrojo cercano con lente primario. La distancia de captura es de 8-10 cm. La resolución de la imagen del iris es de . Construimos una base de datos de iris que contiene 700 imágenes mediante este dispositivo.

El experimento se lleva a cabo en un ordenador con CPU Intel Core i5, 2 GB de RAM, y el sistema operativo es Windows 7 Professional de 32 bits. El algoritmo está codificado en Matlab 2014b y C++.

En nuestro experimento, las imágenes de entrenamiento y verificación se seleccionan aleatoriamente de la base de datos de imágenes para la validación cruzada. La proporción de imágenes de entrenamiento y de verificación es de 7 : 3.

La tasa de error y la tasa de fracaso de la precisión de la localización se definen de la siguiente manera: donde y denotan la posición de prueba y la posición verdadera del i-ésimo punto en la j-ésima imagen de muestra, respectivamente. representa la distancia euclidiana. y denotan la longitud y la anchura del rectángulo circunscrito mínimo de todos los puntos clave en la th imagen de muestra. De acuerdo con la definición, mide el error del punto de muestra y es la tasa de fallo de localización.

La tasa de error acumulada se define como sigue:

La tasa de fallos acumulada se define como sigue:

Aquí, y son los criterios de evaluación, y es una función indicadora:

La figura 9 muestra las curvas y. La figura 10 muestra el resultado de la localización mediante el método propuesto. La Tabla 1 ilustra la comparación del rendimiento de la localización de los límites del iris y los párpados mediante Itg-Diff y el algoritmo propuesto. La figura 11 compara los resultados obtenidos por el operador Itg-Diff y el método propuesto, donde la primera línea es el resultado del operador Itg-Diff y la segunda línea es el resultado del método propuesto. Estas comparaciones demuestran que el método propuesto tiene un rendimiento de localización más estable que el operador Itg-Diff en la imagen del iris con ruido, especialmente con grandes manchas de luz, marcos de gafas, etc.


Parte localizada	Itg-Diff	Algoritmo propuesto

Iris	99.2%	99,5%
Eyelids	99.6%	99,6%

Tabla 1

Precisión de segmentación de los diferentes métodos.

(a)

(b)

(a)

(b)

Figura 9

Curvas de error acumulado en el conjunto de pruebas. (a) Proporción de error a través de la raíz cuadrada acumulada. (b) Proporción de errores mediante la tasa de fallos acumulada.

Figura 10

Resultados de segmentación mediante el método propuesto.

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

Figura 11

Resultados de la segmentación por diferentes métodos (la primera y la segunda fila se obtienen por Itg-Diff y el método propuesto por separado).

Esto se debe a que el operador Itg-Diff se basa en la información del gradiente en la vecindad. Es sensible a la variación de la intensidad local. Cuando las imágenes del iris contienen manchas de luz, párpados, pestañas, monturas de gafas, etc., el operador Itg-Diff probablemente produzca segmentaciones erróneas.

Mientras que la característica SIFT se genera en un área local relativamente grande, es más robusta a la rotación de la imagen, a la variación del brillo, a la escala y al ruido que la información del gradiente. Esto mejora la robustez del algoritmo de localización.

La tabla 2 muestra el tiempo de ejecución del método propuesto y de los otros dos métodos. En nuestro experimento se tarda una media de 26,7 ms en localizar una imagen del iris, lo cual es mucho más eficiente que los algoritmos comparados.


Métodos	Itg-Diff	ED + Radon	Algoritmo propuesto

Tiempo	600 ms	153.7 ms	26,7 ms

Tabla 2

Tiempo de cálculo de los diferentes métodos.

5. Conclusiones

En este trabajo se propone un algoritmo eficiente de localización del iris basado en un modelo de optimización. En primer lugar, se utilizan los operadores RST e Itg-Diff para localizar la pupila; a continuación, los puntos clave del límite exterior del iris se representan mediante características SIFT y se localizan mediante SDM. Finalmente, los parámetros del límite exterior del iris se determinan mediante IRLS.

La principal contribución de este trabajo podría resumirse como sigue. Se desarrolla un modelo de optimización para la localización del iris. Se utiliza la característica SIFT para la representación de los límites del iris, que es más robusta que la información del gradiente. Se introduce el algoritmo SDM para resolver el problema de localización del iris, que puede generar los puntos clave del límite exterior del iris.

Los resultados experimentales indican que el método propuesto puede localizar el límite exterior del iris y los párpados superiores e inferiores de manera eficiente y robusta.

Conflictos de intereses

Los autores declaran no tener ningún conflicto de intereses.

Agradecimientos

Este trabajo cuenta con el apoyo de los Fondos Nacionales de Ciencias Naturales de China, nº 61703088, la Fundación de Investigación Científica de Doctorado de la Provincia de Liaoning, nº 20170520326, y «los Fondos de Investigación Fundamental para las Universidades Centrales», N160503003.