Abstract
A localização da íris é um dos processos mais importantes no reconhecimento da íris. Devido aos diferentes tipos de ruídos na imagem da íris, o resultado da localização pode estar errado. Além disso, o processo de localização é demorado. Para resolver estes problemas, este artigo desenvolve um algoritmo eficiente de localização da íris através de um modelo de otimização. Em primeiro lugar, o problema de localização é modelado por um modelo de otimização. Em seguida, o recurso SIFT é selecionado para representar as informações características do limite externo da íris e da pálpebra para localização. E o algoritmo SDM (Método de Descida Supervisionada) é empregado para resolver os pontos finais do limite externo e das pálpebras. Finalmente, o IRLS (Iterative Reweighted Least-Square) é utilizado para obter os parâmetros de limite externo e pálpebras superiores e inferiores. O resultado experimental indica que o algoritmo proposto é eficiente e eficaz.
1. Introdução
O reconhecimento do Iris é um dos mais confiáveis biométricos . É amplamente utilizado em diferentes tipos de aplicações.
Um sistema típico de reconhecimento da íris contém vários passos, que são a aquisição da imagem da íris, segmentação, extracção de características, correspondência e reconhecimento . Nestas etapas, a segmentação é o processo mais importante e básico. Esta etapa localiza principalmente quatro limites do íris, que são limites internos e externos do íris e pálpebras superiores e inferiores.
Na verdade, é difícil obter limites precisos e estáveis do íris sob diferentes condições, tais como brilho variável e não uniforme, oclusão de cílios e pálpebras, reflexos especulares e cobertura de óculos. Estes fatores indeterminados dificultam a segmentação do íris. A segmentação tornou-se um importante gargalo no sistema de reconhecimento do íris.
Os dois algoritmos de localização do íris mais conhecidos são o operador integrodifferencial (Itg-Diff) e a detecção de bordas combinada com a transformada Hough . Eles são amplamente aprovados por diferentes publicações. No entanto, estes dois métodos utilizam principalmente informação de gradiente, que são facilmente afectados por diferentes tipos de ruídos. Eles provavelmente não são eficientes e geram localização errada sob algumas condições.
(1) Complexidade de Computação. A eficiência do operador Itg-Diff é afetada principalmente pela gama de parâmetros de limite. Quando o espaço de busca do parâmetro é grande, o processo de localização tem uma grande complexidade de computação. A eficiência da transformada Hough é afetada principalmente pelo tamanho do espaço de parâmetros e pela contagem dos pixels de borda detectados. A borda detectada geralmente contém um monte de ruídos. Quando muito ruído é incluído ou é usado um grande espaço de parâmetros, o processo de computação é demorado.
(2) Localização imprecisa da fronteira externa da íris. Como o operador do Itg-Diff e o processo de detecção de bordas só dependem de informações de gradiente, elas são vulneráveis a cílios, manchas de luz, armação de óculos e outros ruídos, resultando em localização errada.
(3) Segmentação incorreta das Pálpebras Superior e Inferior. Com a diversidade do equipamento, ambiente e indivíduos, as pálpebras nas imagens capturadas são muito diferentes. Isso leva à segmentação incorreta das pálpebras.
Nos últimos anos, muitos algoritmos têm sido propostos com base nos dois algoritmos clássicos acima. Cui et al. extraem a informação de baixa frequência da imagem da íris por transformação de onda. Eles usam o operador Itg-Diff para segmentar a íris. Sundaram et al. reduzem a faixa de busca da íris e pupila para reduzir a complexidade; depois utilizam a transformada Hough para localização. Outros algoritmos como a Lei de Hooke, contorno ativo e análise de histogramas também obtêm resultados satisfatórios. Mais métodos de segmentação da íris são pesquisados por Jan .
Na verdade, estes métodos propostos de segmentação da íris dependem principalmente de informações de gradiente. Assim, o processo de localização é facilmente afetado por diferentes tipos de ruídos, gerando segmentações erradas. Por outro lado, o ruído existente torna difícil estimar a amplitude dos parâmetros de delimitação. Isto faz com que a complexidade de computação do processo de pesquisa.
Considerando que as informações de gradiente são facilmente afetadas pelos ruídos, tentamos selecionar características mais robustas para representar os limites da íris.
SIFT (scale-invariant features transform) é um descritor de características locais robusto e de escala variável. Xiong e de la Torre propuseram a localização de pontos-chave da face com o algoritmo SIFT e SDM (Método Descendente Supervisionado). Inspirado neste trabalho, tentamos usar SIFT para extrair a característica local da fronteira da íris. O processo de localização é resolvido pelo SDM .
Figure 1 mostra o fluxograma do método proposto de localização do íris. Primeiramente, a pupila é localizada grosseiramente por RST (Radial Symmetry Transform) e o limite fino é determinado pelo operador Itg-Diff. Em seguida, extraímos a característica SIFT dos pontos-chave do limite externo do íris e das pálpebras (superior e inferior). Com base nestes pontos chave, o modelo de otimização desenvolvido é resolvido pelo SDM. Depois disso, são obtidos alguns pontos chave no limite externo do íris e das pálpebras (superior e inferior). O limite final das pálpebras e da íris é determinado pelo IRLS (Iterative Reweighted Least-Square).
Figure 2 ilustra todo o procedimento do algoritmo proposto. A Figura 3 mostra a comparação entre o resultado ideal e obtido da localização pelo algoritmo proposto.
(a)
(b)
(a)
(b)
O papel está organizado da seguinte forma: A seção 2 ilustra o modelo matemático do algoritmo de localização. A seção 3 apresenta o método proposto de localização da íris. A seção 4 mostra o resultado experimental e a análise. A seção 5 conclui o trabalho inteiro.
2.1. Modelo matemático de localização do íris
Seja uma imagem do íris e seja um vetor das coordenadas dos pixels da imagem, . é o vetor dos limites de destino, que é composto de coordenadas de pontos-chave, . Então o processo de localização é igual ao cálculo , que é ilustrado na Figura 4.
(a) Forma inicial do limite externo da íris
(b) Forma inicial e final do limite externo
(a) Forma inicial do limite exterior da íris
(b) Forma inicial e final do limite exterior
Definir como vector de características do , que é composto por grupos de características em . Aqui, está uma função de extração de característica, que projeta pixels para o descritor de característica correspondente.
Com esta definição, é o vetor de característica de . Então o processo de localização é igual à busca do vetor de característica mais similar a . Idealmente, quando a diferença entre os dois vetores de característica e é pequena, seria próxima ao vetor de forma de alvo , que é a localização esperada.
Aqui usamos a distância euclidiana para medir a similaridade de dois vetores de característica. Então o procedimento de localização da íris é equivalente a minimizar a seguinte função objetiva:
Let , onde está o vetor de coordenadas inicial, é o deslocamento de para , e (1) pode ser reescrito como
Quando a função de extração de característica é não-linear, a minimização de (2) é um problema de programação não-linear. O vector de forma final pode ser obtido resolvendo o seguinte problema de optimização:
Então o vector de forma final de localização é
2.2. SIFT Feature of Boundary
SIFT é um descritor de característica local de imagem comumente usado. É amplamente utilizado em muitos problemas diferentes de visão no computador . Neste artigo, adotamos uma estratégia similar a , extrair vetores de características SIFT dos pontos-chave na fronteira da íris para localização. A Figura 5 ilustra a característica SIFT de diferentes pontos na fronteira da íris. Esta figura indica que os quatro pontos dados (rotulados como 1-4) no limite externo do íris possuem características SIFT similares.
(a)
(b)
(a)
(b)
2.3. Algoritmo SDM
Ao substituir o vetor da característica SIFT no problema de otimização em (3), um problema de programação não linear é obtido. O Algoritmo SDM adopta uma aprendizagem supervisionada para obter o vector de iteração óptima do vector de forma actual para o alvo. É um algoritmo iterativo para resolver o problema de otimização.
Este algoritmo estabelece um modelo de regressão linear entre o deslocamento do vetor de forma e a característica do vetor de forma corrente
Então o vetor de forma corrente e o vetor de deslocamento podem ser calculados iterativamente, para obter o vetor de posição desejado: .
A fim de reduzir a possibilidade de queda num mínimo local, SDM adopta várias iterações para obter uma série de e onde está o número de iterações e é a coordenada do ponto do vector de forma na iteração.
3. Método proposto
3.1. Determinação da pupila
Quando as imagens da íris são tomadas pelo equipamento quase infravermelho, há uma grande diferença entre pupila e íris. Aqui, adotamos uma estratégia de localização de pupila “grosseira a fina”. Primeiro, uma posição aproximada da pupila é obtida pelo RST; depois a localização precisa é obtida pelo operador Itg-Diff.
Itg-Diff operador é proposto por Daugman. A fórmula é dada da seguinte forma: onde é uma função suave, é o operador de convolução, é a imagem, é o centro do limite circular, e é o raio.
O operador calcula a diferença de cinza anular ao longo da direção radial na imagem do íris e procura a diferença máxima.
3.2. SDM Learning
Neste trabalho, selecionamos 32 pontos-chave no limite externo do íris. A figura 6 ilustra as posições destes pontos. Entre eles, as pálpebras superiores e inferiores contêm 13 pontos separadamente, e os arcos esquerdo e direito do limite do íris têm 4 pontos, respectivamente. Figura 6(a) é a imagem de treinamento com pontos marcados em ambas pálpebras superiores e inferiores, onde os pontos 1º, 13º, 14º e 26º são os pontos de intersecção das pálpebras e borda externa do íris, respectivamente; Figura 6(b) é a imagem de treinamento sem intersecção das pálpebras inferiores e do íris, onde o ponto mais baixo da borda externa do íris é marcado como os pontos 14º a 26º; Figura 6(c) é a imagem de treinamento sem interseção das pálpebras superiores e do íris, onde o ponto mais alto na borda externa do íris é marcado como os pontos 1° a 13°; Figura 6(d) mostra o vetor de forma médio de todas as amostras de treinamento. As características SIFT dos pontos marcados são calculadas para cada imagem na base de dados e , que são salvas como parâmetros aprendidos da regressão linear, são obtidas através da resolução (6).
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
3.3. Pontos Chave Localização
No processo de localização, o limite externo do íris é inicializado com base nos parâmetros de localização da pupila e a forma média. A figura 7 ilustra o processo de mudança de forma após diferentes etapas de iteração. A Figura 7(a) demonstra os pontos chave iniciais. As figuras 7(b), 7(c), e 7(d), respectivamente, mostram as formas localizadas, que são obtidas após uma, duas e três iterações.
(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d)
A imagem da íris que utilizamos é reduzida para o comprimento lateral. O número de iteração .
3.4. Estimating Boundaries
Com estes pontos-chave obtidos por SDM, o algoritmo IRLS é adotado para localizar o limite da íris e pálpebras. O limite externo do íris e pálpebras (para cima e para baixo) são ajustados por círculo e parábolas separadamente.
3.4.1. Linearização da equação do círculo
Uma equação padrão do círculo é onde e são as coordenadas horizontais e verticais do ponto sobre o círculo e , , e são os parâmetros. A equação circular pode ser escrita como
Let , , ; depois a equação do círculo pode ser escrita como
3.4.2. Linearização da função parabólica
Uma função parabólica padrão pode ser dada como se segue:
Então a função passa a ser
Let , , ; depois a função parabólica pode ser dada como
3.4.3. Estimando Parâmetro por IRLS
Quando as funções circular e parabólica são ilustradas como (10) e (13), as funções não lineares originais são tornadas lineares. Os parâmetros destas funções podem ser resolvidos por métodos menos parecidos com o quadrado. Aqui nós usamos IRLS para estimar estes parâmetros desconhecidos.
Sumir que o desvio do ponto é , . Para tornar a regressão robusta, usamos a função bi-quadrado como a função peso, que é ; é a largura de banda. Então o seguinte problema de otimização seria obtido pela minimização do erro quadrado ponderado onde estão as coordenadas dos pontos chaves obtidas por SDM.
Aqui usamos IRLS para resolver (14). A função iterativa é
O processo de resolução é realizado por uma função incorporada Matlab. A Figura 8 ilustra os pontos chave e os limites finais localizados. Os pontos chave no limite do íris externo e as pálpebras superior e inferior são obtidos por SDM. Os limites contínuos são calculados por IRLS.
4. Resultado Experimental e Análise
O algoritmo proposto foi testado em um dispositivo de aquisição de íris monocular TCI 311, que é fabricado pela Techshino Technology Inc., Pequim. Trata-se de uma câmara de infravermelhos próximos com lente prime. A distância de captação é de 8-10 cm. A resolução da imagem da íris é . Construímos uma base de dados da íris contendo 700 imagens por este dispositivo.
A experiência é realizada num computador com CPU Intel Core i5, 2 GB de RAM, e o sistema operativo é Windows 7 Professional 32-bit. O algoritmo é codificado em Matlab 2014b e C++.
No nosso experimento, as imagens de treinamento e verificação são selecionadas aleatoriamente da base de dados de imagens para validação cruzada. A proporção de imagens de treinamento e verificação é 7 : 3.
A taxa de erro e a taxa de falha da precisão de localização são definidas da seguinte forma: onde e denotam a posição de teste e a posição verdadeira do ponto i na imagem da amostra j, respectivamente. representa a distância euclidiana. e denotam o comprimento e largura do retângulo circunscrito mínimo de todos os pontos-chave na imagem da amostra. De acordo com a definição, mede o erro do ponto de amostra e é a taxa de falha da localização.
A taxa de erro acumulada é definida da seguinte forma:
A taxa de erro acumulada é definida da seguinte forma:
Aqui, e são os critérios de avaliação, e é uma função indicadora:
Figure 9 shows e curvas. A Figura 10 mostra o resultado da localização pelo método proposto. A Tabela 1 ilustra a comparação do desempenho da localização dos limites da íris e das pálpebras por Itg-Diff e algoritmo proposto. A Figura 11 compara os resultados obtidos pelo operador de Itg-Diff e o método proposto, onde a primeira linha é o resultado do operador de Itg-Diff e a segunda linha é o resultado do método proposto. Estas comparações demonstram que o método proposto tem um desempenho de localização mais estável que o operador de Itg-Diff em imagens de íris ruidosas, especialmente com grandes manchas de luz, armações de óculos, etc.
|
(a)
(b)
(a)
(b)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
É porque o operador Itg-Diff confia na informação de gradiente da vizinhança. Ele é sensível à variação de intensidade local. Quando as imagens da íris contêm mancha de luz, pálpebra, pestana, moldura de óculos, etc., o operador Itg-Diff provavelmente produz segmentações erradas.
Embora o recurso SIFT seja gerado em uma área local relativamente grande, ele é mais robusto à rotação da imagem, variação de brilho, escala de escala e ruído do que as informações de gradiente. Isto melhora a robustez do algoritmo de localização.
Tabela 2 mostra o tempo de execução do método proposto e os outros dois métodos. É necessária uma média de 26,7 ms para localizar uma imagem da íris em nosso experimento, o que é muito mais eficiente do que os algoritmos comparados.
|
5. Conclusões
Neste trabalho, um algoritmo eficiente de localização da íris baseado no modelo de otimização é proposto. Primeiro, o operador RST e Itg-Diff são usados para localizar a pupila; depois os pontos chave no limite externo do íris são representados por características SIFT e localizados por SDM. Finalmente, os parâmetros do limite externo do íris são determinados por IRLS.
A principal contribuição deste trabalho pode ser resumida como se segue. Um modelo de otimização é desenvolvido para a localização da íris. O recurso SIFT é utilizado para a representação dos limites da íris, que é mais robusto que as informações de gradiente. O algoritmo SDM é introduzido para resolver o problema de localização da íris, que pode gerar os pontos-chave do limite externo da íris.
Resultados experimentais indicam que o método proposto pode localizar o limite externo da íris e as pálpebras superior e inferior de forma eficiente e robusta.
Conflitos de interesse
Os autores declaram que não têm conflitos de interesse.
Conhecimentos
Este trabalho é apoiado pelos Fundos Nacionais de Ciências Naturais da China, nº 61703088, pela Fundação de Pesquisa Científica Doutoral da Província de Liaoning, nº 20170520326, e pelos “Fundos de Pesquisa Fundamental para as Universidades Centrais”, N160503003.