deteccion automatica de cáncer mediante mamografias digitales

download deteccion automatica de cáncer mediante mamografias digitales

of 74

description

deteccion automatica de cáncer mediante mamografias digitalestratamiento digital de imágenesreconocimiento de patrones

Transcript of deteccion automatica de cáncer mediante mamografias digitales

  • INSTITUTO POLITECNICO NACIONAL

    Centro de Innovacion y Desarrollo Tecnologico en Computo

    Deteccion Automatica de Anomalas Presentes en Mamografas Digitales

    TESIS

    Que para obtener el grado deMAESTRIA EN TECNOLOGIA DE COMPUTO

    PresentaFernando Carlos Martnez Rodrguez

    Directores:

    Dr. Rolando Flores CarapiaDr. Benjamn Luna Benoso

    Mexico, D. F. Junio del 2013

  • iResumen

    La mamografa digital es la tecnica mas usada por los radilogos para detectar cncer de mama. Por mediode las mamografas digitales se pueden usar algoritmos computacionales para detectar cancer. En estetrabajo se muestran una serie de pasos para detectar el cancer de mama. Estos pasos son: tratamientodigital de imagenes, segmentacion, extraccion de caracteristicas y clasificacion. Con estos pasos se puedeobtener una respuesta a una mamografia digital, en donde, la respuesta sera si la mamografa contienecancer.Los algoritmos propuestos en este trabajo fueron probados con la base de datos MINI-MIAS. La cualcontiene imagenes de mamografas y con las cuales son usadas en otros trabajos realizados.

  • ii

    Abstract

  • iii

    Indice general

    Resumen I

    Abstract II

    Indice de Algoritmos V

    Indice de figuras VII

    1. Introduccion 11.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    1.1.1. Cancer de mama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2. Mamografa Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1.3. Clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2.2. Objetivos especficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    1.3. Justificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.5. Organizacion del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2. Estado del Arte 52.1. Metodos Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.1.1. Segmentacion de la region de la mama usando contornos activos . . . . . . . . . 62.1.2. Tecnica para preprocesamiento de mamografas digitales . . . . . . . . . . . . . . 62.1.3. Sistema asistido por computadora para la deteccion de cancer de mama . . . . . 82.1.4. identificacion del musculo pectoral en mamografas . . . . . . . . . . . . . . . . . 92.1.5. Evaluacion automatica de la densidad del tejido mamario en las mamografas

    digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.1.6. Segmentacion de mama con supresion de musculo Pectoral . . . . . . . . . . . . 102.1.7. Deteccion temprana de cancer de mama utilizando SVM como clasificador . . . . 11

    2.2. Bases de Datos de Mamografias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2.1. MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    3. Marco Teorico 143.1. Segmentacion de imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    3.1.1. Umbralizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.1.2. Region Creciente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    3.2. Extraccion de caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

  • INDICE GENERAL iv

    3.2.1. Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2.2. Desviacion Estandar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2.3. Suavidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2.4. Asimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2.5. Uniformidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.2.6. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.2.7. Histograma Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    3.3. Memorias Asosiativas Alfa Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.3.1. Operaciones Binarias y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    4. Modelo Propuesto 204.1. Segmentacion de mamografas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    4.1.1. Imagen Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.1.2. Segmentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    4.2. Extraccion de caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.2.1. Maximo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274.2.2. Mnimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274.2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.4. Desviacion Estandar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.5. Asimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.6. Uniformidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.7. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.8. Histograma Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.2.9. Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    4.3. Clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.3.1. Manejo de las caractersticas adquiridas . . . . . . . . . . . . . . . . . . . . . . . 414.3.2. fase de recuperacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    5. Resultados 505.1. Segmentacion de las mamografas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505.2. Extraccion de caracteristicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.3. Clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525.4. Conclusiones y Trabajo a furturo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    6. Conclusiones y Trabajos a futuro 636.0.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 636.0.2. trabajos a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

  • vIndice de cuadros

    4.1. Algoritmo 1 Funcion para leer imagen y guardar en matriz . . . . . . . . . . . . . . . 224.2. Algoritmo 2 Funcion para obtener el Histograma de una imagen . . . . . . . . . . . . 224.3. Algoritmo 3 Funcion para obtener la varianza . . . . . . . . . . . . . . . . . . . . . . . 234.4. Algoritmo 4 Funcion para localizar el musculo Pectoral . . . . . . . . . . . . . . . . . 254.5. Algoritmo 5 Funcion para Quitar Ruido . . . . . . . . . . . . . . . . . . . . . . . . . . 264.6. Algoritmo 6 Funcion para Calibrar el Histograma . . . . . . . . . . . . . . . . . . . . . 274.7. Algoritmo 7 Funcion para Filtrar y Recortar la imagen . . . . . . . . . . . . . . . . . . 284.8. Algoritmo 8 Funcion para Filtrar el musculo Pectoral . . . . . . . . . . . . . . . . . . 284.9. Algoritmo 9 Funcion para Quitar Pectoral . . . . . . . . . . . . . . . . . . . . . . . . . 294.10. Algoritmo 10 Funcion para obtener el Maximo, el Mnimo y la Moda . . . . . . . . . . 314.11. Algoritmo 11 Funcion para obtener la mediana,varianza,energa y la entropa . . . . . 324.12. Algoritmo 12 Funcion para obtener el nmero de pixeles . . . . . . . . . . . . . . . . . 324.13. Algoritmo 13 Funcion para obtener la sumatoria de valores del Histograma . . . . . . 334.14. Algoritmo 14 Funcion para obtener la media . . . . . . . . . . . . . . . . . . . . . . . 334.15. Algoritmo 15 Funcion para obtener la varianza . . . . . . . . . . . . . . . . . . . . . . 334.16. Algoritmo 16 Funcion para obtener la desviacion estandar . . . . . . . . . . . . . . . . 344.17. Algoritmo 17 Funcion para obtener la suavidad de la imagen . . . . . . . . . . . . . . 344.18. Algoritmo 18 Funcion para obtener la asimetra . . . . . . . . . . . . . . . . . . . . . . 414.19. Algoritmo 19 Funcion para obtener la uniformidad . . . . . . . . . . . . . . . . . . . . 424.20. Algoritmo 20 Funcion para obtener la curtosis . . . . . . . . . . . . . . . . . . . . . . 424.21. Algoritmo 21 Funcion para obtener el Histograma promedio . . . . . . . . . . . . . . . 424.22. Algoritmo 22 Funcion para obtener la probabilidad de constraste . . . . . . . . . . . . 434.23. Algoritmo 23 Funcion para obtener la asimetra por pixel . . . . . . . . . . . . . . . . 434.24. Algoritmo 24 Funcion para normalizar caractersticas . . . . . . . . . . . . . . . . . . 464.25. Algoritmo 24 Funcion para la operacion alfa de memorias asociativas . . . . . . . . 474.26. Algoritmo 25 Funcion para la operacion de recuperacion Alfa min (min ) memorias

    asociativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.27. Algoritmo 25 Funcion para recuperacion de la clase . . . . . . . . . . . . . . . . . . . 49

    5.1. Resultados de clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

  • vi

    Indice de figuras

    1.1. Etapas de un clasificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2. Diagrama de funcionamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    2.1. Mini-MIAS image 0381: (a) Mamografa Original, (b) Bordes, (c) Extraccion de la mama,(d) Contornos activos version de a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.2. Error obtenido con contornos activos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.3. Resultado de la supresion del musculo pectoral. . . . . . . . . . . . . . . . . . . . . . . . 72.4. Diagrama del metodo seguido en el trabajo. . . . . . . . . . . . . . . . . . . . . . . . . . 82.5. Resultados obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.6. Metodo utilizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.7. Resultado deteccion del musculo Pectoral. . . . . . . . . . . . . . . . . . . . . . . . . . . 102.8. Caracteristcas tomadas de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.9. Metodo de extraccion del musculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.10. Metodo de clasificacion por SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.11. Muestras base de datos MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    3.1. (a) Histograma (b)Imagen umbralizada . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2. (a) Clasificacion de la imagen (b)Region creciente . . . . . . . . . . . . . . . . . . . . . . 153.3. Asimetra Negativa y Positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    4.1. Etapas del sistema para el modelo propuesto . . . . . . . . . . . . . . . . . . . . . . . . 204.2. Imagen Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.3. Diagrama de segmentacion de la region mamaria . . . . . . . . . . . . . . . . . . . . . . 354.4. Imagen de una mamografa digital y su histograma . . . . . . . . . . . . . . . . . . . . . 364.5. Estimacion del musculo pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.6. Estimacion del musculo pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.7. Valores filtrados en el histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.8. Imagen binarizada usando el histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.9. localizacion del musculo pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.10. Imagen binarizada usando el histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.11. Extraccion de caractersticas de una imagen . . . . . . . . . . . . . . . . . . . . . . . . . 404.12. Asimetra Negativa y Positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    5.1. Lectura de la mamografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2. Calculo del Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525.3. Localizacion del musculo Pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.4. Obtencion de la Semilla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

  • INDICE DE FIGURAS vii

    5.5. Recortado de la region Pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555.6. Binarizado y Filtrado de la maografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.7. Escaneo y Segmentacion del musculo Pectoral . . . . . . . . . . . . . . . . . . . . . . . . 615.8. Supresion del musculo Pectoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

  • 1Captulo 1

    Introduccion

    1.1. Antecedentes

    El cancer de mama es una grave amenaza de salud publica en Latinoamerica, como a nivel mundial, esla primer causa de mortalidad por cancer en la mujer adulta y la segunda en mujeres de 30 a 54 anos [?].

    El problema esta en que la mayora de los casos se autodetecta y solo el 10 % de los casos se iden-tifica en etapa I. Pero este no es el problema principal ya que se espera que anualmente incremente elnumero de casos [1].

    Es importante que el cancer de mama se diagnostique en etapa temprana ya que los tumores en estaetapa tienen mas posibilidades de curacion que los que se diagnostican en etapas avanzadas [2, 3].

    Existen tres metodos para la deteccion de cancer de mama: la mamografa, el examen clnico y elautoexamen. Sin embargo la mamografa es la herramienta de diagnostico mas utilizada en los pro-gramas de diagnostico, esto es, por que detecta lesiones no palpables en la mama y es un metodo dedeteccion para reducir la mortalidad de cancer de mama [3, 4].

    El avance tecnologico de la medicina ha evolucionado con la ayuda de las imagenes medicas digita-les, las cuales son tratadas por medios de computo con lo cual se puede mejorar la calidad y obtenerregiones de interes, un caso particular de este tipo de imagenes son las mamografas digitales [5].

    En particular, los algoritmos para extraccion de informacion a partir de imagenes son conocidos co-mo algoritmos de segmentacion de imagenes, y juegan un papel importante en numerosas aplicacionesbiomedicas para obtener las regiones de interes [6].

    La segmentacion automatica del musculo pectoral es importante al momento de analizar la mamo-grafa, ya que este musculo y el tejido glandular pueden tener caractersticas similares a la mama, por lotanto, el musculo pectoral puede inferir con deteccion automatica de cancer por lo cual se recomiendasuprimirlo previamente [7, 8].

    1.1.1. Cancer de mama

    El cancer es una enfermedad que ocurre cuando las celulas de alguna parte del organismo comienzana crecer sin control, desplazando a las celulas normales. Cuando algunas celulas cancergenas se des-

  • 1.1. Antecedentes 2

    prenden de un tumor, pueden establecerse en otra parte del cuerpo viajando a traves de la sangre o delsistema linfatico.

    En cuanto al cancer de mama, es un tumor o bulto maligno (canceroso) que se origina a partir delas celulas del seno. Este cancer es una de las principales causas de mortalidad en nuestro pas. El usode la mastografa como metodo de tamizaje ha disminuido la mortalidad por cancer de mama, siendoel estudio de eleccion [9].

    1.1.2. Mamografa Digital

    En la mamografa convencional se hace uso de pelculas que graban los fotones de radiacion que pasana traves de la mama, con el problema de que si la pantalla no tiene actividad se van percibiendoborrosidad, ademas de que en este tipo de mamografa no se logran percibir los primeros fotones quepasan, ademas de que tienen el problema de borrosidad resultante de la luz.En la mamografa digital el equipo tiene la capacidad de percibir los primeros fotones que pasan permi-tiendo con esto tener mucho mas informacion de la mama [10]. Los sistemas digitales para mamografaestan basados en detectores que, por un lado, producen una imagen no continua sino constituida porpequenos elementos separados (pxeles).

    La mamografa digital al ser tomada por pixeles puede ser manejable por un ordenador, ademas deque se puede hacer un seguimiento de los pacientes a traves de las imagenes obtenidas, las cuales sepueden procesar y obtener una mayor calidad para hacer un diagnostico [11].

    1.1.3. Clasificacion

    La tarea de clasificacion de patrones consiste en construir un mapa de relaciones entre el espacio decaractersticas y el conjunto de las clases, de modo de poder reconocer a que clase corresponde cualquierpatron de entrada representado por un vector de caractersticas, las cuales se deben de escoger de talmanera que solo se usen las nos den informacion relevante para el objeto a clasificar. En la figura 1.1 semuestran las etapas de un clasificador, donde como primer paso se tiene como entrada las caractersticasdel objeto a clasificar, como siguiente paso los objetos clasificados que funcionaran como conjunto deaprendizaje del sistema y como paso final el resultado, que es la etiqueta que nos dice a que conjuntopertenece el objeto clasificado.

    Figura 1.1: Etapas de un clasificador

  • 1.2. Objetivos 3

    1.2. Objetivos

    1.2.1. Objetivo general

    Desarrollo de un sistema de software para la segmentacion y clasificacion de mamografas digitales, pormedio de filtros y clasificadores para la deteccion de cancer de mama. En la figura 1.2 se muestra eldiagrama de funcionamiento del sistema.

    Figura 1.2: Diagrama de funcionamiento

    1.2.2. Objetivos especficos

    1. Procesamiento de las mamografas digitales para la obtencion de mayor calidad para el procesode segmentacion.

    2. Segmentacion de las mamografas digitales por medio de filtros como: por medio del histograma,para obtener solo regiones de interes dentro de la imagen.

    3. Extraer caractersticas de la mama segmentada para posteriormente ser procesadas por el clasifi-cador.

    4. Clasificacion de las caractersticas por medio de la base de datos MiniMIAS, de la cual se obtendranlas mamografas que nos serviran como base de conocimiento del sistema.

    5. Mostrar los resultados de la clasificacion; los resultados que se obtendran seran: si la mama contienecancer, el tipo de cancer (benigno, maligno) en caso de que exista.

    1.3. Justificacion

    El cancer de mama es un problema de salud a nivel mundial, as como tambien es el tipo de cancermas frecuente. Este se da por el crecimiento anormal de las celulas las cuales se dividen rapidamentesin morir y duplicarse muchas veces, cuando esto ocurre, suele iniciar un crecimiento rapido que generala formacion de un tumor.

    Es importante la deteccion a tiempo del cancer de mama, ya que cuando ocurre esto puede ser tratadoy en muchos casos se elimina de forma eficaz el tumor. Al contrario que pasa cuando no se detecta atiempo y se suele asociar con resultados negativos.

  • 1.4. Contribuciones 4

    En la actualidad, el cancer de mama es un problema donde solo el 10 % de los casos son detecta-dos en etapa temprana, dando un panorama poco alentador. Tambien se sabe que el metodo que mejordetecta anomalas en la mama son las mamografas en las cuales los radiologos al analizarlas puedendar un panorama del estado de las mamas. Sin embargo, existen casos en los cuales los tejidos son muydensos y pueden esconder los tumores a la vista, por ello con el uso del reconocimiento de patrones ydel tratamiento digital de imagenes se puede ayudar a mejorar la imagen.

    Por este motivo se desarrollara un sistema de software el cual detectara anomalas presentes en ma-mografas, lo cual apoyara a los radiologos a tomar una decision acerca del diagnostico obtenido de lasmamografas. Con lo que se pretende que mas casos de cancer de mama sean diagnosticados en etapatemprana y con esto se puedan efectuar mas tratamientos, dando resultados positivos.

    1.4. Contribuciones

    Procesamiento de las mamografas digitales para la obtencion de mayor calidad para el procesode segmentacion.

    Segmentacion de las mamografas digitales por medio de filtros como: por medio del histogramay de semillas, para obtener solo regiones de interes dentro de la imagen.

    Extraccion de caractersticas de la mama segmentada para posteriormente ser procesadas por unclasificador.

    Clasificacion de las caractersticas por medio de la base de datos MiniMIAS, de la cual se obtendranlas mamografas que nos serviran como base de conocimiento del sistema.

    Mostrar los resultados de la clasificacion; los resultados que se obtendran seran: si la mama contienecancer, el tipo de cancer (benigno, maligno) en caso de que exista y puede dar un prediagnosticoen el caso de encontrar una mama densa.

    1.5. Organizacion del documento

    Este primer captulo de Introduccion esta constituido por el contexto, el objetivo del trabajo de tesis, lajustificacion y las contribuciones. El resto del documento de tesis esta organizado de la siguiente manera:

    El captulo 2 Presenta el Estado de Arte en el cual se exponen otros trabajos realizados que tienenuna finalidad similar, la de autenticar personas mediante alguna caracterstica intrnseca y/o unica. Seanalizaran en especfico los trabajos que utilicen el ojo humano como parametro de autenticacion.

    El captulo 3 Se define el marco teorico, el punto de partida de nuestro algoritmo, metodos de segmen-tacion de imagenes, de extraccion de aracteristicas y el clasificador en este caso Memorias asociativas.

    El captulo 4 Abarca la solucion propuesta, los metodos utilizados para darle solucion al problema

    El captulo 5 Contiene los resultados

    El captulo 6 Conclusiones y trabajos futuros

  • 5Captulo 2

    Estado del Arte

    El cancer de mama es una enfermedad que afecta principalmente a las mujeres en todo el mundo, estaenfermedad cada da va tomando mas terreno, ya que el ndice ha estado creciendo significativamente,por ello se ha convertido en objeto de estudio de muchos investigadores. Actualmente con el uso de lasmamografas digitales, los investigadores se han dedicado a desarrollar algoritmos computacionales paraapoyar a los especialistas a determinar de forma mas optima si un paciente padece cncer, dentro de losobjetos de estudio se han enfocado a las siguientes investigaciones:

    Deteccion de musculo pectoral

    Segmentacion de regiones de la mamografa

    Mejora de la mamografa

    Deteccion de tumores

    Deteccion de cancer

    Como se observa existen diferentes objetos de estudio dentro de las mamografas digitales, las cualesayudan a los especialistas a dar una segunda opinion en su trabajo.

    Dentro de estos metodos la deteccion y clasificacion se han abordado de diferentes maneras, la extrac-cion de caractersticas y la toma de desicion se han abordado por diferentes metodos, que involucrandiferentes logicas, metodos experimentales y computacionales, con el fn de acercarse a una respuestamas exacta, mas eficiente y con el proposito de ayudar a la investigacion y servir de apoyo a los espe-cialistas.

    El Estado del Arte se compone por las siguientes secciones:

    1. Metodos experimentales en donde se presentan diferentes trabajos que se han realizado tanto paraextraccion de caracteristicas, la deteccion de anomalas y la identificacion de cancer dentro de lasmamografas digitales.

    2. Base de Datos de mamografas digitales que se utiliza para la investigacion y pruebas con metodosexperimentales, en contraste con otros trabajos que utilizan la misma base de datos.

  • 2.1. Metodos Experimentales 6

    2.1. Metodos Experimentales

    2.1.1. Segmentacion de la region de la mama usando contornos activos

    La segmentacion de la region de la mama usando contornos activos [12] propuesto por Michael A. Wirth,et al. considera la imagen como dos niveles de umbrales para caracterizar la mama, posteriormente sele aplico un filtro reductor de ruido, para eliminar partes inservibles de la mamografa y finalmente sele aplico el metodo de contornos activos para localizar los bordes de la mama.En la figura 2.1 se muestra el procedimiento seguido y los resultados obtenidos por el metodo.

    Figura 2.1: Mini-MIAS image 0381: (a) Mamografa Original, (b) Bordes, (c) Extraccion de la mama,(d) Contornos activos version de a

    El metodo propuesto fue probado en 25 imagenes de las cuales en la figura 2.2 se muestra el errorobtenido.

    2.1.2. Tecnica para preprocesamiento de mamografas digitales

    En este trabajo Indra Kanta Maitra, et al. proponen un metodo [?] que encuentra las regiones de interesde las mamografas dogitales, en este caso suprime el musculo pectoral.

    En este metodo se mejoro la imagen por lo cual se definio un umbral con el que se filtra la imageny posteriormente se encontro la region del pectoral de la cual se calculo una diagonal que separa elpectoral de la mama. Para finalmente suprimir la parte del pectoral.

    Con este metodo se obtuvo el 85 % de resultados correctos, sin embargo en imagenes donde el musculopectoral tiene casi la misma densidad de la mama, los resultados no son favorables. En la figura 2.3 sepude ver el resultado de segmentacion con este metodo .

  • 2.1. Metodos Experimentales 7

    Figura 2.2: Error obtenido con contornos activos

    Figura 2.3: Resultado de la supresion del musculo pectoral.

  • 2.1. Metodos Experimentales 8

    En conclusion este metodo da buenos resultados a la hora de segmentar el musculo, sin embargo se ledeben de aplicar modificaciones para que funcione con todas las imagenes.

    2.1.3. Sistema asistido por computadora para la deteccion de cancer de mama

    El metodo propuesto por H.S. Sheshadri [1] emplea un umbral simple la region de interes y el usode filtros para la identificacion clara de microcalcificaciones. este metodo sugerido para la deteccion ysegmentacion de microcalcificaciones en una imagen de mamografAa fue probado en varias imagenes dela base de datos mini-MIAS. El algoritmo fue implementado utilizando programacion en Matlab.

    Como resultados obtubieron una tasa de deteccion de microcalcificaciones del 78 % los cuales fueronanalizados por un radiologo experto.

    La imagen 2.4 muestra el procedimiento seguido para la deteccion de microcalcificaciones. En la imagen

    Figura 2.4: Diagrama del metodo seguido en el trabajo.

    2.5 se observan los resultados obtenidos en las etapas de este metodo.

    Figura 2.5: Resultados obtenidos.

  • 2.1. Metodos Experimentales 9

    2.1.4. identificacion del musculo pectoral en mamografas

    En este trabajo [2] realizado por K. Santle Camilus se muestra un procedimiento para eliminar elmusculo pectoral a partir de la transformada de watershed, con la cual fueron capaces de encontrar laregion de la mama ademas de la linea divisora entre el pectoral y la mama. En este trabajo se utilizaronun total de 84 mamografas. La media de falsos positivos y falsos obtenidos mediante la comparacionde los resultados fueron 0,85 % y 4,88 % respectivamente. Usando distancia Hausdorff se observo que lamedia y la desviacion estandar es de 2,82 a 4,95 mm.

    Este trabajo propone un enfoque el cual detecta el musculo pectoral, lo cual es de gran utilidad yaque debemos de enfocarnos en la region mamaria, ya que el musculo pectoral en un analisis computacio-nal podra causar ruido y con este enfoque podemos determinar y elimiar de la mamografa esta regionque no es de interes para la determinacion de cancer en la region mamaria.

    En la figura 2.6 se muestra muestra el diagrama de los pasos seguidos en este metodo.

    Figura 2.6: Metodo utilizado.

    En la figura 2.7 se muestra muestra el resultado de la identificacion del musculo pectoral mediante

  • 2.1. Metodos Experimentales 10

    este metodo.

    Figura 2.7: Resultado deteccion del musculo Pectoral.

    2.1.5. Evaluacion automatica de la densidad del tejido mamario en las mamografasdigitales

    T.S. Subashini, et al. proponen un algoritmo donde la region de interes se limita a los tejidos del senoeliminando los demas componentes que interfieren en la imagen como son el fondo y el mAosculo pectoral.

    Las imagenes de mamografa utilizados en este estudio son de la base de datos Mini-MIAS. En estetrabajo se describe el desarrollo de una metodologa de clasificacion automatica de tejido mamario, quese resume en 3 etapas: (1) pretratamiento, (2) extraccion de caractersticas y la clasificacon (3).En donde en la primera etapa de pretratamiento mediante un umbral de Niveles de Gris, siguiendo conel etiquetado de componentes que se utiliza para eliminar los artefactos y los musculos pectorales de laregion de interes.

    Posterior mente se hace la extraccion de caractersticas del tejido mamario. Estas caractersticas ali-mentan a la maquina de soporte vectorial (SVM) la cual se encarga de clasificar los resultados en 3clases distintas: grasos, glandular y tejido denso. La precision clasificador obtenido es 95,44 % utilizando14 mamografas con tejido graso, 14 mamografas con tejido glandular y 15 mamografas con tejido denso.

    En la figua 2.8 se pueden ver las caractersticas obtenidas de la imagen.

    2.1.6. Segmentacion de mama con supresion de musculo Pectoral

    Este trabajo realizado por David Raba et. al. [4] se presenta un metodo de extraccion del musculopectoral, el cual se obtiene de aplicar diferentes mascaras asociadas a el operador gaussiano con el cualse pretende obtener el contorno de la mama.

  • 2.2. Bases de Datos de Mamografias 11

    Figura 2.8: Caracteristcas tomadas de la imagen

    Como primer paso, se procede a obtener toda la region de la mama y posteriormente se generan filtroscon diferentes niveles de gris para obtener el musculo. Finalmente se extrae el musculo pectoral usandola transformada de Hough. Se utilizo la base de datos MiniMIAS, con la cual se probaron 320 imagenes,de las cuales se obtuvo 98 % de exactitud en localizacion del musculo pectoral y 86 % de extraccionescorrectas del musculo pectoral. En la figura 2.9 se puede ver el funcionamiento del sistema.

    Figura 2.9: Metodo de extraccion del musculo.

    2.1.7. Deteccion temprana de cancer de mama utilizando SVM como clasificador

    En este trabajo realizado por Y. Ireaneus Anna Rejani, et. al. se presenta un algoritmo para deteccion detumores en mamografas, donde presenta dos problemas; el primero encontrar las regiones sospechosasy el segundo extraer las caractersticas para su clasificacion.

    En este trabajo se siguen los siguientes pasos: (a) mejora de la mamografa, (b) La segmentacion porumbral de la zona del tumor, (c) La extraccion de caractersticas del tumor y (d) El uso del clasificadorSVM. En la figura 2.10 se muestra el proceso para la clasificacion de tumores en mamografas.

    El metodo fue probado en 75 imagenes de las mamografas, a partir de la base de datos MiniMIAS. Lametodologa logra una sensibilidad del 88,75 %.

    2.2. Bases de Datos de Mamografias

  • 2.2. Bases de Datos de Mamografias 12

    Figura 2.10: Metodo de clasificacion por SVM

    Para la evaluar un algoritmo es recomendable usar una base de datos de prueba estandar para losinvestigadores para ser capaz de comparar directamente los resultados. La mayor parte de las bases dedatos mamograficos no estan disponibles publicamente. Las base de datos accesible y por tanto las basede datos mas utilizada es: la Sociedad de Analisis de Imagen mamografica (MIAS).

    2.2.1. MIAS

    La Sociedad de Analisis de Imagen mamografica (MIAS) es una organizacion de grupos de investiga-cion espanoles interesados en la comprension de las mamografas y han generado una base de datos demamografas digitales. Las imaagenes han sido digitalizadas a 50 micrones de pxel borde, con pixelesde 8 bits. La base de datos contiene 322 imagenes digitalizadas y esta disponible. Tambien incluye laubicacioon de las anormalidades presentes. La base de datos se ha reducido a un borde de 200 micronesde pxel tienen un tamano de 1024x1024 pixeles.

    En la figura 2.11 se pueden apreciar algunas muestras de la base de datos.

  • 2.2. Bases de Datos de Mamografias 13

    Figura 2.11: Muestras base de datos MIAS

  • 14

    Captulo 3

    Marco Teorico

    3.1. Segmentacion de imagenes

    La segmentacion se refiere al proceso de compartimentacion de una imagen digital en multiples segmen-tos formados por la union de pxeles conectados. El objetivo de la segmentacion es para simplificar larepresentacion de una imagen en algo que es mas significativo y mas facil de analizar. La segmentacionde la imagen se utiliza tpicamente para localizar objetos y lmites. Mas precisamente, la segmentacionde imagenes es el proceso de asignar una etiqueta a cada pxel con las mismas caractersticas visualestales como el color, la intensidad, o la textura. El resultado de la segmentacion de la imagen es unconjunto de regiones que cubren conjuntamente toda la imagen, o un conjunto de contornos extradosde la imagen.

    En la actualidad existe gran cantidad de imagenes medicas las cuales para hacer mas facil su anali-sis necesitan separar partes de la imagen para obtener una mejor interpretacion. Estos algoritmos sonconocidos como segmentacion de imagenes cuya tarea principal es encontrar objetos localizados en laimagen y separarlos para distinguirlos de los demas. [?]. Los resultados de la segmentacion deben cum-plir ciertas caractersticas:

    Brindar resultados similares a los obtenidos por un observador experimentado.

    Las regiones obtenidas deben formar la imagen completa y no se deben intersectar.

    Cada objeto debe ser solo una region.

    Las regiones no deben tener huecos.

    Los contornos de los segmentos deben ser continuos sin huecos.

    Los algoritmos deben ser automaticos con la intervencion mnima del usuario.

    Los algoritmos deben ser de bajo conto computacional [?]

    3.1.1. Umbralizacion

    Dentro del procesamiento de imagenes la deteccion de clases es un paso importante para el reconoci-miento de patrones, esto es en el proceso de segmentacion, esto es, porque al obtener distintas clases

  • 3.2. Extraccion de caractersticas 15

    podemos utilizar solo aquellas regiones de interes que sean de importancia para nuestros metodos si-guientes, especialmente el proceso de extraccion de caractersticas.

    La umbralizacion es un metodo simple pero muy efectivo, ya que aplicando los filtros correctos po-demos obtener exelentes resultados a la hora de segmentar la imagen.

    La umbralizacion (thresholding) es un metodo que busca separar la imagen por medio de sus intensida-des de color creando una particion (lmite inferior y superior) donde las intensidades que correspondanal rango perteneceran a una clase y las demas perteneceran a otra. En este metodo es comun usar elhistograma para mostrar los rangos de las clases. En la figura 3.1 se muestra el histograma de unaimagen con umbrales(a) as como la imagen umbralizada(b). [?]

    Figura 3.1: (a) Histograma (b)Imagen umbralizada

    3.1.2. Region Creciente

    El metodo de Region creciente (region growing) es una tecnica que sirve para extraer partes de laimagen por medio de un criterio definido, este metodo requiere de un punto (semilla) del cual todos lospuntos conectados a esta seran parte de la clase, siempre que se encuentren en el umbral definido parala semilla. En la figura 3.2 se muestra un ejemplo de esta tecnica, la imagen muestra la clasificacion dela imagen con respecto de la semilla(a) ademas de la region creciente(b). [?]

    Figura 3.2: (a) Clasificacion de la imagen (b)Region creciente

    3.2. Extraccion de caractersticas

  • 3.2. Extraccion de caractersticas 16

    Tenicas que permiten extraerciertos elementos (caractersticas) de la imagen para luego ser usados enotras tareas. Estos elementos sirven de base para otros metodos que realizan tareas mas complejas(reconocimiento, localizacion, clasificacion, etc.)A continuacion se detallan algunas de las caractersticas estadisticas utilizadas.

    3.2.1. Media

    La media aritmetica (tambien llamada promedio o simplemente media) de un conjunto finito de numeroses el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio dela esperanza matemAtica o valor esperado, se obtiene a partir de la suma de todos sus valores divididaentre el numero de sumandos.

    La media aritmetica se define a continuacion:

    Dados los n numeros {a1, a2, ..., an}

    x =1

    n

    ni=1

    x1 + x2 + ...+ xnn

    3.2.2. Desviacion Estandar

    La desviacion estandar es una medida de centralizacion o dispersin para variables de razon y deintervalo.

    Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacion tpica es una medida(cuadratica) que informa de la media de distancias que tienen los datos respecto de su media aritmetica,expresada en las mismas unidades que la variable.

    2 =

    ni=1

    (xi x)2

    n1

    3.2.3. Suavidad

    La suavidad mide la suavidad relativa de intensidad en una region de interes. a continuacion se definela formula para calcularla:

    R = 1 1(1+2)

    3.2.4. Asimetra

    En teora de la probabilidad y estadsticas , es una medida de la asimetra de la distribucion de unavariable aleatoria. El valor de la asimetra puede ser positivo o negativo, o incluso indefinida. Un valornegativo indica que existen mas datos de probabilidad del lado derecho de la media y un valor positivoque la mayor cantidad de valores se encuentran del lado izquierdo de la media. Un valor cero indica quelos valores son relativamente distribuido uniformemente en ambos lados de la media.

    En la figura 4.12 se muestra la distribucion con asimetria negativa y positiva.

  • 3.2. Extraccion de caractersticas 17

    Figura 3.3: Asimetra Negativa y Positiva

    La asimetra de una variable aleatoria X es el tercer momento estandarizado , denotado 1 y se definecomo:

    1 =[(X )3

    3

    )]3.2.5. Uniformidad

    Mide la uniformidad de una distribucion de intensidad. Se calcula con la siguiente formula:

    U =L1i=0

    p (i)2

    3.2.6. Curtosis

    En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las medidas decurtosis tratan de estudiar la proporcion de la varianza que se explica por la combinacion de datos ex-tremos respecto a la media en contraposicion con datos poco alejados de la misma. Una mayor curtosisimplica una mayor concentracion de datos muy cerca de la media de la distribucion coexistiendo almismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma.

    El coeficiente de apuntamiento de uso mas extendido es el basado en el cuarto momento con respecto ala media y se define como:

    2 =[(X )4

    4

    )]3.2.7. Histograma Medio

    El histograma medio es el valor caracterstico que se obtiene a partir de la suma de todos los valoresdel histograma dividida entre el numero maximo de gris.

    El histograma medio se define a continuacion:

    AHg =1

    L

    L1i=0

    N (i)

  • 3.3. Memorias Asosiativas Alfa Beta 18

    3.3. Memorias Asosiativas Alfa Beta

    En esta seccion se presenta la teora referente a las memorias asociativas Alfa-Beta [?]. A continuacionse presentan las operaciones y , ademas de las operaciones matriciales que se derivan, y se describenlas fases de aprendizaje y recuperacion de la memorias heteroasociativas y autoasociativas Alfa-Beta,tanto Max, denotadas por M, como Min, denotadas por W.

    3.3.1. Operaciones Binarias y

    Las memorias Alfa-Beta utilizan maximos y mnimos, y dos operaciones binarias originales y de lascuales heredan el nombre.

    Para definir las operaciones binarias y se deben especificar los conjuntos A y B, los cuales son:

    A={0,1} y B={0,1,2}

    La operacion : A x A B se muestra en la tabla siguiente:x y (x,y)

    0 0 1

    0 1 0

    1 0 2

    1 1 1

    La operacion : B x A A se muestra en la tabla siguiente:x y (x,y)

    0 0 0

    0 1 0

    1 0 0

    1 1 1

    2 0 1

    2 1 1

    Memorias Heteroasociativas Alfa Beta (max y min)

    En [?] se muestran dos tipos de memorias heteroasosiativas : tipo y tipo .En el diseno de las memorias heteroasociativas se utilizan los operadores matriciales 41 , 51 , 41y 51 . los cuales son definidos a continuacion:

    1. Operacion max: Pmxr5Qrxn = [fmxn], dondef = (pik,qkj).

    2. Operacion max: Pmxr5Qrxn =[fmxn

    ], donde

  • 3.3. Memorias Asosiativas Alfa Beta 19

    f = (pik,qkj).

    3. Operacion min: Pmxr4Qrxn = [fmxn], dondef = (pik,qkj).

    4. Operacion min: Pmxr4Qrxn =[fmxn

    ], donde

    f = (pik,qkj).

  • 20

    Captulo 4

    Modelo Propuesto

    En este captulo se describe la metodologa utilizada para la clasificacion de mamografas Digitales prove-nientes de la base de datos de mini-MIAS, en las cuales se aplica un procedimiento para la segmentacionde mamografas digitales, posteriormente de las mamografas segmentadas se efectua la extracion de ca-ractersticas, las cuales nos aportaran datos importantes para la clasificacion y finalmente se aplica elalgoritmo de memorias alfa-Beta para la clasificacion de las caractersticas con lo cual sabremos si lamama tiene cancer.

    El metodo propuesto consta principalmente de tres pasos. Los cuales se describiran a continuacion.

    Figura 4.1: Etapas del sistema para el modelo propuesto

  • 4.1. Segmentacion de mamografas 21

    4.1. Segmentacion de mamografas

    4.1.1. Imagen Digital

    Para segmentar las mamografas digitales debemos consideralas como una imagen digital, las cualesson definidas como una funcion bidimensional f(x, y), donde (x, y) representa un punto el espacio. Lasimagenes digitales se reprentan como una matriz bidimensional 4.2 Fij = (fij) mxn donde m y nrepresentan las dimenciones de la imagen y la funcion de trancicion es la siguiente fij = f(xi, xj)

    Figura 4.2: Imagen Digital

    4.1.2. Segmentacion

    El primer paso de este metodo consiste en identificar el musculo pectoral, as como las demas regionesque no son de inteespara la mamografa. Por lo cual la deteccion de la region de intees o region mamariase divide en distintos pasos que en su totalidad tienen el objetivo de segmentar la mama.

    La figura 4.3 muestra el Diagrama de los procedimientos creados para segmentar la region mama-ria.

    El primer paso del algoritmo consiste en leer la mamografa en formato bmp, utilizando lenguajec++, al final del proceso se obtendra una matriz que contiene los valores de cada pixel de la imagen enescala de grises con valores entre 0 y 255 donde el 0 representa el color negro y 255 representa el colorblanco.

    Posteriormente se debe de obtener el Histograma de la imagen, el cual nos mostrara donde se concentrala region mamaria. A continuacion el Algoritmo 2 muestra como obtener el Histograma de una imagen.La figura 4.4 muestra el resultado de aplicar el algoritmo a una mamografa.

    Una vez obtenido el Histograma de la imagen se calcula la varianza, para encontrar los lmites delmusculo pectoral. En este procedimiento se discriminan los niveles menores a 50 y los mayores a 255ya que son niveles que no corresponden a la region mamaria. El Algoritmo 3 muestra como obtener lavarianza a partir del Histograma. La varianza se obtiene con la siguiente formula:

  • 4.1. Segmentacion de mamografas 22

    Cuadro 4.1: Algoritmo 1 Funcion para leer imagen y guardar en matriz

    Entrada: imagen mamografa I

    Salida: imagen en matriz Im

    funcion LeerImagen(I)

    para cada pxel (x, y) en I

    Im(i, j) I(i, j)fin para

    regresar Im

    fin funcion

    Cuadro 4.2: Algoritmo 2 Funcion para obtener el Histograma de una imagen

    Entrada: imagen Im

    Salida: Hitograma H

    funcion ObtenerHistograma(Im)

    para i 0 hasta 255H[i] 0

    fin para

    para cada pxel (x, y) en Im

    H[Im(x, y)] + +

    end para

    regresar H

    fin funcion

  • 4.1. Segmentacion de mamografas 23

    Cuadro 4.3: Algoritmo 3 Funcion para obtener la varianza

    Entrada: Histograma H

    Salida: Varianza V ar

    funcion ObtenerVarianza(Im)

    para m 50 hasta 250npixeles+ = H[m]

    fin para

    para m 50 hasta 250aux[m] = H[m]/npixeles

    mediana mediana+ (m)(aux[m])fin para

    para m 50 hasta 250V ar V ar + [(imediana)(imediana) (aux[i])]

    fin para

    var sqrt(V ar)regresar V ar

    fin funcion

    2 =

    255i=0((i )2xH [i])255

    j=0 [j]

    donde:

    =

    255i=0(ixH [i])255

    j=0 [j]

    Para estimar la posicion del musculo pectoral en la imagen primero suprimimos los primeros 90 pixelesde la parte superior de la imagen. Despues se realiza una trayectoria vertical de izquierda a derechay de derecha a izquierda paralelamente, para encontrar el primer pxel f (x90, yj) que esta dentro delumbral 100 f (x90, yj) 250.

    Si el primer pxel en el umbral se encontro en el camino de izquierda a derecha, entonces se estimaque el musculo pectoral esta en el lado izquierdo de la mamografa, y si el primer pxel en el umbral seencontro en el camino de la derecha hacia a la izquierda, entonces se estima que el musculo pectoral esel lado derecho de la mamografa. En la figura ?? muestra el curso que se realiza en paralelo de derechaa izquierda y de izquierda a derecha para encontrar el pectoral.

    El Algoritmo 4 muestra el procedimiento para localizar el musculo pectoral, este metodo regresa ademasla semilla que se utiliza para obtener el nivel de gris del musculo pectoral.

  • 4.2. Extraccion de caractersticas 24

    Los procedimientos utlizados para segmentar el musculo pectoral de las maografas son: el metodos delpixel mas cercano y el metodo de la semilla. A continuacion se presentan los pasos del procedimientopropuesto:

    Posteriormente se recorta la imagen tomando como referencia los puntos encontrados anteriormen-te. Si el punto encontrado esta del lado izquierdo hacemos un corrimiento a derecha hasta encontraun pixel negro, y si el pixel se encuentro del lado derecho hacemos un recorrimiento a izquierda hastaencontrar un pixel negro. La figura 4.6 representa el recorte de la mamografa. El algorimo 5 muestrael procedimiento para quitar ruido de la mamografa.

    Obtenida la semilla se procede a calibrar el Histograma, esto es, busca un pico cercano y lo toma comovalor de nueva semilla. Ahora se filtra el histograma de la imagen tomando como semilla el punto loca-lizado f(x, y), el cual nos servira para filtrar los valores encontrados entre f(x, y) 2 y f(x, y) + 2,en la figura 4.7 podemos ver el filtro del histograma. El Algoritmo 6 muestra el procedimiento calibrarel Histograma.

    Una vez calibrado el histograma, lo filtramos con los valores entre f(x, y) + 2 y f(x, y) + 2 y proce-demos a binarizar la imagen donde los valores dentro del rango les asignaremos el color blanco (255)y a los que se encuentren fuera del rango les asignamos negro (0). Nuestra formula de binarizacion semuestra a continuacion:bin(x, y) = {(255sif(x, y) 2 < f(x, y) < f(x30, yj) + 2)0enotrocaso.)la figura 4.8 muestra la imagen recortada y binarizada y el Algoritmo 7 muestra el proceso de recortadoy Binarizacion.

    Como se muestra en la figura 4.8 la imagen escaneada contiene el musculo pectoral, sin embargo tambiencontiene regiones no pertenecientes a este, por lo cual tomamos como referencia semilla y realizamos unescaneo tanto vertical como horizontal con lo cual obtendremos solo la region perteneciente al muculopectoral. En la figura 4.9 se muestra el musculo pectoral localizado. El algoritmo 8 muestra este proce-dimiento.

    Una vez que haya encontrado el musculo pectoral se procede a eliminarlo de la imagen original. Laimagen 4.10 muestra el resultado de la supresion del musculo pectoral. El algoritmo 9 muestra el pro-cedimiento para suprimir el musculo Pectoral.

    4.2. Extraccion de caractersticas

    La extraccion de caractersticas es, basicamente, un proceso de extraccion de la informacion util conte-nida en la senal a tratar (en nuestro caso las mamografas digitales).

  • 4.2. Extraccion de caractersticas 25

    Cuadro 4.4: Algoritmo 4 Funcion para localizar el musculo Pectoral

    Entrada: Imagen im

    Salida: punto x, y, lado donde se localizo el pectoral lado y Rango del pectoral max, semilla semilla

    funcion LocalizarPectoral(Im)

    para m 90 hasta largoImpara n 0 hasta ancho Im

    si im(m,n) >= 100 y im(m,n) < 250 entonces

    y mx nlado 1semilla Im(m,n+ 2)mientras im(m,n) >= 50

    semilla n+ +fin mientras

    regresar res

    fin si

    si im(m, ancho Im n) >= 100 y im(m, ancho Im n) < 250 entoncesy mx nlado 1semilla im(m,n+ 2)mientras im(m, ancho Im n) >= 50semilla n

    fin mientras

    regresar semilla

    fin si

    fin para

    fin para

    regresar semilla

    fin funcion

  • 4.2. Extraccion de caractersticas 26

    Cuadro 4.5: Algoritmo 5 Funcion para Quitar Ruido

    Entrada: imagen mamografa I,punto x, y, lado del pectoral lado

    Salida: imagen Filtrada sin Ruido Im

    funcion QuitarRuido(I)

    para m x hasta largo Impos xsi lado 1

    mientras Im(m, pos) > 20 y Im(m,n) < 250

    Im(m, pos+ +) 0fin mientras

    fin si

    si lado 2mientras Im(m, pos) > 20 y Im(m,n) < 250

    Im(m, pos) 0fin mientras

    fin si

    fin para

    regresar Im

    fin funcion

  • 4.2. Extraccion de caractersticas 27

    Cuadro 4.6: Algoritmo 6 Funcion para Calibrar el Histograma

    Entrada: semilla sem, Histograma H

    Salida: semilla sem

    funcion CalibrarHistograma(sem)

    para m 0 hasta 10si H[sem+ 1] > H[sem]

    sem+ +

    fin si

    si H[sem 1] > H[sem]sem

    fin si

    fin para

    regresar sem

    fin funcion

    Para modelar las clases de nuestro problema (con cancer y sin cancer), se obtienen los vectores decaractersticas que podemos obtener a partir de nuestra imagen, En la figura 4.11 se muestra el procesode extraccion de caractersticas.

    A estos vectores de caractersticas se les asocia una etiqueta de clase a la cual corresponden. Para obte-ner el vector de caractersticas se debe de aplicar algun algoritmo de extraccion de caractersticas paraobtener el vector de caractersticas.

    A continuacion se describen las formulas y algoritmos empleados para la extraccion de caractersti-cas.

    4.2.1. Maximo

    El maximo nos muestra el valor maximo de nuestra imagen esto es el nivel de gris que mAs se hacercaal blanco.

    A continuacion se describe la formula empleada para obtener el valor maximo de la imagen:

    max = max(f(x, y))

    4.2.2. Mnimo

    El maximo nos muestra el valor mnimo de nuestra imagen esto es el nivel de gris que mas se acerca alnegro.

  • 4.2. Extraccion de caractersticas 28

    Cuadro 4.7: Algoritmo 7 Funcion para Filtrar y Recortar la imagen

    Entrada: Imagen Im, rango max, lado del pectoral lado

    Salida: Imagen Im

    funcion FiltarRecortar(sem)

    si lado = 1

    ini maxfin ancho Im

    fin si

    si lado = 2

    ini 0fin max

    fin si

    para m 0 hasta largo Impara n Ini hasta finIm(m,n) = 0

    fin para

    fin para

    regresar Im

    fin funcion

    Cuadro 4.8: Algoritmo 8 Funcion para Filtrar el musculo Pectoral

    Entrada: Imagen Im, semilla sem, lado del pectoral lado

    Salida: Imagen ImSp

    funcion FiltrarPectoral(sem)

    si (x, y) en I

    si f(x, y) > sem varianza y f(x, y) < sem+ varianzaf(x, y) 0

    en otro caso

    f(x, y) 255fin si

    regresar ImSp

    fin funcion

  • 4.2. Extraccion de caractersticas 29

    Cuadro 4.9: Algoritmo 9 Funcion para Quitar Pectoral

    Entrada: Imagen Im, lado del pectoral lado

    Salida: Imagen ImSp

    funcion QuitarPectoral(sem)

    si lado 1limite 0mientras f(x, y) > 100

    limite+ +

    fin mientras

    fin si

    si lado 2limite ancho Im 1mientras f(x, y) > 100

    limitefin mientras

    fin si

    para cada pxel (x, y) en Im

    si lado = 1 y x < limite

    f(x, y) 255si lado = 2 y x > limite

    f(x, y) 255en otro caso

    f(x, y) 0fin si

    regresar ImSp

    fin funcion

  • 4.2. Extraccion de caractersticas 30

    La siguiente formula se utiliza para obtener el valor maximo de una imagen:

    min = min(f(x, y))

    4.2.3. Moda

    La moda nos regresa el valor mas repetido en nuestra imagen.

    La siguiente formula se utiliza para obtener el valor maximo de una imagen:

    moda = max(H(i))

    4.2.4. Desviacion Estandar

    La desviacion estandar nos muestra que tan dispersos se encuentran los valores de luminocidad de nues-tra imagen.

    Para obtener la deviacion estandar en nuestra imagen empleamos la siguiente formula:

    2 =

    m1x=0

    n1y=0

    (f(x, y) )2

    mn1

    4.2.5. Asimetra

    En teora de la probabilidad y estadsticas , es una medida de la asimetra de la distribucion de unavariable aleatoria. El valor de la asimetra puede ser positivo o negativo, o incluso indefinida. Un valornegativo indica que existen mas datos de probabilidad del lado derecho de la media y un valor positivoque la mayor cantidad de valores se encuentran del lado izquierdo de la media. Un valor cero indica quelos valores son relativamente distribuidos uniformemente en ambos lados de la media.

    En la figura 4.12 se muestra la distribucion con asimetra negativa y positiva.La asimetra de una variable aleatoria X es el tercer momento estandarizado , denotado 1 y se definecomo:

    1 =[(X )3

    3

    )]4.2.6. Uniformidad

    Mide la uniformidad de una distribucion de instensidad. Se calcula con la siguiente formula:

    U =L1i=0

    p (i)2

    4.2.7. Curtosis

    En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las medidas decurtosis tratan de estudiar la proporcion de la varianza que se explica por la combinacion de datos ex-

  • 4.2. Extraccion de caractersticas 31

    Cuadro 4.10: Algoritmo 10 Funcion para obtener el Maximo, el Mnimo y la Moda

    Entrada: Histograma H

    Salida: valor maximo max, valor mnimo min, moda moda

    funcion ObtenerCaracteristicas(H)

    max 0, min 0, moda 0para m 0 hasta 255

    si H[moda] < H[m]

    moda mfin si

    fin para

    max max(H)max min(H)

    regresar max,min,moda

    fin funcion

    tremos respecto a la media en contraposicion con datos poco alejados de la misma. Una mayor curtosisimplica una mayor concentracion de datos muy cerca de la media de la distribucion coexistiendo almismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma.

    El coeficiente de apuntamiento de uso mas extendido es el basado en el cuarto momento con respecto ala media y se define como:

    2 =[(X )4

    4

    )]4.2.8. Histograma Medio

    El histograma medio es el valor caracterstico que se obtiene a partir de la suma de todos los valoresdel histograma dividida entre el numero maximo de gris.

    El histograma medio se define a continuacion:

    AHg =1

    L

    L1i=0

    N (i)

    A continuacion se muestran los Algoritmos para obtener las caractersticas de la imagen

    4.2.9. Algoritmos

  • 4.2. Extraccion de caractersticas 32

    Cuadro 4.11: Algoritmo 11 Funcion para obtener la mediana,varianza,energa y la entropa

    Entrada: Histograma H

    Salida: mediana med, varianza var, energa ererg y la entropa entr

    funcion ObtenerCaracteristicas2(Im)

    med 0; var 0; entr 0; energ 0para m 50 hasta 250npixeles npixeles+H[m]

    fin para

    para m 50 hasta 250p[i] H[i]/(double)npixelesmed med+ (i H[i])mediana mediana+ (m)(aux[m])

    fin para

    para m 50 hasta 250V ar V ar + [(imediana) (imediana) (p[i])]energ energ + [(p[i]) (p[i])]entr entr + [(p[i]) (log(p[i])) (log(2,0))]

    fin para

    var sqrt(var)regresar med, V ar, energ, entr

    fin funcion

    Cuadro 4.12: Algoritmo 12 Funcion para obtener el nmero de pixeles

    Entrada: Histograma H

    Salida: bumero de pixeles npixeles

    funcion numPixeles(H)

    npixeles 0para m 0 hasta 255npixeles npixeles+H[m]

    fin para

    regresar npixeles

    fin funcion

  • 4.2. Extraccion de caractersticas 33

    Cuadro 4.13: Algoritmo 13 Funcion para obtener la sumatoria de valores del Histograma

    Entrada: Histograma H

    Salida: sumatoria sum

    funcion sumHistograma(H)

    sum 0para m 0 hasta 255sum sum+ (m H[m])

    fin para

    regresar sum

    fin funcion

    Cuadro 4.14: Algoritmo 14 Funcion para obtener la media

    Entrada: Histograma H, numero de pixeles npixeles y sumatoria del Histograma sum

    Salida: media media

    funcion obtenerMedia(H,npixeles,sum)

    media 0media sum/npixeles

    regresar media

    fin funcion

    Cuadro 4.15: Algoritmo 15 Funcion para obtener la varianza

    Entrada: Histograma H, sumatoria del Histograma sum y media media

    Salida: varianza var

    funcion ObtenerVarianza(H, sum, media)

    d 0, var 0, desv 0para m 0 hasta 255d d+ (H[i] pow(imedia, 2))

    fin para

    V ar d/sumregresar var

    fin funcion

  • 4.2. Extraccion de caractersticas 34

    Cuadro 4.16: Algoritmo 16 Funcion para obtener la desviacion estandar

    Entrada: varianza var

    Salida: desviacion desv

    funcion ObtenerDesviacion(var)

    desv sqrt(V ar)regresar desv

    fin funcion

    Cuadro 4.17: Algoritmo 17 Funcion para obtener la suavidad de la imagen

    Entrada: varianza var

    Salida: suavidad smooth

    funcion obtenerSuavidad(var)

    smooth 1 (1/(1 + var))regresar smooth

    fin funcion

  • 4.2. Extraccion de caractersticas 35

    Figura 4.3: Diagrama de segmentacion de la region mamaria

  • 4.2. Extraccion de caractersticas 36

    Figura 4.4: Imagen de una mamografa digital y su histograma

    Figura 4.5: Estimacion del musculo pectoral

  • 4.2. Extraccion de caractersticas 37

    Figura 4.6: Estimacion del musculo pectoral

    Figura 4.7: Valores filtrados en el histograma

  • 4.2. Extraccion de caractersticas 38

    Figura 4.8: Imagen binarizada usando el histograma

  • 4.2. Extraccion de caractersticas 39

    Figura 4.9: localizacion del musculo pectoral

    Figura 4.10: Imagen binarizada usando el histograma

  • 4.2. Extraccion de caractersticas 40

    Figura 4.11: Extraccion de caractersticas de una imagen

    Figura 4.12: Asimetra Negativa y Positiva

  • 4.3. Clasificacion 41

    Cuadro 4.18: Algoritmo 18 Funcion para obtener la asimetra

    Entrada: Histograma H, desviacion estandar desv y media media

    Salida: Asimetra de la Imagen skew

    funcion ObtenerAsimetria(H, desv, media)

    sk 0, skew 0para m 0 hasta 255sk sk + (H[i] pow(imedia, 3))

    fin para

    skew sk/(s pow(desv, 3))regresar skew

    fin funcion

    4.3. Clasificacion

    Una vez obtenidas las caractersticas de las imagenes, procesadas por los algoritmos anteriores, se tie-nen que seguir dos pasos importante para la clasificacion: El primero es el entrenamiento de la memoriaasociativa que se utiliza y el segundo paso es la recuperacion, en la cual se tiene una imagen de entrada,la cual pasa por los proceso anteriores segmentacion y extraccion de caractersticas, una vez obtenidoel vector de caractersticas se asocia con una clase del conjunto de entrenamiento.

    En esta seccion se muestra como a partir de las caractersitcas adquiridas, se construye el vector decaractersticas las cuales serviran en el proceso de clasificacion, ademas de los algoritmos para crearvectores de caractersticas y la fase de recuperacion.

    4.3.1. Manejo de las caractersticas adquiridas

    Para generar los vectores de caractersticas se procede a tomar cada una de las caractersticas de lasiguiente forma:

    Para generar nuestro vector buscaremos el valor mnimo vmin y el valor maximo vmax para cadacaracterstica y despues calcularemos un valor entero (entre 0 y 100) para cada numero con la siguienteformula:

    val[x] = (x nmin) (100/(nmax nmin))

    Con lo cual todas nuestras caractersitcas quedaran en el rango entre 0 y 100. Hecho esto procede-mos a crear nuestro vector de caractersticas el cual necesitara un vector de 100 por el numero decaractersticas, es decir, en nuestro caso tenemos 13 caractersticas entonces nuestro vector sera de 1300bits. Los cuales seran llenados por la concatenacion de la representacion en bits de cada caracterstica.

    Por ejemplo:

  • 4.3. Clasificacion 42

    Cuadro 4.19: Algoritmo 19 Funcion para obtener la uniformidad

    Entrada: Histograma H y sumatoria del Histograma sum

    Salida: uniformidad unif

    funcion ObtenerUniformidad(H, sum)

    un 0, unif 0para m 0 hasta 255PH[i] H[i]/sumun un+ (pow(PH[i], 2))

    fin para

    unif unregresar unif

    fin funcion

    Cuadro 4.20: Algoritmo 20 Funcion para obtener la curtosis

    Entrada: Histograma H, desviacion estandar desv y media med

    Salida: curtosis kurt

    funcion Obtenercurtosis(H, desv, med)

    k 0, kurt 0para m 0 hasta 255k k + (H[i] pow(imedia, 4))

    fin para

    kurt k/((s 1) pow(desv, 4))regresar kurt

    fin funcion

    Cuadro 4.21: Algoritmo 21 Funcion para obtener el Histograma promedio

    Entrada: Histograma H y sumatoria del Histograma sum

    Salida: curtosis AH

    funcion ObtenerHistProm(H, sum)

    AH sum/256regresar AH

    fin funcion

  • 4.3. Clasificacion 43

    Cuadro 4.22: Algoritmo 22 Funcion para obtener la probabilidad de constraste

    Entrada: Histograma H y media med

    Salida: Probabilidad contraste moded

    funcion ObtenerProbConst(H, sum)

    me 0,moded 0para m 0 hasta 255me me+ (H[i] pow(imedia, 2) PH[i])

    fin para

    moded sqrt(me)regresar moded

    fin funcion

    Cuadro 4.23: Algoritmo 23 Funcion para obtener la asimetra por pixel

    Entrada: Histograma H, desviacion estandar desv y media med

    Salida: Asimetra por pixel kurt

    funcion ObtenerAsimetriaP(H, desv, sum)

    ms 0,modsk 0para m 0 hasta 255ms +ms(H[i] pow(imedia, 3) PH[i])

    fin para

    modsk ms/pow(desv, 3)regresar modsk

    fin funcion

  • 4.3. Clasificacion 44

    Supongamos que tenemos los datos x1 = 115,65, x2 = 30,34 y x3 = 3,46, con sus respectivos maximosy mnimos max1 = 130, min1 = 30, max2 = 42,25, min2 = 8,36, max3 = 40,34 y min3 = 20,2 yque queremos normalizarlos entre los valores 0 y 20.

    Entonces nuestro vector quedara como se muestra a continuacion:

    Nuestros nuevos valores seran los siguientes:

    x11 = (x1 min1) (20/(max1 min1)) = (115,65 30) (20/(130 30)) = 17,13 = 17x21 = (x2 min2) (20/(max2 min2)) = (30,34 (8,36)) (20/(42,25 (8,36))) = 15,29 = 15x31 = (x3 min3) (20/(max3 min3)) = (3,46 (20,2)) (20/(40,34 (20,2))) = 7,81 = 7

    donde:

    xb1 = 11111111111111111000xb2 = 11111111111111100000xb3 = 11111110000000000000

    Nuestro vector queda de la siguiente forma:

    vx = xb1&xb2&xb3

    vx = 111111111111111110001111111111111110000011111110000000000000

    Como se observa el algoritmo para realizar este procedimiento es el siguiente:

    1. Primero tendremos nuestro conjunto de entradas:{e1, e2, e3, ..., en}

    2. Donde cada entrada le corresponde un conjunto de caractersticas:{c1, c2, c3, ..., cn}

    3. Entonces apartir de la caractersitca ci de cada una de nuestras entradas buecaremos el mayor yel menor, obteniendo los siguientes conjuntos.Cmax = {cmax1, cmax2, cmax3, ..., cmaxn} y Cmin = {cmin1, cmin2, cmin3, ..., cminn}

    4. A cada caractersitica de cada entrada se le restara el valor mnimo encontrado para la carac-terstica, con lo cual nuestros conjuntos tendran como valor mnimo 0.

    5. Se normalizan los conjuntos de entrada para dejarlos en un rango fijo (0 a 100) y truncarlos paraconvertirlos en un conjunto de enteros nuevo.{ce1, ce2, ce3, ..., cen}

  • 4.3. Clasificacion 45

    6. una vez que tenemos normalizadas nuestras entradas las transformamos a bits (0s y 1s) dondetendremos cei ceros concatenados de 100 cei unos.Ejemplo:

    Supangamos que tenemos el conjunto de entradas:en = {e1, e2, e3}

    Los cuales contienen las siguientes caractersticas:e1 = {0,2, 7,8, 15,5}e2 = {3,1, 4,4, 3,6}e3 = {4,2,1,3, 10,1}

    Entonces de estos valores encontraremos los siguientes conjuntos:cmax = {4,2, 7,8, 15,5} y cmin = {3,1,1,3, 3,6}

    Restando el valor de caracterstica mnimo obtenemos los nuevos conjuntos:e1 = {3,3, 9,1, 11,9}e2 = {0, 5,7, 0}e3 = {7,3, 0, 6,5}

    Ahora se normalizan los conjuntos para dejarlos en un rango fijo (0-100), obteniendo los siguientesconjuntos:e1 = {45, 100, 100}e2 = {0, 62, 0}e3 = {100, 0, 54}

    Para cada valor de cada caractersitca de entrada obtenemos su representacion en bits:e1 = {1111111111111111111111111111111111111111111110000000000000000000000000000000000000000000000000000000,1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111,1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111}e2 = {0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000,1111111111111111111111111111111111111111111111111111111111111100000000000000000000000000000000000000,0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000}e3 = {1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111,0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000,1111111111111111111111111111111111111111111111111111110000000000000000000000000000000000000000000000}

  • 4.3. Clasificacion 46

    Cuadro 4.24: Algoritmo 24 Funcion para normalizar caractersticas

    Entrada: Vector de caractersticas vec, numero de caractersticas ncar

    Salida: vectorNormailizado vecN

    funcion NormalizarCaracteristicas(vec,ncar)

    aux

    para m 0 hasta ncaraux[i] (vec[m]min[m]) (100 max[i])

    fin para

    para m 0 hasta ncarpara n 0 hasta 100

    si aux[i] < n

    vecN [m 100 + n] 1en otro caso

    vecN [m 100 + n] 1fin si

    fin para

    fin para

    regresar vecN

    fin funcion

    El Algoritmo 24 muestra el proceso del manejo de las caractersticas, en este algoritmo se muestra lanormalizacion de las caractersticas en el rango 0 a 100Una vez obtenidos los vectores de caractersticas se forma una matriz donde contendra los vectoresobtenidos, para finalmente formar el conjunto de aprendizaje, en donde se agregaran todos los vectoresnormalizados.

    4.3.2. fase de recuperacion

    Para recuperar una clase son necesarios los algoritmos con las operaciones y de las memorias aso-ciativas.

    A continuacion se muestran los algoritmos con las operaciones.El algoritmo 25 muestra la recuperacion con la operacion alfa min (min)

  • 4.3. Clasificacion 47

    Cuadro 4.25: Algoritmo 24 Funcion para la operacion alfa de memorias asociativas

    Entrada: Vectores Normalizados x, y

    Salida: Matriz resultante resul

    funcion opAlfa(x,y)

    para m 0 hasta el tamano de xpara n 0 hasta el tamano de y

    si x[m] = x[n]

    resul[m,n] 1en otro caso x[m] == x[n]

    si x[m] < x[n]

    resul[m,n] 0en otro caso

    resul[m,n] 2fin si

    fin si

    fin para

    fin para

    regresar result

    fin funcion

  • 4.3. Clasificacion 48

    Cuadro 4.26: Algoritmo 25 Funcion para la operacion de recuperacion Alfa min (min ) memoriasasociativas

    Entrada: Matriz Resultante result, vector Analizar entr

    Salida: Matriz min

    funcion recAlfamin(x,y)

    para m 0 hasta el tamano de xpara n 0 hasta el tamano de yres 0si result[m][n] + entr[m] > 1

    res 1fin si

    si res < 2

    min[m,n] resfin si

    fin para

    fin para

    regresar min

    fin funcion

  • 4.3. Clasificacion 49

    Cuadro 4.27: Algoritmo 25 Funcion para recuperacion de la clase

    Entrada: Matriz min

    Salida: numero de clase resultante numc

    funcion claserec(x,y)

    numc 0para m 0 hasta el tamano de x

    para n 0 hasta el tamano de ymaximo 0si min(x, y) = 1

    maximo maximo+ 1fin si

    fin para

    si maximo > numc

    numc maximofin si

    fin para

    regresar numc

    fin funcion

  • 50

    Captulo 5

    Resultados

    En este captulo se presentan los resultados obtenidos con la metoologa propuesta utilizando los algo-ritmos expuestos en el captulo anterior. Se muestran los resultados de la segmentacion con las imagenesde la base de mini-MIAS.

    A continuacion se detallan los resultados obtenidos en las etapas de segmentacion extraccion de ca-ractersticas y clasificacion.

    5.1. Segmentacion de las mamografas

    Utilizando los algoritmos correspondientes para la obtencion de la region mamaria, a continuacion sedetallan los pasos utilizados.

    1. Lectura de la mamografa Digital obtenida de la base de datos mini-MIAS (figura 5.1)

    2. Calculo del Histograma (figura 5.2)

    3. Calculo de la varianza

    4. Localizacion del musculo pectoral (figura 5.3)

    5. Obtencion de la semilla en escala de grises (figura 5.4)

    6. Recortado de la imagen en la region Pectoral (figura 5.5)

    7. Calibracion y Filtrado del Histograma (figura 5.2)

    8. Binarizado de la mamografa Digital en el rango del histograma (figura 5.6)

    9. Escaneo y segmentacion del musculo pectoral (figura 5.7)

    10. Supresion del musculo pectoral (figura 5.8)

    A continuacion se muestran los resultados correspondientes, aplicando cada uno de los pasos mostradosanteriormente de algunas imagenes del Banco de datos mini-MIAS.

  • 5.2. Extraccion de caracteristicas 51

    Figura 5.1: Lectura de la mamografa

    5.2. Extraccion de caracteristicas

    Como resultado de la extraccion de caracteristicas podemos mencionar que se hizo uso de 12 medidasestadsticas normalizadas en un rango de 0 a 100, obteniendo como resultado vectores de 1200 bits, loscuales responden bien a las pruebas de clasificacion.

  • 5.3. Clasificacion 52

    Figura 5.2: Calculo del Histograma

    5.3. Clasificacion

    Para hacer pruebas de clasificacion se crearon memorias autoasociativas con las clases cancer BenignoCB, cancer Maligno CB, Sin Cancer SC, con las cuales se realizaron pruebas obteniendo los resul-

  • 5.3. Clasificacion 53

    Figura 5.3: Localizacion del musculo Pectoral

    tados siguientes:

    Se analizaron 100 de las 322 imagenes obteniendo como resultado un porcentaje de exactitud del 85 %,a continuacion se muestra una tabla con los resultados obtenidos.

  • 5.3. Clasificacion 54

    Figura 5.4: Obtencion de la Semilla

  • 5.3. Clasificacion 55

    Figura 5.5: Recortado de la region Pectoral

    clase original muestra clase candidata Clasificacion correcta

    CB mdb001 CB S

    Sigue en la pagina siguiente

  • 5.3. Clasificacion 56

    clase original muestra clase candidata Clasificacion correcta

    CB mdb002 CB S

    SC mdb003 SC S

    SC mdb004 SC S

    CB mdb005 CB S

    CB mdb006 CB S

    SC mdb007 SC S

    SC mdb008 SC S

    SC mdb009 SC S

    SC mdb010 SC S

    CB mdb011 CB S

    SC mdb012 SC S

    CB mdb013 CB S

    CB mdb014 CB S

    SC mdb015 SC S

    CB mdb016 CB S

    SC mdb017 SC S

    CB mdb018 SC No

    SC mdb019 SC S

    CB mdb020 CB S

    SC mdb021 SC S

    CB mdb022 CB S

    CM mdb023 CM S

    SC mdb024 SC S

    CB mdb025 CB S

    SC mdb026 SC S

    SC mdb027 SC S

    CM mdb028 CM S

    SC mdb029 CB No

    CB mdb030 SC No

    SC mdb031 CB No

    CB mdb032 SC No

    Sigue en la pagina siguiente

  • 5.3. Clasificacion 57

    clase original muestra clase candidata Clasificacion correcta

    SC mdb033 SC S

    SC mdb034 SC S

    SC mdb035 CB No

    SC mdb036 SC S

    SC mdb037 SC S

    SC mdb038 SC S

    SC mdb039 CB No

    SC mdb040 SC S

    SC mdb041 SC S

    SC mdb042 SC S

    SC mdb043 SC S

    SC mdb044 CB No

    SC mdb045 SC S

    SC mdb046 SC S

    SC mdb047 SC S

    SC mdb048 SC S

    SC mdb049 SC S

    SC mdb050 SC S

    SC mdb051 SC S

    SC mdb052 SC S

    SC mdb053 CB No

    SC mdb054 SC S

    SC mdb055 SC S

    SC mdb056 SC S

    SC mdb057 SC S

    CM mdb058 CM S

    CB mdb059 CB S

    SC mdb060 SC S

    SC mdb061 SC S

    SC mdb062 CB No

    CB mdb063 SC No

    Sigue en la pagina siguiente

  • 5.3. Clasificacion 58

    clase original muestra clase candidata Clasificacion correcta

    SC mdb064 SC No

    SC mdb065 SC S

    SC mdb066 SC No

    SC mdb067 CB S

    SC mdb068 SC S

    CB mdb069 CB S

    SC mdb070 SC S

    SC mdb071 SC S

    CM mdb072 CM S

    SC mdb073 SC S

    SC mdb074 SC S

    CM mdb075 CM S

    SC mdb076 SC S

    SC mdb077 SC S

    SC mdb078 SC S

    SC mdb079 SC S

    CB mdb080 SC No

    CB mdb081 CB S

    SC mdb082 SC S

    CB mdb083 CB S

    SC mdb084 SC S

    SC mdb085 SC S

    SC mdb086 SC S

    SC mdb087 SC S

    SC mdb088 SC S

    SC mdb089 CB No

    CM mdb090 SM S

    CB mdb091 CB S

    CM mdb092 CM S

    SC mdb093 CS S

    SC mdb094 CS S

    Sigue en la pagina siguiente

  • 5.4. Conclusiones y Trabajo a furturo 59

    clase original muestra clase candidata Clasificacion correcta

    CM mdb095 CM S

    SC mdb096 SC S

    CB mdb097 CB S

    SC mdb098 CS S

    CB mdb099 CB S

    SC mdb100 SC S

    Cuadro 5.1: Resultados de clasificacion

    5.4. Conclusiones y Trabajo a furturo

  • 5.4. Conclusiones y Trabajo a furturo 60

    Figura 5.6: Binarizado y Filtrado de la maografa

  • 5.4. Conclusiones y Trabajo a furturo 61

    Figura 5.7: Escaneo y Segmentacion del musculo Pectoral

  • 5.4. Conclusiones y Trabajo a furturo 62

    Figura 5.8: Supresion del musculo Pectoral

  • 63

    Captulo 6

    Conclusiones y Trabajos a futuro

    6.0.1. Conclusiones

    La aportacion principal de estre trabajo es el diseno de una nueva metodologa para la segmentacion yclasificaion de las mamografas digitales, esta metodologa hace uso de vectores de gran tamano por elnumero de caractersticas utilizadas, sin embargo da buenos resultados.

    En la clasificacion con memorias asociativas tipo min en las que se considera el ruido aditivo de lasimagenes, observando que a la hora de clasificar da buenos resultados porcentuales.

    Dentro de los objetivos especficos, el primero consistio en mejorar la calidad de la imagen por locual se aplicaron filtros: el de la semilla y por Histograma para quitarle ruido a la imagen y mejorarlaa la hora de segmentar.

    El segundo objetivo consistio en segmentar la region mamaria para obtener menos margen de rui-dos externos, como la supresion del musculo Pectoral y demas etiquetas que no pertenecen a la regionde la mama, esto es porque puede causar ruido a la hora de extraer caractersticas, ademas de que lascaracteristcas adquiridas solo pertenecen a la region de interes, en esta etapa se obtuvo un porcentajedel 91 % de extracciones correctas de la region mamaria.

    Para la extraccion de caracteristicas se disenaron diferentes algoritmos, los cuales obtienen datos es-pecficos de la imagen, que en conjunto forman el vector de clasificacion.

    Finalmente a la hora de clasificar se observo que se obtuvieron buenos resultados a la hora de cla-sificar ya que se obntuvo un porcentaje de 85 % exactitud a la hora de clasificar, lo cual representa unbuen resultado.

    6.0.2. trabajos a Futuro

    Para aquellos investigadores que deseen profundizar sobre el tema de deteccion de cancer en mamografasDigitales, se proponen los siguientes trabajos:

    1. Desde el punto de vista de la segmentacion se pueden hacer cambios al algoritmo para mejorar elproceso de extraccion de la region de interes.

    2. Para la extraccion de caracteristcas se podrian usar otras propuestas, minimizar las menos efec-tivas y agregar mejores datos.

  • 64

    3. Pruebas con las demas mamografas de la base de datos mini-MIAS.

    4. Realizar pruebas con otro banco de mamografas Digitales con la misma metodologa.

    5. Implementacion de la aplicacion en dispositivos mas rapidos como los FPGAs.

    6. Utilizar algun otro algoritmo de clasificacion para realizar pruebas.

  • 65

    Bibliografa

    [1] G. Tzanetakis and P. Cook, Musical genre classification of audio signals, Speech and AudioProcessing, IEEE Transactions on, vol. 10, pp. 293 302, Julio 2002.

    [2] T. Gault, E. Mostafa, A. Farag, and A. Farag, Less is more: Cropping to improve facial recogni-tion with thermal images, in Multimedia Technology (ICMT), 2011 International Conference on,pp. 6445 6449, Julio 2011.

    [3] N. Gal and V. Stoicu-Tivadar, Computer assisted medical image interpretation using fuzzy logic,in Soft Computing Applications (SOFA), 2010 4th International Workshop on, pp. 159 163, Julio2010.

    [4] Z. M. Win and M. M. Sein, Fingerprint recognition system for low quality images, in SICEAnnual Conference (SICE), 2011 Proceedings of, pp. 1133 1137, Septiembre 2011.

    [5] S. Bakshi, S. Das, H. Mehrotra, and P. Sa, Score level fusion of sift and surf for iris, in Devices,Circuits and Systems (ICDCS), 2012 International Conference on, pp. 527 531, Marzo 2012.

    [6] A. Kumar, M. Hanmandlu, A. Das, and H. Gupta, Biometric based personal authentication usingfuzzy binary decision tree, in Biometrics (ICB), 2012 5th IAPR International Conference on,pp. 396 401, 29 2012-april 1 2012.

    [7] P. Sukarno, N. Bhattacharjee, and B. Srinivasan, Increasing level of confidence of iris biometricmatching, in Neural Networks (IJCNN), The 2012 International Joint Conference on, pp. 1 8,Junio 2012.

    [8] A. Kumar and T.-S. Chan, Iris recognition using quaternionic sparse orientation code (qsoc), inComputer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE Computer SocietyConference on, pp. 59 64, Junio 2012.

    [9] Z. Zhou, E. Du, N. Thomas, and E. Delp, A new human identification method: Sclera recognition,Systems, Man and Cybernetics, Part A: Systems and Humans, IEEE Transactions on, vol. 42,pp. 571 583, Mayo 2012.

    [10] P. Thumwarin, N. Chitanont, and T. Matsuura, Iris recognition based on dynamic radius matchingof iris image, in Electrical Engineering/Electronics, Computer, Telecommunications and Informa-tion Technology (ECTI-CON), 2012 9th International Conference on, pp. 1 4, Mayo 2012.

    [11] M. Wilber, W. Scheirer, and T. Boult, Privv: Private remote iris-authentication with vaulted verifi-cation, in Computer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE ComputerSociety Conference on, pp. 97 104, Junio 2012.

  • BIBLIOGRAFIA 66

    [12] K. Wang, B. Babenko, and S. Belongie, End-to-end scene text recognition, in Computer Vision(ICCV), 2011 IEEE International Conference on, pp. 14571464, Noviembre 2011.

    ResumenAbstractndice de Algoritmosndice de figurasIntroduccinAntecedentesCncer de mamaMamografa DigitalClasificacin

    ObjetivosObjetivo generalObjetivos especficos

    JustificacinContribucionesOrganizacin del documento

    Estado del ArteMtodos ExperimentalesSegmentacin de la regin de la mama usando contornos activosTcnica para preprocesamiento de mamografas digitalesSistema asistido por computadora para la deteccin de cncer de mamaidentificacin del musculo pectoral en mamografasEvaluacin automtica de la densidad del tejido mamario en las mamografas digitalesSegmentacin de mama con supresin de musculo PectoralDeteccin temprana de cncer de mama utilizando SVM como clasificador

    Bases de Datos de MamografiasMIAS

    Marco ToricoSegmentacin de imgenesUmbralizacinRegin Creciente

    Extraccin de caractersticasMediaDesviacin EstndarSuavidadAsimetraUniformidadCurtosisHistograma Medio

    Memorias Asosiativas Alfa BetaOperaciones Binarias y

    Modelo PropuestoSegmentacin de mamografasImagen DigitalSegmentacin

    Extraccin de caractersticasMximoMnimoModaDesviacin EstndarAsimetraUniformidadCurtosisHistograma MedioAlgoritmos

    ClasificacinManejo de las caractersticas adquiridasfase de recuperacin

    ResultadosSegmentacin de las mamografasExtraccin de caracteristicasClasificacinConclusiones y Trabajo a furturo

    Conclusiones y Trabajos a futuroConclusionestrabajos a Futuro