362-737-1-PB

16
Red Neuronal Artificial ART2 para la agrupación dé datos Artificial Neuronal NerVvork ART2 for Clustering Data Fecha de recepción: , '30 de marzo de 2007 Fecha de aceptación: 13 de julio de 2007 .: Jorge E. Rodríguez' RESUMEN Es'te artículo se presenta como un avance parciál del proyecto de investi- í gación Desarrollo de Herramientas para Minería de Datos-UDMiner, en el que se muestra la implementación de una red neuronal tipo resonancia adaptativa, ART2, empleada para la agrupación de datos. Se compara la técnica implementada con el algoritmo EM y los mapas autoorganizativos de Kohonen. Palabras clave Minería de datos, grupo, red de résonanda adaptativa, mapasautoorgani- zativos, algoritmo EM. ABSTRACT y i In this paper, we present a partial advance of the project of development investigation of,tools for data mining, which consists on the implementa- tion of Adaptative Resonance Network (ART2) for the clustering data. The implemented technique is compared with Self-Organizing Maps and the algorithm EM (Expectatión Maximization) with the púrpose of measuring the clustering effectiveness., Universidad Distrital Francisco _ losé de Caldas, Grupo de Investigación en Inteligencia Artificial. jrod ri@ ud istrital.edu.co 261 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

description

sdadsad

Transcript of 362-737-1-PB

  • Red Neuronal Artificial ART2 para la agrupacin d datos

    Artificial Neuronal NerVvork ART2 for Clustering Data

    Fecha de recepcin: , '30 de marzo de 2007 Fecha de aceptacin: 13 de julio de 2007 .:

    Jorge E. Rodrguez'

    RESUMEN Es'te artculo se presenta como un avance parcil del proyecto de investi-

    gacin Desarrollo de Herramientas para Minera de Datos-UDMiner, en el que se muestra la implementacin de una red neuronal tipo resonancia adaptativa, ART2, empleada para la agrupacin de datos. Se compara la tcnica implementada con el algoritmo EM y los mapas autoorganizativos de Kohonen.

    Palabras clave Minera de datos, grupo, red de rsonanda adaptativa, mapasautoorgani-zativos, algoritmo EM.

    ABSTRACT yi In this paper, we present a partial advance of the project of development

    investigation of,tools for data mining, which consists on the implementa-tion of Adaptative Resonance Network (ART2) for the clustering data. The implemented technique is compared with Self-Organizing Maps and the algorithm EM (Expectatin Maximization) with the prpose of measuring the clustering effectiveness.,

    Universidad Distrital Francisco_ los de Caldas, Grupo de Investigacin en Inteligencia Artificial. jrod ri@ ud istrital.edu.co

    261 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • Key words Data mining, cluster, adaptative resonance network, self-organizing maps, algorithm EM.

    INTRODUCCIN El objetivo de la agrupacin de datos es obtener grupos o conjuntos de ele-

    f. mentos entre los elementos de X, de manera que los elementos ,asignados al mismo grupo sean similares. Un grupo es una coleccin de datos semejantes a otros de un mismo grupo y diferentes a los objetos de otros grups [1] :

    El anlisis de agrupacin es un conjunto de metodologas para clasificacin automtica de muestras entre un nmero de grupos usando medidas de aso-ciacin. Es decir, las muestras en un grupo son similares; las pertenecientes a otros grupos son diferentes [2].

    El anlisis de grupos, tambin llamado segmentacin de datos, tiene gran variedad de metas, todas referidas a una coleccin de grupos ,o segmentos de objetos entre subconjuntos "grupos", de modo que los grupos de un mismo objeto estn estrechamente relacionados entre s, y difieren notablemente con grupos de otros objetos. Un objeto puede ser descrito por un conjunto de medidas o por sus relaciones con otros objetos [3].

    El anlisis de grupos puede ser una herramienta estndar para bneficiar la percepcin en la de la distribucin de los datos, para observar las caracters-ticas de cada grupo y para enfocarse en una coleccin particular de grupos con el fin de lograr mayor exploracin. Alternativamente, puede servir cmo tcnica para preprocesar datos, tal como caracterizacin y clasifiacin, los cuales podran operar sobre los grupos descubiertos.

    La agrupacin de datos contribuye a reas de investigacin, incluidos Minera de Datos, estadsticas, aprendizaje computacional, tecnologa de bases de datos espaciales, biologa, mercadeo, etc. Como consecuencia de la gran cantidad de informacin de las bases de datos, el anlisis de grupos ha llegado a ser un tema importante en la investigacin de Minera de Datos. Como una rama de la estadstica, el anlisis de grupos ha sido estudiado por varios aos, con-

    262 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO

  • centrndose principalmente en la distancia basada en el anlisis de grupos. Las herramientas basadas en K-means, K-medoids y otros mtodos tambin han sido construidos dentro de varios paquetes o sistemas de software de anlisis estadstico, como S-Plus, SPSS y SAS. En aprendizaje computacional, la agrupacin es un ejemplo de aprendizaje no supervisado.

    En Minera de Datos, algunos esfuerzos se han enfocado en encontrar mtodos eficientes para el anlisis de grupos en las grandes bases de datos. Recientes temas de investigacin se estn orientando en la escalabilidad de los mtodos de agrupacin, mayor eficiencia de los mtodos para la agrupacin de formas complejas y tipos de datos, tcnicas de agrupacin de alta dimensionalidad y mtodos de agrupacin para datos mixtos numricos y categricos en grandes bases de datos.

    En el artculo se muestra el proceso de desarrollo y validacin de una herra-mienta para la agrupacin de datos, cuyo propsito es extraer conocimiento til a partir de los datos. Se utiliza como tcnica de agrupacin una red neuronal artificial, llamada Red de Resonancia Adaptativa.

    El artculo se encuentra estructurado en: 1) Requerimientos y mtodos de agrupacin de datos, donde se presenta una resea referente a escalabilidad y capacidad para manejar diferentes tipos de datos. 2) Mtodos de agrupa-cin (basados en particionamiento, jerrquicos, basados en grid, basados en densidad, y basados en el modelo). 3) Red de resonancia adaptativa, aqu se presenta la teora utilizada en la red ART2, junt con su arquitectura, haciendo nfasis en el subsistema de orientacin y de atencin. 4) Anlisis de resultados. Para tal fin se toman diferentes conjuntos de datos, provenientes de la WEB, y se hace la comparacin con Mapas Autoorganizativos de Kohonen y el al-goritmo EM (Maximizacin de la Esperanza). 5) Finalmente, se plantean las conclusiones obtenidas del avance parcial de investigacin y se deja abierta la posibilidad realizar trabajos futuros.

    263 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • REQUERIMIENTOS DE LA AGRUPACIN EN LA MINERA DE DATOS [1]

    Escalabilidad Existen algoritmos de agrupacin que funcionan bien en pequeas coleo- ciones de datos (por ejemplo, 200 datos). Sin embargo, una gran base de datos contiene millones de objetos. La agrupacin sobre un patrn"en una gran coleccin de datos puede conducir a predisponer resultados, es decir, normalmente funcionan bien con pocos datos.

    Capacidad para manejar diferentes tipos de datos Diferentes algoritmos son diseados para grupos de intervalos de datos nu-mricos; no obstante, las aplicaciones pueden requerir agrupacin d 'otros tipos de datos, por ejemplo binarios, nominales, y ordinales, o mezclas de estos tipos de atributos.

    Grupos de formas arbitrarias Algunos algoritmos de agrupacin estn basados en las medidas de distan!- cia euclidiana o Manhattan. Estos tienden a encontrar grupos esfricos con similar tamao y densidad. Sin embargo, un conjunto de datos podra ser de cualquier forma. Es importante desarrollar algoritmos que puedan descubrir grupos de forma arbitraria.

    Requerimientos mnimos para especificar parmetros Un alto nmero de algoritmos de agrupacin requieren especificar 'par-metros en el anlisis de grupos (como el nmero de grupos deseados). La agrupacin puede ser totalmente sensible a la especificacin de parnetros. Los parmetros pueden ser, con frecuencia, difciles de determinar, sobre todo con colecciones de datos contenidas en objetos de alta dimensionalidad.

    Habilidad para tratar con datos ruidosos La mayora de bases de datos del mundo real contienen datos faltantes, datos sin conocer o datos errneos. Algunos algoritmos de agrupacin son sensibles a tales datos y pueden conducir a grupos de baja calidad.

    o

    264 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • Independencia en el orden de los registros Existen algoritmos de. agrupacin sensibles al orden de especificacin de los datos; por ejemplo, la misma coleccin de datos, cuando se presenta con diferente disposicin en un algoritmo, puede generar diferentes grupos.

    Alta dimensionalidad Una base de datos puede contener diversas dimensiones o atributos. La mayora de los algoritmos de agrupacin funcionan bien con datos de baja dimensionalidad, que involucran solo dos o tres dimensiones. Los humanos somos buenos para juzgar la calidad de agrupacin por debajo de tres dimen-siones. Esto est desafiando al anlisis de grupos con alto espacio dimensional, en especial considerando que tales datos pueden ser escasos.

    Interpretabilidad y usabilidad Los que aplican la agrupacin esperan que los resultados de sta sean inter-pretables, comprensibles y usables.

    MTODOS DE AGRUPACIN Existe un gran nmero de algoritmos de agrupacin en la literatura. Escoger uno depende del tipo de datos y del propsito mplicaciti del algoritmo. Si el anlisis de agrupacin se usa como herramienta descriptiva o explorativa, es posible probar diferentes algoritmos sobre el mismo dato para ver sus resultados. En general, los principales mtodos de agrupacin pueden ser clasificados en las siguientes categoras.

    Mtodos de particionamiento Dada una base de datos de n objetos o registro de datos, un mtodo de par-ticionamiento construye K particiones sobre los datos, donde cada particin representa un grupo con k

  • Dado K, el nmero de particiones por construir un mtodo de particio-namiento crea una particin inicial. Esta usa una tcnica de relocalizacin iterativa que procura perfeccionarla particin por movimiento de objetos de un grupo a otro. El criterio general de un buen particionamiento es que los objetos del mismo grupo son "cercanos" o relacionados los unos con los otros, mientras que los objetos de diferentes grupos son "apartados" o muy diferentes.

    Para llevar a cabo una buena agrupacin basada en particionamiento, se podra requerir una numeracin exhaustiva de las posibles particiones. En cambio, la mayora de aplicaciones adoptan heursticos: 1) el algoritmo k-means, en el que cada grupo es representado po'r el valor medio de los objetos en el grupo, y 2) el algoritmo k-medoids, en el que cada grupo es representado por uno de los objetos localizado cerca del centro del grupo. Estos mtodos heursticos funcionan bien con grupos esfricos y con bases de datos de pequeo y mediano tamao. Si las bases de datos, forma compleja o son de gran tamao, el mtodo de particionamiento k-medoids necesita ser extendido [1].

    Mtodos jrrqdicos Un mtodo jerrquico crea una' descomposicin jerrquica de ua'coleccin dada de datos. Considerando que los mtodos basados en particin inician especificariddun riinero de grupos y busan, a travs de posibles asignaciones de grupos de puntos, encontrar una funcin' que perfeccione el grupo, los mtodos jerrquicos unen gradualmente puntos o dividen supergrripos [4].

    Un mtodo jerrquico puede ser clasificado en aglornerativo o` divisivo, dependiendo de cmo se confrma la descomposicin jerrquica. La forma aglomerativa tambin llamada fornia bttom-up, comienza forrriando un grPo separdo. Con cada objet. Este une" 'sucesivamente ls objetos o grupos cercanos a otros hasta que todos los grupos se unen en uno (el mayor nivel de la jerarqua) o hasta que se cumple determinada condicin. El mtodo divisivo, tambin llamado top-down;'comienza con todos los objetos de un mismo conjunto. En cada iteracin sucesiva, un grupo es dividido en peque-os grupos hasta que, eventualmente, caa objeto est`Cientro de un grupo o hasta que se cumpla determinada condicin.

    266 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO

  • Mtodos basados en la densidad La mayora de los mtodos de particionamiento agrupan objetos basados en la distancia entre stos. Tales mtodos pueden trabajar con grupos de forms esfricas y encontrar dificultades al descubrir grupos con formas arbitrarias: Otros mtodos de agrupadn se han desarrollado basados en la nocin de densidad. Su idea general es continuar extendiendo el grupo dado, tan extenso como la densidad (nmero de objetos o datos) en la "vecindad", excediendo algunos umbrales; es decir, por cada dato sin un grupo dado, la vecindad de un radio contiene un mnimo nmero de puntos. Tal mtodo puede ser usado para filtrar ruido y descubrir grupos de formas arbitrarias.

    Mtodos basadosenGrid , Cuenta los espacios de objetos dentro de uri nmero infinito de celdas' que forman una estructura grid. Todas las operaciones de agrupacin son rea-lizadas sobre la estructura del grid (ejemplo, la contabilizacin de los espa-cios). Las principales ventajas de esta forma es que este tiene un tiempo de procesamient o rpido, generalmente independiente del nmero de objetos, pues depende solo del nmero de celdas en cada dimensin de los espacios contabilizados.

    Mtodos basados en el modelo Este mtodo encuentra un modelo para cada grupo y los datos ms ade-cuados para este modelo. Un algoritmo basado" en el modelo puede localizar grupos para crear una funcin de densidad que refleje la distribucin espacial de los datos puntuales. Tambin puede determinar el nmero de grupos basados en una estadstica estndar, tomando los objetos ruidosos dentro de un grupo para dar robustez a los mtodos de agrupacin.

    RED DE RESONANCIA ADAPTATIVA (ART2) Una de las caractersticas de la memoria humana consiste en su habilidad para aprender nuevos conceptos sin olvidar otros aprendidos en el pasado. Sera deseable que esta misma capacidad se pudiera conseguir en las redes neuro-nales artificiales. Sin embargo, muchas de stas tienden a olvidar informacin pasada al tratar de ensearle nueva. En respuesta Grossberg, Carpenter y otros desarrollaron la denominada teora de la resonancia adaptativaART [5]. Este

    267 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • modelo se basa en la idea de hacer resonar la informacin de entrada con los prototipos o categoras que reconoce la red. Si entra en resonancia con alguno (es suficientemente similar), la red considera que pertenece a dicha categora y se realiza una adaptacin que incorpora algunas caractersticas de los nuevos datos a la categora existente. Cuando no resuena con ninguno (no se parece a ninguna de las categoras existentes), la red se encarga de crear una nueva categora con el dato de entrada como prototipo de la misma.

    Esta teora se aplica a sistemas competitivos (redes con aprendizaje compe-titivo) en los cuales, cuando se presenta cierta informacin de entrada solo se activa una de las neuronas de salida de la red (o una por cierto grupo de neuronas) alcanzando su valor de respuesta mximo despus de competir con las otras. Esta neurona recibe el nombre de vencedora [5].

    Existen tres elementos bsicos para el aprendizaje competitivo [6] :

    A. Un conjunto de neuronas iguales, excepto los pesos, definidos aleatoria-mente, y que por consiguiente responde de manera diferente a cada de patrn de entrada.

    B. Un lmite impuesto a cada neurona.

    C. Un mecanismo que permite a las neuronas competir para responder bien a un subconjunto dado de entradas, tal que solo se activa una neurona de salida o solo una neurona por grupo.

    Una red ART2 consta de dos capas entre las que se establecen conexiones hacia adelante y hacia atrs (feedforward/feedback). La estructura general de una red ART2 se muestra en la figura 1.

    268 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • 269

    Subsistema de orientacin Capa F2

    1111 I /MIK

    O

    11/ %I! III E 1 111 1 P " I I I KIW4 .nn Ws [1 KM

    Subsistema de atencin

    Capa Fl

    o El El ] II 01

    o +

    Vector de entrada

    Figura 1 Arquitectura de la red ART2 [7].

    A continuacin se har un resumen del funcionamiento de la red ART2 [7].

    La capa F1 se encuentra dividida en seis subcapas: w, x, u, v, p y q. Todos los nodos marcados con una G (llamadas unidades de control de ganancia) envan una seal inhibitoria no especfica a todas las unidades de la capa a la que llegan. Todas las subcapas de F1, as como la capa r del subsistema de orientacin, tienen el mismo nmero de unidades. Las subcapas individuales de Fl estn conectadas de unidad a unidad; esto es, las capas no estn com-pletamente interconectadas, con la excepcin de las conexiones ascendentes que llegan a F2 y de las conexiones descendntes de F2.

    El subsistema de orientacin detecta la falta de coincidencia entre las tramas ascendentes y descendentes de la capa F 1 . Esta utiliza para determinar la

    e: CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • coincidencia, una magnitud que recibe el nombre de parmetro de vigilancia y suele identificarse mediante el smbolo p. El valor del parmetro de vigi-lancia mide hasta qu grado discrimina el sistema entre distintas clases de tramas de entrada.

    El control de ganancia se utiliza cuando se implementa una red Rt2 donde la capa F2 podra recibir entradas de otra capa por encima de ella (dentro de una jerarqua de redes pertenecientes a un sistema mayor), as corno de la capa Fl, situada ms abajo. Este control impide que una trama que entre por encima de la capa F2, se cruce o se compare con otra trama que ha" entrado al mismo tiempo por la capa F 1 .

    El subsistema de atencin est compuesto por las dos capas de elementos de procesamiento, Fl y F2, y un sistema de control de ganancia.

    Procesamiento en F1. La actividad de las unidades de la subcapa F 1 est gobernada por la ecuacin de la forma

    Exk = Ax k + ( Bxk )J+k (c Dxk )Jk

    donde A, B, C, y D son constantes; eh+ y jk representan e inhibitorios netos, respectivamente. Las actividades capas de F1 se pueden resumir mediante las siguientes

    = + aui

    (1)

    factores excitatorios de cada una de las seis

    ecuaciones:

    (2)

    (3)

    (4)

    (5)

    , (6)

    ( 7 )

    e +11wii = f(X;) bf(q) _

    p=u+Zg(y)zu

    19, qt

    270 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • Los factores de las ecuaciones para todas las capas de Fl y para la capa r son: I, es la i-sima componente del vector de entrada. Los parmetros a, 17, c, d son constantes. La constante e recibe tpicamente un valor positivo y conside-rablemente menor que 1, tiene el efecto de mantener finitas las activaciones cuando no est presente ninguna entrad en el sistema, y, es la actividad de la j-sima unidad de la capa F2 y g(y) es la funcin de salida de F2.

    Las tres unidades de control de ganancia de Fl inhiben de manera no espe-cifica las subcapas x, u y q. La seal inhibitoria es igual al mdulo del vector de entrada que llega a esas capas..

    La forma de la funcin F(x) determina la naturaleza de mejoramiento de contraste que tiene lugar en F 1 . La eleccin lgica para esta funcin podra ser una sigmoide; aqu se presenta la opcin de Carpenter:

    f(x) = {0 O x > O (8)

    donde O es una constante positiva y menor que 1.

    Del anlisis de la capa F1, se puede concluir que esta lleva a cabo una nor-malizacin y una operacin de mejoramiento de contraste. Antes de inten-tar buscar coincidencias en s, se deben considerar los detalles del resto del sistema.

    Procesamiento en F2. El procesamiento de F2 est dado por la siguiente ecuacin:

    (9) La competencia de F2 da lugar a un mejoramiento de contraste, en el cual se selecciona un nico nodo ganador.

    La funcin de salida de F2 est dada por:

    ci T=max{n}ek g (Y.; ) = to en caso contrario (10)

    271 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO C:,

  • La ecuacin 10 supone que el conjunto {T k} contiene nicamente aquellos nodos que no hayan sido restaurados recientemente por el subsistema d orientacin.

    Ecuaciones de LTM (memoria a largo plazo). Tanto las ecuaciones ascen-dentes como las descendentes tienen la misma forma:

    zi, = g(y,)(p, - z) para los pesos ascendentes cksckv i al FI hasta v en F2, y

    z. = g(Y ;)(p; zu) (12) para los pesos descendentes que van desde v. en F2 hasta v i en F1.

    ZJi = d (u; + dZi., (13) De forma similar

    z, , = d(u - 11) (14)

    El subsistema de orientacin. La ecuacin de las actividades de los nodos de la capa r tiene la forma

    U, "fcp, 11u 11+11c7911 (15)

    La condicin para que produzca la restauracin es

    (16) fi > 1 donde p es el parmetro de vigilancia. El valor del parmetro de vigilancia mide hasta qu grado discrimina el sistema entre distintas clases de tramas de entrada.

    Iniciacin de LTM (memoria a largo plazo) ascendente. Los valores iniciales para los vectores de pesos ascendentes estn dados por la ecuacin.

    272 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO

  • 1 Z ' 5- (1- d),/,14 (17)

    donde M es el nmero de unidades de cada subcapa de Fl.

    El proceso tambin puede llevarse a cabo mediante la implementacin de mapas autoorganizativos de Kohonen. ste es un modelo aceptable para en-contrar relaciones entre grupos complejos al basarse en el manejo de vecindad para agrupar; sin embargo, una limitante es el alto costo computacional que implica su ejecucin [8]. Este modelo fue un desarrollo previo a la implemen-tacin de la red ART2, presentada como un avance parcial de investigacin, del cual se muestran los resultados obtenidos para algunos conjuntos de datos en la tabla 1. Para mayor informacin acerca de este desarrollo, remtase a [8], donde encontrar la teora empleada en los mapas autoorganizativos de Kohonen y las especificaciones de la implementacin.

    ANLISIS DE RESULTADOS Para validar el software desarrollado, se utilizaron diferentes conjuntos de datos (tomados de http://www.ics.uci.edui mlearn/MLRepository.html). Para cada uno se realizaron 10 pruebas con el fin de medir la efectividad del modelo neuronal ART2 en la agrupacin de datos. Se hace una comparacin del modelo implementado frente al modelo de mapas autoorganizativos de Kohonen y el algoritmo EM (Expectation Maximization). Para este ltimo se utiliz la herramienta WEKA (Entorno para el Anlisis de Conocimiento de la Universidad de Waikato). Ver tabla 1.

    En cuanto a la configuracin de la red ART2, luego de realizar las respectivas pruebas con cada uno de los conjuntos de datos; se obtiene: el valor medio para el parmetro de vigilancia es 0.4; para la constate e es 0.2: Para las dems constantes no se pudo establecer un valor medio.

    En trminos generales, la efectividad de agrupacin de la red ART2 es superior a los mapas autoorganizativos de kohonen y al algoritmo EM al obtener una efectividad promedio del 69.12%.

    273 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO C y

  • Tabla 1 Efectividad de la agrupacin.

    Conjunto de datos

    Algoritmo EM Kohonen

    Mapas auto- organizativos de ART2

    Efectividad de

    agrupacin Tiempo

    Efectividad de

    agrupacin - Tiempo

    Efectividad de

    agrupacin ' Tiempo

    Soybean 73% 3 min 1 seg 57% in 40 1 meg s 94.7% 11 seg

    Contact-lences 33% 1 seg 0% 1 seg 0% 1 seg

    Led7_data 100% 4 seg 80% 8 seg 70% ' 3 seg

    Vehicle_data 0% 1 min 15 seg 75% 15 seg r .

    10b/0 6 seg

    Satlmage 83.3% 1 min 50 seg 83% 4 min 50 seg .50% :

    1 min 42 - seg

    Wine_data 100% 2 seg 67% 2 seg 100% .. , 2 seg

    Promedio de la agrupacin 64.88% 60.33% 69.12%

    Existen casos particulares en los cuales no se logra obtener una buena agru- ,

    pacin, como el del conjunto de datos CONTACT-LENCES, en el cual el porcentaje de agrupacin es del 0%. La razn est en que, para esteejemplo, no se logr determinar una configuracin aceptable para la red ART2, siendo esta una limitante del modelo implementado.

    Adems, se observa que la calidad de agrupacin obtenida oil 'ART2 del conjunto de datos SATIMAGE es inferior a la obtenida con los otros dos modelos, alcanzndose solo un 50% de agrupacin. La explicadti x radica en que el funcionamiento de la red ART2 tiende a degradarse cuando el volumen de instancias es alto (la degradacin del funcionamiento se puede contrarrestar con una buena configuracin de la red).

    CONCLUSIONES

    La red neuronal ART2 es una tcnica viable para la agrupacin" de datos, dada su alta efectividad; sin embargo, la configuracin del parmetro de vigilancia debe hacerse utilizando heursticas o, en el peor de los casos, a travs de la experimentacin. Esto implica que si el parmetro empleado no es adecuado, la efectividad de agrupacin es baja.

    274 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO

  • El modelo ART2 es una de las redes neuronales artificiales ms poderosas debido a su capacidad de autoorganizacin, aprendizaje no supervisado y ONLINE, pero tambin es una de las ms complejas en cuanto a su imple-'tentacin. Adems, al ser expuesta a una gran cantidad de datos puede degradarse su buen funcionamiento.

    Con el presente desarrollo se observa que la red neuronal ART2 es eficiente para encontrar relaciones entre grupos. Esto se corrobora con la comparacin hecha con otras tcnicas de agrupacin (algoritmo EM, mapas autoorganiza-tivos), en los que con el modelo ART2 se obtuvo la mayor eficiencia (69.12%). Del mismo modo, se destaca que de las tres tcnicas implementadas, ART2 es la que menor tiempo emplea para generar grupos.

    TRABAJOS FUTUROS 1

    Actualmente se est trabajando en un prototipo de software para la agrupa- cin de datos a partir de la implementacin del algoritmo GTM (Generative Topographic Mapping) y se tiene previsto la implementacin de tcnicas evolutivas con el fin de configurar automticamente los parmetros de la red ART2.

    BIBLIOGRAFA [1] Han, J., y Kamber, M., Data Mining: Concepts and techniques; San Diego USA. Morgan Kaufmann, 2001, pp. 335-346.

    [2] Kantardzic, M., Data Mining: Concepts, Models, Methods, and Algo-rithms, New Jersey USA. Wiley Interscience, 2001, p. 117.

    [3] Hastie, T., TIBSHIRANI, R., and FRIEDMAN, J., The Elements of Statistical Learning. Heidelberg Canada. Springer, 2001, p. 453.

    [4] Hand, D., Mannila, H., and SMYTH, P., Principies of Data Mining, London England. The MIT Press, 2001, p. 308.

    [5] Hilera, J., y Martnez, V., Redes neuronales artificiales., Wilmington USA. Addison Wesley Iberoamericana, 1995, pp. 219-220.

    275 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO

  • [6] Haykin, Neural Networks: "A comprehenSive foundation", New JereSr USA. Prentice Hall, 1999, p. 58.

    [7] Skapura, D. y Freeman, J., Redes noronales, algoritmos, aplicaciones y tcnicas de progrdmacin, Madrid _Esparia. Daz de Santos, 1993, pp. 335-343.

    [8] Bautista, S., Reyes, A., y Rodrguez, J., "Prototipo de software para la agrupacin de datos con una red heuronal artificial con topologa de Kohonen", Bogot Colombia. Tecnura, Ao 8, No. 15., 2004, p. 65.

    276 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO