Deep Neural Networks - uchile.cl

Post on 25-Jul-2022

11 views 0 download

Transcript of Deep Neural Networks - uchile.cl

Deep Neural NetworksMatías Silva Cares

17/11/2016

Overview

1. Redes neuronalesa. Motivaciónb. Orígenc. Estructurad. Aplicaciones

2. Redes neuronales profundasa. Conceptob. Redes neuronales convolucionalesc. Redes neuronales recurrentes

NN: Motivación

NN: Orígen

• 1943 (McCulloch & Pitts): Inspiración biológica para generar modelo matemático.

• 1951 (Minsky & Edmons): Primera implementación en hardware

NN: Orígen

• 1958 (Rosenblatt): Concepto de perceptrón

NN: Orígen

• 1980-90 : Aplicación de BackPropagation, aparición de redes convolucionales y recurrentes.

• 1993 (Yann LeCun): CNN aplicado a imágenes

NN: Orígen

• 2006 : Aparición del DeepLearning, entrenamiento de una red con muchas capas.

• 2012 (Kriztevsky & Sutskever): Ganadores del ImageNet Classification bajando 10 puntos la tasa de error de clasificación usando CNN.

Estructura

• Perceptrón (Unidad)• Perceptrón Multicapa• Función de activación.• Backpropagation - Gradiente descendiente.• DataSet: Entrenamiento, Validación, Test.• Batches• Regularización

Simulación MLP

http://playground.tensorflow.org/

Aplicaciones NN

Clasificadores.

Detector de patrones.

Predicciones de mercado.

Compresión de imágenes.

Deep Neural NetworksMás capas...

Concepto: ¿Por qué más capas?

• Mayor dimensionalidad .• (Abarcar modelos más complejos).

• Computadores más veloces para procesar.• (Poder entrenar)

• Usar redes para elegir mejores features.• (Lo importante).

CNN

• Paradigma: Extracción de features simples a más complejos.• Nueva estructura para clasificar imágenes, aprovechando

espacialidad.• Obtuvo resultados notables en competencia de clasificación de

imágenes.• Se considera “Deep” dada su estructura con muchas capas (de

diferente procesamiento).• Aplicaciones orientadas a procesar imágenes o datos donde la

espacialidad sea algo importante.

CNN: Paradigma

CNN: Esquema

CNN: Parámetros

• Ventaja de escalabilidad.• Uso de arquitectura es heurística.• Parámetros:

• Filtros, padding.• Subsampling (Pooling).• Regularización.

• Estrategias:• Generalización (Dropout).• Transfer Learning (Clasificación con pocos datos).

CNN: Conclusiones

• Uso para datos con importancia espacial (Imágenes).• Definir arquitectura no es fácil y requiere práctica

(Prueba y error).• Requiere mucho procesamiento en el entrenamiento.• Aplicaciones:

• Clasificación de objetos en imágenes.• Filtros de fotografía (Deep-Art & Deep-Dream)

CNN: Deep-Art

CNN: Deep Dream

RNN

• Paradigma: Retroalimentar neuronas para considerar en la decisión el valor obtenido en el frame anterior.

• Se considera “Deep” dada su estructura con muchas capas (al “estirar” las recurrencias).

• Aplicaciones orientadas a procesar datos temporales.• Predicción de palabras y oraciones.

RNN

Deep Neural NetworksMatías Silva Cares

17/11/2016