Od perceptrónupo hlbokú neurónovú sieť · •Učeniebez učiteľa(unsupervised learning)...

Od perceptrónu po hlbokú neurónovú sieť

Peter Lacko, Fakulta informatiky a informačných technológií, Slovenská

technická univerzita v Bratislave

2S O F T E C O NMiesto pre Vaše logo

Prečo sú neurónové siete dnes populárne?

• BIG DATA

• Zhromažďujú sa veľké objemy dát, vytvorila sa infraštruktúra

• GPUs

• NVidia Tesla P100 GPU dokáže dodať výpočtový výkon 4.7Tflops

pričom spotrebuje len 250W elektrickej energie

• Podľa zoznamu TOP500 by počítač s takýmto výkonom bol

najlepším superpočítačom na svete v roku 2000

• Veľké spoločnosti

• Firmy ako Google, Microsoft, Baidu a Facebook podporujú výskum

a vývoj v oblasti umelej inteligencie

http://www.nvidia.co.uk/object/tesla-p100-uk.html

https://www.top500.org/lists/2000/06

•Učenie s učiteľom (supervised learning)

• používame množinu označených objektov (vektorov

vlastností, čo môžu byť body obrázku, alebo výsledky

testov pacienta), ku každému objektu máme pridelenú

aj jeho kategóriu, pes, mačka, alebo chrípka, angína.

• regresia, klasifikácia, predikcia

• napr. odhaľovanie podvodného správania u

zamestnancov a zákazníkov, predikcia vývoja cien

Prístupy učenia

•Učenie bez učiteľa (unsupervised learning)

• používame množinu objektov, ktorej prvky nemáme

predom ohodnotené. Snažíme sa týmto objektom

priradiť nejake ohodnotenie (napríklad priradiť ich do

skupiny podobných objektov)

• zhlukovanie, analýza hlavných komponentov (PCA)

• napr. segmentácia zákanzíkov a hľadanie podobných

skupín

Prístupy učenia

•Učenie posilňovaním (reinforcement learning)

•nepoužívame ohodnotené objekty, algoritmus

teda nedostáva “správne” riešenie úlohy , ale

ohodnocujeme jeho správanie (odmena alebo

trest) - teda dávame mu len informáciu, ako

dobre robí to čo má

•napr. získavanie stratégií pri obchodovaní

Prístupy učenia

•DÁTA - musíme im rozumieť

•DÁTA - musí ich byť dostatočné množstvo

•DÁTA - musia obsahovať to, čo potrebujeme

algoritmus naučiť

•Výber a trénovanie modelu

Riešenie problému strojového učenia

Neurónové siete – Perceptrón

• základným stavebným blokom neurónovej siete je neurón a jedným z prvých prístupov učenia bolo použite perceptrónu

•perceptrón je v najjednoduchšej podobe binárny klasifikátor, ktorý mapuje vstupy x na výstupné hodnoty 0 alebo 1 podľa:

•Perceptrón sa trénuje pomocou zmeny váh

tak, že pre každý vstupný vektor z trénovacej

množiny sa vypočíta výstup perceptrónu

a váhy sa upravujú tak, aby sa minimalizovala

chyba klasifikácie.

•Perceptrón rieši LEN lineárne separovateľné

problémy

Čo perceptrón ale nevie

Dopredné šírenie

Viacvrstvové neurónové siete (MLP)

Vstupná vrstva

Výstupná vrstva

Skrytá vrstva

Na trénovanie viacvrstvovej neurónovej siete sa

môže použiť učenie so spätným šírením chyby,

ktoré je založené na vypočítaní chyby na

výstupe neurónovej siete a spätnej propagácii

tejto chyby cez neurónovú sieť s úpravou váh.

Spätné šírenie chyby

Vstupná vrstva

Výstupná vrstva

Skrytá vrstva

• Sieť s jednou skrytou vrstvou je univerzálny aproximátor

• ALE

• Požiadavka na veľkosť skrytej vrstvy môže extrémne narásť

• Problém pretrénovania – sieť negeneralizuje, ale učí sa naspamäť

• Riešenie – hlboké siete

• ALE

• Problém miznúceho a explodujúceho gradientu

• Problém pretrénovania

Od MLP k hlbokým sieťam

Konvolučné siete

H. Lee, R. Grosse, R. Ranganath, and A. Y. Ng. “Convolutional deep belief networks for scalable unsupervised learning of

hierarchical representations.” In ICML 2009.

• Konvolučné neurónové siete sú dopredné neurónové siete

inšpirované vizuálnym kortexom živých organizmov,

úspešne sa používajú na analýzu obrazu a textu

• Počas trénovania si sieť na vrstvách vytvára rôzne stupne

abstrakcie vstupu. Nižšie vrstvy sa špecializujú na

odhaľovanie nízkoúrovňových čŕt, pričom ďalšie vrstvy sa

viacej špecializujú a vytvárajú zložite koncepty

Konvolučné siete

• Pozostávajú zo striedajúcich sa konvolučných a

vzorkovacích vrstiev

• Konvolučná vrstva je reprezentovaná množinou menších filtrov,

ktoré sa postupne aplikujú na celú plochu obrázku.

• Vzorkovacia vrstva sa používa pre nelineárne zmenšenie výstupov

konvolučnej vrstvy (tradične max pooling)

• Výstup celej siete je tvorený vrstvami plne prepojených

neurónov, ako pri normálnych dopredných sieťach

Konvolučné siete

Rekurentné siete

Christopher Olah, Understanding LSTM Networks, 2015, http://colah.github.io/posts/2015-08-Understanding-LSTMs/

• Na rozdiel od dopredných sietí obsahujú aj prepojenia,

ktoré vytvárajú cykly

• Majú schopnosť „pamätať si“ predchádzajúce vstupy

• Používajú sa na sekvenčné množiny dát

• rozoznávanie hlasu, generovanie hlasu

• predikcie počasia

• analýza textu

Rekurentné siete

• Použitie architektúry WaveNet a LSTM siete na predikciu:

• spotreby el. energie

• počasia

• Učenie s posilňovaním na vytváranie povelov nákupu a predaja akcií na burze

• Eyetracking cez webkameru

• Prepis audio záznamu do notového zápisu

• Segmentácia zákazníkov webového portálu

• Predikcia konverzie čitateľa na novinovom portáli so spoplatneným obsahom

Projekty, ktoré riešime FIIT STU

Od perceptrónupo hlbokú neurónovú sieť · •Učeniebez učiteľa(unsupervised learning)...

Documents

Transcript of Od perceptrónupo hlbokú neurónovú sieť · •Učeniebez učiteľa(unsupervised learning)...

Methods in Unsupervised Dependency Parsingrasooli/papers/candidacy2016.pdf · Fully Unsupervised Parsing Models Syntactic Transfer Models Conclusion Methods in Unsupervised Dependency

Unsupervised Learning. Supervised learning vs. unsupervised learning.

Unsupervised DomainAdaptationfor Semantic Segmentation via ...openaccess.thecvf.com/content_ECCV_2018/papers/Yang_Zou_Unsupervised... · Unsupervised DomainAdaptationfor Semantic

LASEROVÝ PROFILOMETER LPM S …Konštrukcia LPM s horizontálnym posuvom (Obr. 1) pozostáva z nosnej hliníkovej konštrukcie na ktorej sú umiestnené výkonné prvky zariadenia.

Unsupervised Learning Clustering Algorithms - IT - websiteafred/tutorials/B_Clustering_Algorithms.pdf · 2 3 Unsupervised Learning Clustering Algorithms Unsupervised Learning -- Ana

Unsupervised Learning Learning Unsupervised...Unsupervised Learning and Data Mining Learning Mining Unsupervised Learning and Data Mining Unsupervised Data Clustering Supervised Learning

Unsupervised icml2012

Quantum speed-up for unsupervised learning - Springer · Quantum speed-up for unsupervised learning ... Keywords Unsupervised learning · Clustering ·Quantum learning · Quantum

Unsupervised Learning

Unsupervised Keypoint Learning for Guiding Class-Conditional Video …papers.nips.cc/paper/8637-unsupervised-keypoint-learning... · 2020-02-13 · Unsupervised Keypoint Learning

Unsupervised Learning - NTU Speech Processing …speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2017/Lecture/auto.pdf · Unsupervised Learning “We expect unsupervised learning to become

Supervised and Unsupervised Land Use Classification746A27/Literature/Supervised and Unsupervised Land... · Supervised and Unsupervised Land Use Classification ... This is done by

07 Unsupervised

Unsupervised and Semi- Supervised Learninglily/Teaching/498FSlides/12-Unsupervised...L. Mihalkova, CSMC498F, Fall2010 Administrativia This week continuing on unsupervised learning

Unsupervised LearningUnsupervised LearningUnsupervised … · 2020. 11. 17. · 4 Unsupervised LearningUnsupervised LearningUnsupervised LearningUnsupervised LearningUnsupervised

Unsupervised Methods

Unsupervised Learning and Data Mining Unsupervised Learning

Unsupervised High-Dimensional Analysis Aligns …_120G8... · Unsupervised High-Dimensional Analysis Aligns Dendritic Cells across ... Unsupervised High-Dimensional Analysis Aligns

Lecture 11 - csd.uwo.ca · Lecture 11 Unsupervised Learning EM. Today • New Topic: Unsupervised Learning • supervised vs. unsupervised learning • unsupervised learning • nonparametric

Bayesian Unsupervised Learning of Higher Order Structurepapers.nips.cc/paper/1293-bayesian-unsupervised-learning... · 2014-04-14 · Bayesian Unsupervised Learning of Higher Order