Programmation graphique du processeur CELL :
Faciliter la programmation
T. Grandpierre
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
Contexte
8 cœurs DSP + 2 threads sur le PowerPC
Communications par DMA
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
Problèmes
1. Découpage (distribution) des tâches sur chaque processeur
2. Allocation mémoire correspondante3. Programmation des transfers DMA4. Génération de code5. Exécution6. Mesure de performances
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
Implantation optimisée d’appli. temps réels :Algo. : parallélisme potentielArchi. : parallélisme disponibleImplantation = distribution + ordonnancement +
optimisation/estimation de performances + génération (code/config. communications)
Contraintes : temps réel, prototypage rapide, hétérogénéité, différents domaines d’expertise
Méthodologie
Adéquation
Méthodologie de conception
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
AAA/SynDEx
Opr1
Com1b
Com1a
Com2b
Com2a Com3a
Opr2 Opr3processeur1 processeur2 processeur3
RAMD/P
SAM
SAMRAMD/P
RAMD
RAMD
RAMD/P
Opr4
RAMD/P
processeur4
in
calc
out
send receiveall.Din/calc
all.Pin
all.Dlin
all.Din/calc
all.Pcalc
all.Dlcalc
all.Poutall.Dlout
all.Dcalc/out
all.Din/calc
loop loop loop loop
endloop endloop endloop endloop
in_ini
in_end
out_ini
out_end
gensig
filtre adap
filtre sub
adap
visu
retard
coeff
processor_( opr1, .) semaphores_(s_empty…)semaphores_(s_empty…) alloc_(type_in/calc...) thread_(comr1a)thread_(comr1a) pre0 (s_empty)pre0 (s_empty) loop_ sucF(s_full)sucF(s_full) send(in/calc)send(in/calc) preE(s_empty)preE(s_empty) endloop_ endthread_endthread_ main_main_ in_ini( )in_ini( ) spawn_thread(com1ra)spawn_thread(com1ra) loop_ sucE(s_empty)sucE(s_empty) in(in/calc)in(in/calc) preF(s_full)preF(s_full) endloop_ in_end ( )in_end ( ) endmain_endmain_endprocessor_
MACROPROCESSEUR
BIBLIOTHEQUEGENERIQUED’EXECUTIF
BIBLIOTHEQUEde macros
COMPILATEUR
Executable1
Executable2
src
BIBLIO. DeFonctions
BIBLIOTHEQUEGENERIQUED’EXECUTIF
1
2
3
4
Architectures multiprocesseurs(Graphe d’architecture)
Adéquation(heuristiques distribution
ordonnancement)
Génération automatique d’exécutifs distribués
Algorithmes(Graphe flot de données)
Estimationperformances
1 2
3
4 all.P
o1
all.P
o2
all.P
o4all.D
_o1o
2
all.D
_o2o
3
all.D
_o3o
4 all.P
o3
all.D
lo1
all.D
l2al
l.Dlo
4all.D
lo3
alia
s.D
_o3o
4
ESPACE MEMOIRE RAM
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
SynDEx
L’école d’ingénieurs des sciences et technologies de l’information et de la communication
Objectifs
• Décrire le processeur CELL dans SynDEx• Enrichir la librairie d’exécutif • Développer une application de test
Top Related