Reiner Hartenstein, University of Kaiserslautern, Germany ... · [email protected] R....
Transcript of Reiner Hartenstein, University of Kaiserslautern, Germany ... · [email protected] R....
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 1
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
60 Semester Informatik I
Data-Stream-based Computing: Antimaterie der Kern-Informatik
Reiner Hartenstein
Universität Kaiserslautern
Festkolloquium Universität Dortmund,
18. – 19. Juli 2002
viewgraph downloading: link found in
http://kressarray.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
2
Kritik an der Praktischen Informatik (in der Lehre)
• mißbraucht ihre Zweidrittel-Mehrheit • hält die Prägungsphase strikt „procedural-only“ • Absolventen sind daher völlig unvorbereitet für
die nahe Zukunft – Wo >90% der Anwendungen für eingebettete
Systeme implementiert werden – Wie für 2010 vorhergesagt
• nur wenige % des Kurrikulum wären zu ändern
• meine Mission: Sie hierfür zu gewinnen
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
3
Kritik an der Technischen Informatik, TI (klassischer Art)
• diese ist noch immer weit verbreitet
• keine Vorbereitung auf die heutige Arbeitswelt
• Indizien: Begriffe wie „Rechnerorganisation“, „Rechnerstrukturen, “„Rechnerarchitektur“
• vN-only, alles andere wird konsequent verschwiegen
• Paradebeispiel: renommierte IEEE ISCA Serie
• TI muß auf die Realitäten der Mikroelektronik und der eingebetteten Systeme vorbereiten
• andernfalls werden unsere Absolventen den Wettbewerb mit E-Technikern nicht bestehen
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
4
die Kern-Informatik: jung ? dynamisch ?
das von Neumann Paradigma ....
... noch immer die vorherrschende Doktrin
die Mikroelektronik wird ignoriert (außer dem
Kostenverfall der Rechenleistung)
die Grundmodelle seit der Zeit der Mainframe-Dinosaurier sind praktisch unverändert
.. ist nach >10 Technologie-Generationen ...
• 1th 4004 • 2nd 8008 • 3rd 8086 • 4th 80286 • 5th 80386 • 6th 80486 • 7th P5 (Pentium) • 8th P6 (Pentium Pro / Pentium II) • 9th Pentium III • 10th .... • 11th
... der vN Mikroprozessor ist ein Methusalem ...
... die Dampfmaschine des Silizium-Zeitalters
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
5
Dead Supercomputer Society
•ACRI •Alliant •American Supercomputer •Ametek •Applied Dynamics •Astronautics •BBN •CDC •Convex •Cray Computer •Cray Research •Culler-Harris •Culler Scientific •Cydrome •Dana/Ardent/ Stellar/Stardent
•DAPP •Denelcor •Elexsi •ETA Systems •Evans and Sutherland •Computer •Floating Point Systems •Galaxy YH-1 •Goodyear Aerospace MPP •Gould NPL •Guiltech •ICL •Intel Scientific Computers •International Parallel . Machines •Kendall Square Research •Key Computer Laboratories
[Gordon Bell, keynote, ISCA 2000].
•MasPar •Meiko •Multiflow •Myrias •Numerix •Prisma •Tera •Thinking Machines •Saxpy •Scientific Computer •Systems (SCS) •Soviet Supercomputers •Supertek •Supercomputer Systems •Suprenum •Vitesse Electronics
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
6
Scheuklappen der Technischen Informatik
Resignation?
aufgegriffen von der Opposition:
Verbindungs-Geflechte:
vN Parallelität:
die Datenfluß- Maschine ist tot
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 2
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
7
Data-Stream-based Computing
• Reconfigurable Computing: ursprünglich die treibende Kraft
• fest verdrahtete Umgebungen holen auf
• Nicht nur dadurch: von der Nische zur Hauptrichtung
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
8
>> Gliederung
• Einleitung
• Das CPU Maschinen Paradigma
• DPU & DPA : Antimaterie der Informatik
• Reconfigurable Computing
• Dominanz der Eingebetteten Systeme http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
9
Eine völlig neue Art von „Software“
• .... für die Anti Maschine
• völlig neue Grundlagen
• nicht „von Neumann“
• für typische Informatiker verwirrend
• unsere Kurrikula sind unvorbereitet
• besser ein neuer Terminus:
• >>>> Configware <<<<
• wie ordnen wir das ein – in unsere Welt?
• ... in die Geschichte der Halbleiter-Anwendung
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
10
Halbleiter Revolutionen
“Mainstream Silicon Application is switching every 10 Years”
TTL µproc., memory
“The Programmable System-on-a-Chip is the next wave“
custom
Standard
1957
1967
1977
1987
1997
2007
ASICs, accel’s
LSI, MSI
Tredennick’s Paradigm Shifts
fest verdrahtet
algorithm: fixed
resources: fixed
prozedurale Programmierung
algorithm: variable
resources: fixed
strukturelle Programmierung
algorithm: variable
resources: variable
vN Maschinen- Paradigma
Anti Maschinen- Paradigma
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
11
Impact of Makimoto’s wave
TTL µproc., memory
custom
standard
ASICs, accel’s
LSI, MSI
1957
1967
1977
1987
1997
2007
Procedural personalization
via RAM-based vN Machine Paradigm
Personalization (CAD) before fabrication
structural personalization:
RAM-based before run time
Software Industry’s Secret of Success
Repeat Success Story by Anti Machine Paradigm !
Configware Industry
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
12
Was sind die Unterschiede ?
vN* Computing:
• computing in time
• instruction fetch at run time
• instruction scheduling
Reconfigurable Computing:
• computing in space and time
• “instruction” fetch at compile time
• 1.) strukturelle Programmierung
• 2.) sodann: data scheduling
• also Daten-Strom-basiert
• auch fest verdrahtete Implementierungen
• z.B. Bee Projekt von Prof. Broderson *) vN steht für “von Neumann”
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 3
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
13
Markt für reconfigurierbare Halbleiter
Xilinx 42%
Altera 37%
Lattice 15%
Actel 6%
Top 4 PLD Manufacturers 2000
total: $3.7 Bio
• [Dataquest] > $7 billion in 2003.
• PLD Anbieter und deren Allianzen schaffen Bibliotheken von “soft IPs”
Configware Markt
• das am schnellsten wachsende Halbleiter Marktsegment
grobkörnig:
rDPUs: konfigurierbare Funktionsblöcke
feinkörnig:
cLBs, rLBs: konfigurierbare Logik-Blöcke
PACT AG, München http://pactcorp.com
Quicksilver, San Jose http://quicksilver-tech.com
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
14 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
Reconfigurable goes mainstream
Themen aufgegriffen d. Kongresse: ASP-DAC, DAC, DATE, ISCAS ....
http://fpl.org
FPL 2002: 214 Einreichungen –gg. 2001 ein Zuwachs um 83%
• FCCM, FPGA (gegründet 1992), and FPL (gegründet 1991 in Oxford, UK): International Conference on Field-Programmable Logic and Applications
• FPL 2002, La Grande Motte (Montpellier, France), 2. – 4. Sept.
14
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
15
DATE 2003 in München: special day ....
•.... special day on Reconfigurable Computing
•deadline: Sept. 8, 2002
•http://www.date-conference.com
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
16
Anti Partikel
• 1956: Anti Neutron erzeugt auf Bevatron
• 1928: Paul Dirac: „es muß ein Anti Elektron geben mit positiver Ladung“ (Nobel Preis 1933)
• 1932: Carl David Anderson entdeckt dieses „Positron“ in Höhenstrahlung (Nobel Preis 1936)
• 1955 Owen Chamberlain et al. erzeugen Anti Proton auf Bevatron
• 1954: neue Beschleuniger: Zyklotron, wie Berkeley‘s Bevatron
• 1965: Schaffung eines Deuterium Anti Kern bei CERN
Wasserstoff Anti Wasserstoff
• 1995: Wasserstoff Anti Atom erzeugt bei CERN – durch Erzwingung der Verschmelzung von Positron und Anti Proton bei sehr niedriger Energie.
.... aber es gibt Asymmetrien”
“im Universum muß es Regionen von Anti Materie geben …
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
17
Materie & Antimaterie: Atom and Anti Atom
die Welt der Materie -
Maschinen Paradigma: das Atom
Anti Materie -
Maschinen Paradigma: Anti Atom
+ + -
- - +
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
18
Materie & Antimaterie der Informatik :
Anti Maschinen Paradigma
Maschine und Anti Maschine
+
CPU
- 1936 erster elektronischer Computer (Konrad Zuse)
Maschinen Paradigma: „von Neumann“
1946 v. N. Maschinen Paradigma
1971 erster Mikroprozessor (Ted Hoff)
1979 „data streams“ (systolische Arrays: Kung / Leiserson ...)
1995 rDPA / DPSS (supersystolisch: Rainer Kress)
Daten-prozedural
- DPU
+
1990 Anti Maschinen Paradigma publiziert in Japan
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 4
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
19
>> Das CPU Maschinen Paradigma
• Einleitung
• Das CPU Maschinen Paradigma
• DPU & DPA : Antimaterie der Informatik
• Reconfigurable Computing
• Dominanz der Eingebetteten Systeme http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
20
RAM-basiert
+
CPU
Data
Path
instruction sequencer
RAM
+ einfaches Maschinen Paradigmq + Skalierbarkeit
+ Verschiebbarkeit (relocatability)
+ Kompatibilität = Erfolgsgeheimnis
der Software Industrie
CPU:
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
21
problematische Materie
+
CPU
Data
Path
instruction sequencer
Central Processing Unit
RAM
Address Computation Overhead
Instruction Fetch Overhead
central von Neumann bottleneck
extremely power hungry and area inefficient
rekonfigurierbar?
das falsche Maschinen- Paradigma
alw. new instruction sequencer needed
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
22
>>> nebenläufige Prozesse
• Einleitung
• Das CPU Maschinen-Paradigma – Concurrency (nebenläufige Prozesse)
• DPU & DPA: Antimaterie der Informatik – DPA
• rDPA: Reconfigurable Computing
• Dominanz Eingebetteter Systeme
http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
23
Parallelism by Concurrency
+ -
+
- -
+
- +
+
-
- +
- +
independent instruction streams
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
24
Concurrent Computing
....
Bus(es) or switch box
Data
Path
instruction sequencer
Data
Path
instruction sequencer
Data
Path
instruction sequencer
Data
Path
instruction sequencer
Data
Path
instruction sequencer
Data
Path
instruction sequencer extremely inefficient
CPU
•massive switching activity at runtime
•may affect far beyond Amdahl‘s law
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 5
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
25
What is the trend ?
• vN is needed for embedded systems, OS, compilers, Sauerkraut software, non- performance-critical applications, others ….
• vN is obsolete for massive parallelism, except some special application areas
• Anti machine is the way to go for massive parallelism, also data-intensive applications
• reconfigurable is the way for high performance with short product life cycles, unstable standards
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
26
>> DPU & DPA : Antimaterie der Informatik
• Einleitung
• Das CPU Maschinen Paradigma
• DPU & DPA : Antimaterie der Informatik
• Reconfigurable Computing
• Dominanz der Eingebetteten Systeme http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
27
Some differences: CPU versus DPU
+
CPU
Data
Path
instruction sequencer
transport- triggered - DPU
Data
Path
Unit
DPU
dat
a st
ream
s
external signal, or
nothing central
no vN bottleneck: multiple ports
instruction fetch not at run time: no overhead
data streams
scheduled elsewhere
RAM
data sequencer
RAM
data sequencer
RAM
data sequencer
…
instruction stream routed here
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
28
Maschinen-Paradigmen: Gegenüberstellung
Maschinen-Kategorie
Computer (“v. Neumann”)
Anti Maschine (Xputer: kein transputer!)
Getrieben durch: Befehls-Ströme Datenströme (no “dataflow”)
operation principles instruction sequencing data sequencing
Zustands-Register der Programm-Zähler (i. allg. mehrere) Datenzähler
communication path set-up
at run time at load time
resource DPU (e.g. single ALU) DPU or DPA (DPU array) etc. data path
operation sequential parallel pipe network etc.
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
29
Progr.-Sprachen-Paradigmen: Gegenüberstellung
Sprach-Kategorie vN Computer Sprachen Anti Sprachen
both deterministic procedural sequencing: traceable, checkpointable
operation sequence driven by:
read next instruction, goto (instr. addr.),
jump (to instr. addr.), instr. loop, loop nesting
no parallel loops, escapes, instruction stream branching
read next data item, goto (data addr.),
jump (to data addr.), data loop, loop nesting, parallel loops, escapes, data stream branching
Zustands-Register Der Program-Zähler (i.allg.mehrere) Datenzähler
address computation
massive memory cycle overhead no overhead
Instruction fetch memory cycle overhead no overhead
parallel memory bank access interleaving only no restrictions
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
30
>> DPA
• Einleitung
• das CPU Maschinen-Paradigma – Concurrency
• DPU & DPA: Antimaterie der Informatik – DPA
• rDPA: Reconfigurable Computing
• Dominanz Eingebetteter Systeme
http://www.uni-kl.de
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 6
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
31
Maschine-Paradigmen: Asymmetrien
+
CPU
-
- DPA
+
+
+
- DPU
+
Zahl der Ströme 1
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
32
DPA = DPU array
- DPA
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU -
DPA
+
+
+
+
+
+
+
+
+
kohär
ent
e D
atens
tröm
e
zirk
ulie
ren
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
33
>> rDPA: Reconfigurable Computing
• Einleitung
• das CPU Maschinen-Paradigma – Concurrency
• DPU & DPA: Antimaterie der Informatik – DPA
• rDPA: Reconfigurable Computing
• Dominanz Eingebetteter Systeme
http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
34
rDPU not used used for routing only operator and routing port location markerLegend: backbus connect
array size: 10 x 16 = 160 rDPUs à 32 bits
http://kressarray.de
akademisches DPA Beispiel
rout thru only
not used backbus connect
SNN filter KressArray Mapping
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
35 © 2001, [email protected] http://www.fpl.uni-kl.de
University of Kaiserslautern
Xputer Lab
kommerzieller rDPA
XPU family : PACT AG, München
XPU128 http://pactcorp.com
35 © 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
36
PACT XPP: Referenz-Module XPU128 Ko-Prozessor
ALU - PAE
CF
G
PAE
core
ALU CtrlALU
CF
GC
FG
PAE
core
CF
GC
FG
PAE
core
PAE
core
ALU CtrlALUALU CtrlALU
CF
GC
FG
CF
GC
FG
XPP128 ALU-Array
• 2 X PACs (Cluster)
• 128 X ALU-PAEs
• 32 X 1Kbyte RAM-PAEs
• 8X I/O Elements
• Full 32 or 24 Bit Design
• 2 Configuration Hierarchies
• Evaluation Board (2001)
• XDS Development Tool with Simulator
• PAE Core is 32- or 24-Bit ALU with DSP-Instruction Set and Controller
• Connecttions: Inputs + Outputs (Channels) + Events
[Jürgen Becker,
Univ. Karlsruhe]
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 7
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
37
Datastream-based Compilation Principles
library
data stream assembly
scheduler
mapper placement & routing
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
38
Energy Efficiency vs. Flexibility
1000
100
10
1
0.1
0.01
0.001 2 1 0.5 0.25 0.13 0.1 0,07
MOPS / mW
µ feature size
T. Claasen et al.: ISSCC 1999 *) R. Hartenstein: ISIS 1997
flexibility
flexibility
throughput
hard- wired
FPGAs
anti machine
von Neumann
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
39
>> Dominanz der Eingebetteten Systeme
• Einleitung
• Das CPU Maschinen Paradigma
• DPU & DPA : Antimaterie der Informatik
• Reconfigurable Computing
• Dominanz der Eingebetteten Systeme
http://www.uni-kl.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
40
Allgegenwärtige Eingebettete Systeme
20 Mrd. µProcessoren (2001)
> 90% in eingebetteten Systemen
10 x mehr Programmierer werden eingebettete Anwendungen schreiben, denn trad. Computer Anwendungen: im Jahre 2010
dorthin gehen dann unsere Absolventen
für Informatik-Kurrikula ist es aller- höchste Zeit, dies umzusetzen
Eingebettete Systeme bedeuten:
• Hardware / Software Ko-Design
• Configware / Software Ko-design
• Hardware / Configware / Software Ko-Design
• Der heutige nur-prozedurale Informatiker ist ein Auslaufmodell
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
41
Zusammenfassung: das nötige Know-how ist vorhanden
• Sprachen
• Maschinen-Paradigma
• Compiler-Techniken
• Anti Architektur Ressourcen
• Sequenzierungs-Methoden: hw & sw
• Hw / Sw Partitionierungs Methoden
• Parallel-Speicher IP core und Modul Generator Anbieter
courses / embedded tutorials: • DATE. Munich, 2001
• ASP-DAC, Yokohama, 2001 • SBCCI, Brasilia, 2001
full day:
Univ. Montpellier 1998 Nokia / Univ. Tampere, Finland, 2002
CNRS Paris France, 2002
• 10 keynotes 2001 / 2002
• some more invited talks
• Alles was sonst gebraucht wird
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
42
Annihilierung?
- +
-
+ -
+ vermeidbar…
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 8
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
43
Die Lehre in der Informatik .....
Software Person
prozedural
strukturell
Hardware Person
Configware / Software Co-Design? Hardware / Software Co-Design?
Die Lehre in der Informatik .....
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
44 © 2001, [email protected] http://www.fpl.uni-kl.de
University of Kaiserslautern
Xputer Lab
Die Lehre in der Informatik .....
Hardware unsichtbar: unter der Oberfläche
… basiert auf dem U-Boot-Modell
Algorithmus
Assembler Sprache
prozedurale höhere Programmiersprache
Hardware
dieses Modell verhindert ...
Hirn-Gebrauch: nur prozedural
44
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
45 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
Hardware, Configware
..... Hardware und Software als Alternativen
Algorithmus
Software
Partitionierung
Software only
prozedural strukturell
Hirn-Gebrauch: Beide Hemisphären
Hardw/Configw only
45 © 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
46 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
Dominanz des U-Boot-Modell ...
Hardware
... zeigt uns, daß unsere Lehre Zillionen geistig behinderter
Absolventen produziert
(prozedural) strukturell unfähig
… völlig unfähig zum Umgang mit anderen Lösungen als nur-Software
es ist höchste Zeit, die Diktatur der Software–Fakultäten zu brechen. Ihr Engagement wird dringend benötigt!
46
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
47
Schlußfolgerungen
• Die Lehre der Kerninformatik hat sich seit den Zeiten der Mainframe-Dinosaurier kaum verändert
• die Mikroelektronik wird ignoriert (außer dem Kostenverfall der Rechenleistung)
• aller Forschritt geht von den Anwendungen aus
• immer mehr vor Allem für eingebettete Systeme
• darauf sind unsere Absolventen nicht vorbereitet
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
48 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab>>> vielen Dank
Vielen Dank für Ihre Aufmerksamkeit
48
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 9
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
49 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab>>> ENDE
ENDE 49 © 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
50 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab>>> Anhang
Anhang
50
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
51
Super Pipe Networks
pipeline properties array applications
shape resources
mapping scheduling
(data stream formation)
systolic array
regular data
dependencies only
linear only
uniform only
linear projection or algebraic synthesis
super-systolic DPA
no restrictions simulated
annealing or P&R algorithm
(e.g. force-directed) scheduling algorithm
*) KressArray [ASP-DAC-1995]
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
52
.... it‘s an alternative culture ....
• now the area is going mainstream: a rapidly widening audience of non-specialists gets interested ...
• severe communication gaps due to educational deficits
• not only to users: still many hardware and EDA experts ask: isn’t it just logic design on a strange platform ?
• it is time to clarify and popularize fundamental aspects and to explain, that it is a fundamentally different culture
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
53 © 2001, [email protected] http://www.fpl.uni-kl.de
University of Kaiserslautern
Xputer Lab
Jürgen Becker’s Co-DE-X Co-Compiler
Analyzer / Profiler
Host Software
GNU C compiler
para d igm Computer machine
DPSS KressArray Configware
X-C compiler
Xputer machine paradigm
Partitioner
X-C is C language extended by MoPL X-C
Resource Parameters
supporting different platforms
supporting platform-based design
53 © 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
54 © 2001, [email protected]
University of Kaiserslautern
Xputer Lab
instructions
program cou n ter:
state register
Compiler RAM
Datapath
har dw ired
Sequencer
Computer tightly coupled
by compact instruction code
“von Neumann” does not support
soft data paths
Datapath
Xputer
Scheduler
Compiler
RAM
(multiple) sequencer
Datapath Array
“instructions”
University of Kaiserslautern
Xputer Lab
loosely coupled by decision data bits only
Xputer: The Soft
Machine
Paradigm reconfigurable
also for hardwired
Computer: the wrong Machine Paradigm
“von Neumann”
s
d a ta cou n ter
(anti machine) 54
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 10
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
55
Makimoto’s 3rd wave
Reconfigurability
The next Revolution:
1978
Transistor entry: Applicon, Calma, CV ...
1992
Synthesis: Cadence, Synopsys ... 1985
Schematics entry: Daisy, Mentor, Valid ...
[Keutzer / Newton]
EDA industry paradigm switching every 7 years
1999 (Co-) Compilation &
Data-stream-based (r)DPAs [Hartenstein]
2006
Paradigm Shift
Mainstream
Tornado
[Richard Newton]
[Keutzer / Newton]
82% of designers hate their tools
55 © 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
56 © 2001, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
missing the next revolution
Ignoring reconfigurable computing
by teaching computing fundamentals
within our CS curricula
causing the waste billions of dollars.
is one of
the biggest mistakes in the history of
information technology application
56
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
57
The anti universe
•Paul Dirac predicted a complete anti universe consisting of antimatter
•“There are regions in the universe, which consist of antimatter .....
•We are not aware, that there is a new area in computing sciences , which consists of antimatter of computing
• .... But there are asymmetries”
•Reconfigurable Computing is made from this antimatter, especially if it’s data-stream-based
•when a particle hits its antiparticle, both are converted into energy: Annihilation
• .... But there are asymmetries
•and Annihilation (CS curricula)
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
58
Soft rDPA ?
Memory soft CPU
miscellanous
HLL Compiler
• Rapid technology progress
• 50 million system gates soon
• FPGAs f. relocatable configware code ?
• Compatibility at configuration code level ?
• Slower clock: compensated by more parallelism: low power
• Even large rDPAs as a soft IP become feasible
• By >2005: don’t care about area efficiency ?
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
59
PACT-XPP: Direct Programming Methodology
The code sections are mapped directly onto the processing array
Code section nodes correspond to XPP ALUs
[Jürgen Becker,
Univ. Karlsruhe]
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
60
Antimatter Search
.... the Antimatter of CPU-based Computing
•Reconfigurable or Hardwired: Datastream-based Computing is the Antimatter of classical Computing
•This Antimatter has been mainly ignored
• „Antimatter: where is it ?“
R. Hartenstein (invited presentation): Data-Stream-based Computing: Antimaterie der Kern-Informatik; 60 Semester Informatik I, Festkolloquium der Universität Dortmund, 18. - 19. Juli 2002 11
Reiner Hartenstein, University of Kaiserslautern, Germany http://hartenstein.de
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
61
hardwired interconnect fabrics
Parallelism at data stream level
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
- DPU
no switching overhead at run time
mapping before fabrication
reconfigurable interconnect fabrics
configured after fabrication
- rDPU
- rDPU
- rDPU
- rDPU
- rDPU
- rDPU
- rDPU
- rDPU
61
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
62
DPA-based entire System
- DPA
RAM
RAM RAM
RAM
RAM
RAM
RAM RAM
memory communication architecture
mapping before fabrication
© 2002, [email protected] http://KressArray.de
University of Kaiserslautern
Xputer Lab
63
DPA-based entire System
- rDPA
RAM
RAM RAM
RAM
RAM
RAM
RAM RAM
mapping after fabrication
reconfiguration
RAM
reconfigurable memory communication architecture
M. Herz, et al.: Memory Organisation for Stream-based Reconfigurable Computing; IEEE ICECS 2002, Sept. 15-18, 2002, Dubrovnik, Croatia
RAM-based