Advanced Audio Coding - AAC

85
Bronke/ Kücük/ Campos Santos- AAC 1 Advanced Audio Coding

description

our presentation at university about the AAC and related topics

Transcript of Advanced Audio Coding - AAC

Page 1: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 1

Advanced

Audio

Coding

Page 2: Advanced Audio Coding - AAC

2

Hochschule der Medien Stuttgart

„Multimedia Codecs“

PräsentationDuygu KücükFilipe Campos SantosKarol Bronke

Computer Science & MediaMaster

AAC

Bronke/ Kücük/ Campos Santos- AAC

Page 3: Advanced Audio Coding - AAC

3

EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit

Agenda

Bronke/ Kücük/ Campos Santos- AAC

Page 4: Advanced Audio Coding - AAC

4

Advanced Audio Coding

Bronke/ Kücük/ Campos Santos- AAC

Audiokompressionsverfahren

standardisiert

verlustbehaftet

Page 5: Advanced Audio Coding - AAC

5

Ziele

Bronke/ Kücük/ Campos Santos- AAC

Nachfolger von MP3Schwächen von MP3 minimieren, also Kodierung verbessernKonkurrenz zu Ogg Vorbis, Windows Media Audio, …Bessere Qualität bei gleicher BitrateMultikanalität

Page 6: Advanced Audio Coding - AAC

6

Features

Bronke/ Kücük/ Campos Santos- AAC

Samplingrate 8 – 96 kHzMehrkanalfähig, bis zu 48 KanäleProfile, z.B.

Niedrig, für EchtzeitkodierungHoch, für High-End Kodierung

TaggingKopierschutzverfahren möglich

Page 7: Advanced Audio Coding - AAC

7

Standardisierung

Bronke/ Kücük/ Campos Santos- AAC

MPEG

Page 8: Advanced Audio Coding - AAC

8

Standardisierung

Bronke/ Kücük/ Campos Santos- AAC

Spezifiziert in zwei Standards Part 7 von MPEG-2ISO/IEC 13818-7:1997

Subpart 4 in Part 3 von MPEG-4ISO/IEC 14496-3:1999

…Aktuell

ISO/IEC 14496-3:2009

Page 9: Advanced Audio Coding - AAC

9

Anwendungen

Bronke/ Kücük/ Campos Santos- AAC

Teil des MPEG-2 StandardsAudiokern des MPEG-4 StandardsHE-AAC in digitalem Radio, Mobile TV, …Dateiendungen

.aac.3gp

.mp4

.m4a, .m4b, .m4p, .m4v, .m4r

Page 10: Advanced Audio Coding - AAC

10

Anwendungen

Bronke/ Kücük/ Campos Santos- AAC

Page 11: Advanced Audio Coding - AAC

11

Lizensierung

Bronke/ Kücük/ Campos Santos- AAC

• Keine Lizenz/-Patentgebühren zu zahlenVerbreitung

• Lizenzerwerb nötigImplemen-tierung

Page 12: Advanced Audio Coding - AAC

12

Lizensierung

Bronke/ Kücük/ Campos Santos- AAC

Volume Per Unit fee

Consumer Product 1 to 500,000 units $0.98

Consumer Product 50,000,001 or more $0.15

Professional Products (Decoder/ Encoder)

1 $5.00 / $50.00

Consumer PC Software (Decoder/Encoder)

1 $0.48 / $0.98

Cellular Telephone Committed Volume Option

1 to 7,500,000 $3,000,000

Cellular Telephone Committed Volume Option

From 50,000,000 $0.06 each

Page 13: Advanced Audio Coding - AAC

AAC basiert auf „Perceptual Model“Prinzip des „Perceptual Coding“Perceptual Model nutzt Maskierung Maskierung (psychoakustischer Effekt)Durch Enkodierer wird maskierter Ton entfernt, ohne die Klangqualität zu mindern

Bronke/ Kücük/ Campos Santos- AAC 13

Techn. Eigenschaften - Einführung

Page 14: Advanced Audio Coding - AAC

14

Techn. Eigenschaften - Hörmodell

Bronke/ Kücük/ Campos Santos- AAC

Töne mit einem Schalldruckpegel unterhalb des „Maskierers“ können nicht wahrgenommen werden Keine Kodierung notwendigSignale unter der Ruhehörschwelle nicht mitkodiertBei der Digitalisierung eines Audiosignals entsteht ein Quantisierungsrauschen

Schalldruckpegel erhöht sich jeweils um 6dB, wenn die Bitzahl der Quantisierung um 1 Bit verringert wird

Anzahl der Bits kann solange verringert werden, bis das Quantisierungsrauschen knapp unter der Hörschwelle liegt und so nicht mehr hörbar ist

Page 15: Advanced Audio Coding - AAC

15

Techn. Eigenschaften - Hörmodell

Bronke/ Kücük/ Campos Santos- AAC

Page 16: Advanced Audio Coding - AAC

Allgemein• Abtastung Umwandlung Analog zu Digital • Abtastrate Abtastung erfolgt in einer bestimmten Anzahl

pro Sekunde• Dadurch wird aus analogem Signal ein digitales Signal

SamplesAAC• Entfernt werden– Nicht wahrnehmbare Signalkomponenten – Redundanzen im kodierten Audiosignal

Bronke/ Kücük/ Campos Santos- AAC 16

Codierung - Ziele

Page 17: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 17

Encoder

Filterbank

Verarbeitung & Quantisierung

Bitstrom-enkodierung

Audiosignal

Bitstrom10110111010011110101

Psychoakustisches Modell

Page 18: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 18

Decoder

Audiosignal

Bitstrom101101110101

Inverse Filterbank

Verarbeitung & Dequantisierung

Bitstrom-dekodierung

Page 19: Advanced Audio Coding - AAC

• Enkodierung– Signalumwandlung von Zeitbereich in Frequenzbereich,

durch MDCT mit “Filter Banks”– Der Frequenzbereich wird auf Basis des psychoakustischen

Effekts quantisiert und enkodiert– Interne Fehlerkorrekturen– Signal speichern (AIFF) und übermitteln (ADTS) – Um beschädigten Samples vorzubeugen, wird eine

moderne Implementation des Luhn mod N-Algorithmus eingesetzt

Bronke/ Kücük/ Campos Santos- AAC 19

Vorgehen

Page 20: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 20

Enkodierungsprozess (Übersicht)

Pre-Processing Transform Spectral

Processing Quantization

Psychoacoustic Model

Multiplex

Input Signal

Compressed Bitstream

Bloc

k ty

pe

Threshold

Page 21: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 21

Dekodierungsprozess (Übersicht)

Inverse Quantization

Inverse Spectral

Processing

Inverse Transform

Post-Processing

Demultiplex

Output Signal

Compressed Bitstream

Bloc

k ty

pe

Page 22: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 22

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Noiseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungsrauschen

Page 23: Advanced Audio Coding - AAC

• Audio-Signal wird in zeitliche Blöcke (Frames) zerlegt:– Abschnitte mit gleichmäßigem Klangbild (stationary) lange Blöcke– Impulsive Abschnitte (transient) kurze Blöcke– 1 langer Block (2048 Samples) = 8 kurze Blöcke (256 Samples)

• Auf Blöcke werden Fenster (Windows) gelegt Wechsel zwischen Blöcken möglich (block/window switching)– beugt dem Pre-Echo-Effekt vor, welches durch die MDCT verursacht wird

Bronke/ Kücük/ Campos Santos- AAC 23

Filter Bank (1)

Page 24: Advanced Audio Coding - AAC

• Übergangsregeln für „block/window switching“:– Vor einem kurzen Fenster sollte (nach mehreren langen Fenstern) ein langes

Start-Fenster liegen.– Vor einem langen Fenster sollte (nach einem kurzen Fenster) ein langes Stop-

Fenster liegen.

Bronke/ Kücük/ Campos Santos- AAC 24

Filter Bank (2)

Page 25: Advanced Audio Coding - AAC

• Zwei Window-Varianten auf lange Blöcke:– Sinus = Eignet sich für Signale mit dichter Spektraldarstellung– KBD (Kaiser-Bessel Derived) = Eignet sich für Signale mit weit entfernten

Frequenzbestandteilen

• Umwandlung von Zeit-Samples in Frequenz-Samples durch MDCT

Bronke/ Kücük/ Campos Santos- AAC 25

Filter Bank (3)

Page 26: Advanced Audio Coding - AAC

• Modifizierte diskrete Kosinustransformation bei Enkodierung

• Überlappung aufeinander folgender Frames um 50%– statt 2048 bzw. 256 Samples müssen

nur 1024 bzw. 128 Samples gespeichert werden

• Frequenzauflösung besser, Zeitauflösung schlechter– Problem: Pre-Echo-Effekt Lösung: block/window switching

• Umwandlung von Zeit-Samples in Frequenz-Samples– MDCT auf 1024 Samples bei langem Fenster– MDCT auf 128 Samples (8 kurze Blöcke) bei kurzem Fenster

Bronke/ Kücük/ Campos Santos- AAC 26

MDCT

Page 27: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 27

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

Page 28: Advanced Audio Coding - AAC

• Problem: Was ist mit Eingangssignalen, die irgendwo zwischen "gleichmäßig" und "impulsiv" liegen, wenn am Ende eines an sich ruhigen Blocks noch ein recht impulsives Signal folgt?

• Antwort: Rauschen oder hörbare Artefakte

• Lösung: Temporal Noise Shaping (TNS)

• Informationen im ruhigeren Teil werden feingranular kodiert Rauschen im ruhigeren Abschnitt nimmt ab

• Informationen im lebendigeren Teil werden grobgranular kodiert Rauschen im lebhafteren Teil nimmt zu

• Durch das psychoakustische Modell wird das Rauschen durch die Dynamik des Signals weitestgehend maskiert unhörbar

Bronke/ Kücük/ Campos Santos- AAC 28

Temporal Noise Shaping (1)

Page 29: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 29

Temporal Noise Shaping (2)

Page 30: Advanced Audio Coding - AAC

• Ähnliche Kodierung von hochfrequenten Signalen, die in Stereo vorliegen, ohne das ein hörbarer Unterschied entsteht

• Beispiel: Menschliches Gehör kann hohe Töne wahrnehmen, aber die Tonhöhe nicht differenzieren „Sound localization“

• Vorgehensweise:– Monosignal kodieren– Signal einmalig speichern und auf zwei Kanäle verteilen– Datenrate, ohne Qualitätsverlust, senken

• Abschnittsweise einsetzbar

Bronke/ Kücük/ Campos Santos- AAC 30

Intensity Stereo

Page 31: Advanced Audio Coding - AAC

• Die Mid/Side Stereo Kodierung basiert auf der Kodierung der beiden parallelen Kanäle eines Stereo-Audio-Signals niedrige Frequenzen

• Zwei Varianten:– Side: Links/Rechts Aufteilung Differenzwert der Stereokanäle– Mid: Summen/Differenz-Variante Mittelwert der Stereokanäle

• Links-Rechts-Aufteilung ist bei Unterschieden zwischen linkem und rechtem Signal vorteilhaft (Diagramme rechts)

• Summen-Differenzen-Variante ist bei ähnlichem linken und rechten Kanal vorteilhaft, da kaum Differenzen übertragen werden (Diagramme links)

• Verfahren mit weniger Daten wird verwendet (Festlegung eines Bits)

Bronke/ Kücük/ Campos Santos- AAC 31

Mid/Side Stereo Coding (1)

Page 32: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 32

Mid/Side Stereo Coding (2)

MID SIDE

Page 33: Advanced Audio Coding - AAC

• Voraussage nur bei annähernd konstanten Abschnitten eines Audiosignals

• Statt gleiche Information zu wiederholen, wird eine kleine Wiederholungsanweisung gegeben überflüssige Daten werden entfernt

• Voraussage ist nur bei sich wiederholenden, ähnlichen, gleichmäßigen und ruhigen Signalen möglich– Anwendung auf lange Blöcke gleichmäßige Signale

• Stellt AAC fest, dass die Voraussage nicht stimmt, so ist das Originalsignal zu kodieren

• Prediction ist nur im Main-Profile enthalten (Rechenaufwändig)

Bronke/ Kücük/ Campos Santos- AAC 33

Prediction (1)

Page 34: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 34

Prediction (2)

Page 35: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 35

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

Page 36: Advanced Audio Coding - AAC

• Frequenzlinien werden in Gruppen aufgeteilt -> Scale factor bands

• Jede Gruppe hat einen Scale factor

• Scale factor reduziert die Schrittweite der Quantisierung entsprechend den Anforderungen des Scale factor bands Je größer die Schrittweite, desto größer das Quantisierungsrauschen

• Ermöglicht eine effiziente Kodierung

Bronke/ Kücük/ Campos Santos- AAC 36

Scale factor

Page 37: Advanced Audio Coding - AAC

• Größte Datenreduktion möglich

• Quantisierung auf Basis des psychoakustischen Modells

• Hörbares wird in diskrete Werte umgewandelt Huffman-Code-Tabelle Unhörbares entfällt

• Die Huffman-Kodierung ermöglicht häufig auftretende Koeffizienten mit weniger Daten darzustellen

• Seltener vorkommende Koeffizienten benötigen mehr Daten unproblematisch, das diese selten vorkommen

• Das Signal muss ggf. in mehreren Iterationen komprimiert werden Vorgegebene Bitrate einhalten benötigt Zeit Für verzögerungskritische Anwendungen AAC LD entwickelt

Bronke/ Kücük/ Campos Santos- AAC 37

Quantisierung

Page 38: Advanced Audio Coding - AAC

• Teil der Quantisierung

• Sollte vor der Huffmann-Kodierung eingesetzt werden

• In die Menge der vorliegenden Koeffizienten wird ein Wert von +1 oder -1 eingearbeitet

• Das bisherige Signal wird zwar geringfügig geändert, ist im Allgemeinen nicht hörbar

• Dadurch können bis zu vier Koeffizienten eingebunden werden:– z.B. Informationen über die Auslenkung des Signals, eine evtl.

Phasenverschiebung und Frequenzvorkommen

Bronke/ Kücük/ Campos Santos- AAC 38

Noiseless Coding

Page 39: Advanced Audio Coding - AAC

• Kodierung basiert auf der Häufigkeitsverteilung

• 12 vordefinierte Codebooks (Huffman-Tabellen)

• Auswahl der Tabelle mit dem besten Kompressionsergebnis für ein Frequenzspektrum

• Optimiert: • niedrige Frequenzen kurze Codewörter• hohe Frequenzen lange Codewörter

• Vorteil: Kein Speicherplatz für die Tabelle notwendig

Bronke/ Kücük/ Campos Santos- AAC 39

Huffman Coding

Page 40: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 40

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

Page 41: Advanced Audio Coding - AAC

• Zwei Kontrollschleifen zur Überprüfung der…

• …Bitraten– Rate Control Loop kontrolliert, ob bei der Quantisierung, die vom Benutzer

angegebene Bitrate eingehalten wird

• …Qualität– Distortion Control Loop kontrolliert, ob das Quantisierungsrauschen

maskiert ist unhörbar bleibt

Bronke/ Kücük/ Campos Santos- AAC 41

Kontrollmechanismus

Page 42: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 42

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

Page 43: Advanced Audio Coding - AAC

• Bitstream Coding (oder Multiplexing) organisiert die Datenübertragung

• Datenströme können je nach Bedarf aufgeteilt oder zusammengefasst werden:– Je nach Bandbreite ist es sinnvoll zunächst ein Grundgerüst der Daten zu

übertragen und erst bei vorhandener Bandbreite diese mit weiteren Informationen zu füllen

• Die Übertragung der Daten in einem Schritt ist nicht immer sinnvoll Flexible Aufteilung des Datenstroms durch AAC

• Beispiel: – Ein Monosignal sicher übertragen und im Anschluss weitere Kanäle statt

Pausen im Stereosignal aufgrund von Bandbreitenengpässen hinzunehmen

Bronke/ Kücük/ Campos Santos- AAC 43

Bitstream Coding (1)

Page 44: Advanced Audio Coding - AAC

• AAC unterteilt den Datenstrom in zwei Bereiche:– Transportbereich, der die Übertragung garantiert und organisiert und

Bandbreiten effektiv ausnutzt– Zu übertragende Blöcke:

• Audiosignale der verschiedenen Kanäle• Konfigurationsdaten (Anzahl der Kanäle, Copyright-Angaben, Sampling

Rate, ...) • Verbindungselemente, die Daten für mehrere Audioelemente enthalten • Füllelemente, wenn eine bestimmte konstante Datenrate einzuhalten ist• Ende-Element

Bronke/ Kücük/ Campos Santos- AAC 44

Bitstream Coding (2)

Page 45: Advanced Audio Coding - AAC

Formate in MPEG-2 Part 7 + MPEG-4 Part 3:• Audio Data Interchange Format (ADIF)

• Audio Data Transport Stream (ADTS)

Weitere Formate in MPEG-4 Part 3: • Low-overhead Audio Transport Multiplex (LATM)

– Multiplexing von Nutzdaten und Audio-Konfigurationsinformationen

• Low Overhead Audio Stream (LOAS)– Selbst-synchronisierendes Streaming Format

Bronke/ Kücük/ Campos Santos- AAC 45

AAC - Formate

Page 46: Advanced Audio Coding - AAC

• Audio Interchange File Format:– Dateiformat (Containerformat) zum Speichern von LPCM (Linear Pulse Code

Modulation)-Audiodaten

– Inhalt: Single Header + AAC Audio Datenblock

– Entwickelt von Apple (Standard-Audioformat auf dem Mac)

– Im Vergleich zu MP3, Vorbis bietet LPCM keine Datenkompression. • Nachteil: Große Datenmengen beim Speichern in AIFF-Dateien• Vorteil: Audiodaten können verlustfrei und ohne zusätzlichen

Rechenaufwand verarbeitet werden

– Verbreitung: Tonstudios und Musikproduktion

Bronke/ Kücük/ Campos Santos- AAC 46

AAC - Formate (ADIF)

Page 47: Advanced Audio Coding - AAC

• Audio Data Transport Stream basiert auf MPEG-TS:– standardisiertes Kommunikationsprotokoll zur Übertragung von Audio

– spezifiziert in MPEG-2 Part 1

– die Ausgabe von digitalem Audio wird durch Multiplexing synchronisiert

– Transportströme bieten eine Fehlerkorrektur bei unzuverlässigen Medien und werden bei Broadcast-Medien wie DVB und ATSC eingesetzt

– AAC-Daten ADTS-Frame PES-Paket Multiplexing durch TS Übertragung

– Inhalt: Serie von Frames mit je einem Header + AAC Audio Datenblock

Bronke/ Kücük/ Campos Santos- AAC 47

AAC - Formate (ADTS)

Page 48: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 48

AAC - Profile

MPEG-2AAC

MPEG-4AAC-LC

MPEG-4HE-AAC

MPEG-4HE-AAC v2

PNS SBR PS

1997 1999 2003 2004

MPEG-4AAC-LD/ELD

1999

Page 49: Advanced Audio Coding - AAC

“noise always sounds the same”• Dient dazu den Speicherplatz effizienter zu nutzen.

– Annahme: menschliches Gehör kann keinen wesentlichen Unterschied zwischen Geräuschen wahrnehmen. Lediglich die Lautstärke wird wahrgenommen.

1. Es wird gezielt nach Rauschen im Audiosignal gesucht.

2. Beim codieren wird nur die Lautstärke gespeichert.

Bronke/ Kücük/ Campos Santos- AAC 49

Perceptual Noise Substitution (PNS)

Page 50: Advanced Audio Coding - AAC

3. Für diesen Bereich des Audiosignals wird ein Bit (flag) gesetzt, als Hinweis, dass es Rauschen enthält.

4. Der Decoder liest das gesetzte Bit, sowie die gespeicherte Lautstärke und erzeugt einen pseudozufälligen Wert.

• Ergebnis: Kein hörbarer Unterschied, da Rauschen durch anderes Rauschen ausgetauscht werden kann.

• Gesparter Platz kann von anderen Bändern belegt werden.

Bronke/ Kücük/ Campos Santos- AAC 50

Perceptual Noise Substitution (PNS)

Page 51: Advanced Audio Coding - AAC

• AAC Low Complexity

• Leistungsfähiger Audiocodec für gute Qualität bei niedrigen Bitraten

• Verwendung: – Apple iPod, iTunes, QuickTime– Autoradios– Mobile Musikspieler– Mobiltelefone

Bronke/ Kücük/ Campos Santos- AAC 51

AAC-LC

Page 52: Advanced Audio Coding - AAC

Versucht die Nachteile der Audiokompression auszugleichen.

Bronke/ Kücük/ Campos Santos- AAC 52

Spectral Band Replication (SBR)

Audiodatei mit 128Kbps

Audiodatei mit 64Kbps

Page 53: Advanced Audio Coding - AAC

•Das menschliche Gehör wird zu höheren Frequenzen hin immer weniger anspruchsvoll.•Hochfrequente Anteile korrelieren mit den niederfrequenten Anteile.

- Zwischen der Hüllkurve im tief- und hochfrequenten Bereich besteht eine deutliche Korrelation.

- Rekonstruktion erfolgt mittels Vergleichsdaten, die beim codieren gespeichert wurden.

Bronke/ Kücük/ Campos Santos- AAC 53

Spectral Band Replication (SBR)

1. Niederfrequenten Anteil replizieren.

Page 54: Advanced Audio Coding - AAC

2. Replizierten Anteil mit Hilfe der gespeicherten SBR-Daten anpassen.

Bronke/ Kücük/ Campos Santos- AAC 54

Spectral Band Replication (SBR)

Effizienz wird um bis zu 50% gesteigert.

Page 55: Advanced Audio Coding - AAC

• Bandbreitenreduzierung eines Stereosignals – Aus einem Stereosignal wird ein Monosignal mit Zusatzinformationen

gewonnen.– Monosignal wird aus der Summe der beiden Kanäle erzeugt.

Bronke/ Kücük/ Campos Santos- AAC 55

Parameteric Stereo (PS)

• Rekonstruktion durch Zusatzinformationen:1. Phasenlage2. Lautstärkedifferenz3. Raumklanginformationen

• Einbettung der Stereo-Parameter mit einer Bitrate von ca. 2–3 kBit/s

Page 56: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 56

Parameteric Stereo (PS)

Page 57: Advanced Audio Coding - AAC

• High Efficiency AAC • Kombination aus AAC-LC mit Spectral Band Replication (SBR)• HE-AAC v2 ist um Parametric Stereo (PS) erweitert• Effizienter Codec für besonders niedrige Bitraten• Bitraten:

– HE-AAC: 32 bis 48 kbit/s– HE-AAC v2: 16 bis 24 kbit/s

• Verwendung (Beispielhaft): – DVB-H– DMB– 3GPP

Bronke/ Kücük/ Campos Santos- AAC 57

HE-AAC / HE-AAC v2

Page 58: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 58

AAC - LD Audio-Codec für Sprache. Ermöglicht geringere Verzögerungszeiten für eine Zweiwege-

Kommunikation.

Die Verzögerungszeit beträgt immer 20 ms, unabhängig von der Datenrate.

Page 59: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 59

AAC - LD Hauptunterschiede zu anderen Profilen:

Halbierung der Fenstergröße: Von 1024 auf 512 Samples. Die Zeit für die Analyse der Fenstergröße verringert sich um den Faktor 2.

• Deaktivierung des Block-Switching:• Look-ahead-Verzögerung entfällt.• TNS als Ersatz zur Eliminierung des Pre-Echo-Effekts.

Verringerung oder Deaktivierung des Bitreservoirs: Begünstigt durch eine geringere Größe eine schnellere Übertragung. 0..32 Bits erlaubt.

Page 60: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 60

Ein Vergleich

Page 61: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 61

Ausprägungen und EinflussgrößenAAC MP3

Timing Erster Standard 4 Jahre nach MP3

Einführung mit dem Start der flächendeckenden Internetnutzung

Marktreife Hohe Marktreife: subjektive Audioqualität besser als MP3 Innovation

Kompatibilität Keine Rückwärtskomptabilität Rasche Integration in Windows-Umgebungen

Nutzbarkeit und

BedingungenLizenzpflichtig

Lizenzfreie Nutzung für 5 Jahre nach Verabschiedung.

Anschließend LizenzpflichtigMarktsituation Konkurrenz: MP3 Keine vergleichbare Nutzungsform

im Markt

Page 62: Advanced Audio Coding - AAC

Liefert gleichwertige Qualität schon bei 70% der Bitrate von MP3

Mehrkanalunterstützung - MP3: (2) 5- AAC: 48

Bronke/ Kücük/ Campos Santos- AAC 62

Verbesserungen

Page 63: Advanced Audio Coding - AAC

• Stationäre Signale: Bildung größerer Blöcke bestehend aus 1024 Samples. (1024P)Zum Vergleich bei MP3: 576 Samples (32 SB x 18P= 576)– Spart Speicherplatz bei korrelierenden Signalen.

• Dynamische Signale: Bildung kleinerer Blöcke bestehend aus 128 Samples. (128P)Zum Vergleich bei MP3: 192 Samples (32 SB x 6P = 192)– Ermöglicht genauere Kodierung von stark schwankenden Signalen.

Bronke/ Kücük/ Campos Santos- AAC 63

Verbesserungen

Page 64: Advanced Audio Coding - AAC

• Höhere Bitrate möglich (8 - 529 kBit/s)Zum Vergleich MP3 (8 - 320kBit/s)

• Kombination verschiedenster Tools möglich.– SBR– PNS– PS– …

Bronke/ Kücük/ Campos Santos- AAC 64

Verbesserungen

Page 65: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 65

AAC vs MP3

MP3 AAC

Filterbank Hybrid Reine MDCT

Blockgröße für stationäre Signale 576 1024

Blockgröße für dynamische Signale 192 128

Abtastrate 8kHz-48kHz 8kHz-192kHz

Bitrate 8-320 kBit/s 8-529 kBit/s

Audiokanäle max. 5 Max. 48

Variable Bitrate Ja ja

Page 66: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 66

Demos

Page 67: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 67

Demos-Übersicht• MP3 vs. AAC LC, HE, HEv2 vs. WAV

• 32 kBit/s Bitrate

• Hörtests

• Testdateien erzeugen:– cdEX: CD -> .wav– SUPER: .wav -> .mp3– NeroAAC: wav -> .mp4

• Analyse– Audacity 1.3 mit FFmpeg

Page 68: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 68

Profil-Demos und Hörtests

Page 69: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 69

Kurze Wiederholung…

MPEG-2AAC-LC

MPEG-4AAC-LC

MPEG-4HE-AAC

MPEG-4HE-AAC v2

PNS SBR PS

1997 1999 2003 2004

Page 70: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 70

AAC Profil LC

Dateigröße: 1,08 MB

Page 71: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 71

Hörtests PNS

Page 72: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 72

AAC Profil HE

Dateigröße: 1,10 MB

Page 73: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 73

Hörtests SBR

Page 74: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 74

AAC Profil HEv2

Dateigröße: 1,03 MB

He: 1,10 MB

Page 75: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 75

Hörtests

Page 76: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 76

AAC vs MP3 vs WAV

Page 77: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 77

AAC-Hev2 vs MP3 @32 kBit/sMP3AAC Hev2

Dateigröße: 1,03 MB Dateigröße: 0,926 MB

Page 78: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 78

AAC-Hev2 vs MP3 @32 kBit/s

WAVAAC Hev2

Dateigröße: 40,84 MBDateigröße: 1,03 MB

Page 79: Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 79

AAC vs MP3

64 kBit/s 128 kBit/s0

0.51

1.52

2.53

3.54

4.55

MP3AAC

Bitrate

Bew

ertu

ng• Hörtest bestätigt die höhere subjektive Qualität des AAC-Codecs

gegenüber MP3.

Page 80: Advanced Audio Coding - AAC

80

EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit

Fazit

Bronke/ Kücük/ Campos Santos- AAC

Page 81: Advanced Audio Coding - AAC

81

Fazit

Bronke/ Kücük/ Campos Santos- AAC

Vorteile:Hohe Kompression, also hohe Qualität auch bei kleinen DateigrößenMultikanalfähig, also Surround-fähigHochaufgelöste Audiosignale mit bis zu 96kHz SamplingratenSchnelle und effiziente DekodierungSehr flexibel durch Nutzen verschiedener ProfileInternationaler Standard, also hohe Akzeptanz

z.B. durch Sony, Apple, Nintendo

Page 82: Advanced Audio Coding - AAC

82

Fazit

Bronke/ Kücük/ Campos Santos- AAC

NachteileEnkoder ist kompliziert zu implementierenViele Profile

In cosumer Markt oft nur LCImplementierung kostet GeldPatentiert

Page 83: Advanced Audio Coding - AAC

83

Duygu Kücü[email protected]

Filipe [email protected]

Karol [email protected]

Vielen Dank!Kontakt:

Page 84: Advanced Audio Coding - AAC

84

Quellen

Bronke/ Kücük/ Campos Santos- AAC

•High-Fidelity Multichannel Audio Coding – Dal Tracy Yang, Chris Kyrlakais, CC Jay Kuo

•The MPEG Handbook , MPEG-1, MPEG-2, MPEG-3 Second Edition – John Watkins

•Durchstarten mit HTML5 – Mark Pilgrim

•http://www.iis.fraunhofer.de/bf/amm/produkte/audiocodec/audiocodecs/aaclc/

•Newness guide to Television & Video Technology – K.F. Ibrahim

•Zum Bedeutungsverlust formaler Standardisierung für die Marktrelevanz von Audio-Standards zur Online-Distribution

•Multimedia Signals and Systems – Mrinal Kr. Mandal

Page 85: Advanced Audio Coding - AAC

85

Quellen

Bronke/ Kücük/ Campos Santos- AAC

•http://en.wikipedia.org/wiki/Comparison_of_audio_codecs

•http://en.wikipedia.org/wiki/Advanced_Audio_Coding

•http://upload.wikimedia.org/wikipedia/commons/3/37/AAC_profiles.svg

•http://www.chip.de/artikel/aacPlus-Technischer-Hintergrund-2_12874269.html