Advanced Audio Coding - AAC

Post on 24-Dec-2014

863 views 5 download

Tags:

description

our presentation at university about the AAC and related topics

Transcript of Advanced Audio Coding - AAC

Bronke/ Kücük/ Campos Santos- AAC 1

Advanced

Audio

Coding

2

Hochschule der Medien Stuttgart

„Multimedia Codecs“

PräsentationDuygu KücükFilipe Campos SantosKarol Bronke

Computer Science & MediaMaster

AAC

Bronke/ Kücük/ Campos Santos- AAC

3

EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit

Agenda

Bronke/ Kücük/ Campos Santos- AAC

4

Advanced Audio Coding

Bronke/ Kücük/ Campos Santos- AAC

Audiokompressionsverfahren

standardisiert

verlustbehaftet

5

Ziele

Bronke/ Kücük/ Campos Santos- AAC

Nachfolger von MP3Schwächen von MP3 minimieren, also Kodierung verbessernKonkurrenz zu Ogg Vorbis, Windows Media Audio, …Bessere Qualität bei gleicher BitrateMultikanalität

6

Features

Bronke/ Kücük/ Campos Santos- AAC

Samplingrate 8 – 96 kHzMehrkanalfähig, bis zu 48 KanäleProfile, z.B.

Niedrig, für EchtzeitkodierungHoch, für High-End Kodierung

TaggingKopierschutzverfahren möglich

7

Standardisierung

Bronke/ Kücük/ Campos Santos- AAC

MPEG

8

Standardisierung

Bronke/ Kücük/ Campos Santos- AAC

Spezifiziert in zwei Standards Part 7 von MPEG-2ISO/IEC 13818-7:1997

Subpart 4 in Part 3 von MPEG-4ISO/IEC 14496-3:1999

…Aktuell

ISO/IEC 14496-3:2009

9

Anwendungen

Bronke/ Kücük/ Campos Santos- AAC

Teil des MPEG-2 StandardsAudiokern des MPEG-4 StandardsHE-AAC in digitalem Radio, Mobile TV, …Dateiendungen

.aac.3gp

.mp4

.m4a, .m4b, .m4p, .m4v, .m4r

10

Anwendungen

Bronke/ Kücük/ Campos Santos- AAC

11

Lizensierung

Bronke/ Kücük/ Campos Santos- AAC

• Keine Lizenz/-Patentgebühren zu zahlenVerbreitung

• Lizenzerwerb nötigImplemen-tierung

12

Lizensierung

Bronke/ Kücük/ Campos Santos- AAC

Volume Per Unit fee

Consumer Product 1 to 500,000 units $0.98

Consumer Product 50,000,001 or more $0.15

Professional Products (Decoder/ Encoder)

1 $5.00 / $50.00

Consumer PC Software (Decoder/Encoder)

1 $0.48 / $0.98

Cellular Telephone Committed Volume Option

1 to 7,500,000 $3,000,000

Cellular Telephone Committed Volume Option

From 50,000,000 $0.06 each

AAC basiert auf „Perceptual Model“Prinzip des „Perceptual Coding“Perceptual Model nutzt Maskierung Maskierung (psychoakustischer Effekt)Durch Enkodierer wird maskierter Ton entfernt, ohne die Klangqualität zu mindern

Bronke/ Kücük/ Campos Santos- AAC 13

Techn. Eigenschaften - Einführung

14

Techn. Eigenschaften - Hörmodell

Bronke/ Kücük/ Campos Santos- AAC

Töne mit einem Schalldruckpegel unterhalb des „Maskierers“ können nicht wahrgenommen werden Keine Kodierung notwendigSignale unter der Ruhehörschwelle nicht mitkodiertBei der Digitalisierung eines Audiosignals entsteht ein Quantisierungsrauschen

Schalldruckpegel erhöht sich jeweils um 6dB, wenn die Bitzahl der Quantisierung um 1 Bit verringert wird

Anzahl der Bits kann solange verringert werden, bis das Quantisierungsrauschen knapp unter der Hörschwelle liegt und so nicht mehr hörbar ist

15

Techn. Eigenschaften - Hörmodell

Bronke/ Kücük/ Campos Santos- AAC

Allgemein• Abtastung Umwandlung Analog zu Digital • Abtastrate Abtastung erfolgt in einer bestimmten Anzahl

pro Sekunde• Dadurch wird aus analogem Signal ein digitales Signal

SamplesAAC• Entfernt werden– Nicht wahrnehmbare Signalkomponenten – Redundanzen im kodierten Audiosignal

Bronke/ Kücük/ Campos Santos- AAC 16

Codierung - Ziele

Bronke/ Kücük/ Campos Santos- AAC 17

Encoder

Filterbank

Verarbeitung & Quantisierung

Bitstrom-enkodierung

Audiosignal

Bitstrom10110111010011110101

Psychoakustisches Modell

Bronke/ Kücük/ Campos Santos- AAC 18

Decoder

Audiosignal

Bitstrom101101110101

Inverse Filterbank

Verarbeitung & Dequantisierung

Bitstrom-dekodierung

• Enkodierung– Signalumwandlung von Zeitbereich in Frequenzbereich,

durch MDCT mit “Filter Banks”– Der Frequenzbereich wird auf Basis des psychoakustischen

Effekts quantisiert und enkodiert– Interne Fehlerkorrekturen– Signal speichern (AIFF) und übermitteln (ADTS) – Um beschädigten Samples vorzubeugen, wird eine

moderne Implementation des Luhn mod N-Algorithmus eingesetzt

Bronke/ Kücük/ Campos Santos- AAC 19

Vorgehen

Bronke/ Kücük/ Campos Santos- AAC 20

Enkodierungsprozess (Übersicht)

Pre-Processing Transform Spectral

Processing Quantization

Psychoacoustic Model

Multiplex

Input Signal

Compressed Bitstream

Bloc

k ty

pe

Threshold

Bronke/ Kücük/ Campos Santos- AAC 21

Dekodierungsprozess (Übersicht)

Inverse Quantization

Inverse Spectral

Processing

Inverse Transform

Post-Processing

Demultiplex

Output Signal

Compressed Bitstream

Bloc

k ty

pe

Bronke/ Kücük/ Campos Santos- AAC 22

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Noiseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungsrauschen

• Audio-Signal wird in zeitliche Blöcke (Frames) zerlegt:– Abschnitte mit gleichmäßigem Klangbild (stationary) lange Blöcke– Impulsive Abschnitte (transient) kurze Blöcke– 1 langer Block (2048 Samples) = 8 kurze Blöcke (256 Samples)

• Auf Blöcke werden Fenster (Windows) gelegt Wechsel zwischen Blöcken möglich (block/window switching)– beugt dem Pre-Echo-Effekt vor, welches durch die MDCT verursacht wird

Bronke/ Kücük/ Campos Santos- AAC 23

Filter Bank (1)

• Übergangsregeln für „block/window switching“:– Vor einem kurzen Fenster sollte (nach mehreren langen Fenstern) ein langes

Start-Fenster liegen.– Vor einem langen Fenster sollte (nach einem kurzen Fenster) ein langes Stop-

Fenster liegen.

Bronke/ Kücük/ Campos Santos- AAC 24

Filter Bank (2)

• Zwei Window-Varianten auf lange Blöcke:– Sinus = Eignet sich für Signale mit dichter Spektraldarstellung– KBD (Kaiser-Bessel Derived) = Eignet sich für Signale mit weit entfernten

Frequenzbestandteilen

• Umwandlung von Zeit-Samples in Frequenz-Samples durch MDCT

Bronke/ Kücük/ Campos Santos- AAC 25

Filter Bank (3)

• Modifizierte diskrete Kosinustransformation bei Enkodierung

• Überlappung aufeinander folgender Frames um 50%– statt 2048 bzw. 256 Samples müssen

nur 1024 bzw. 128 Samples gespeichert werden

• Frequenzauflösung besser, Zeitauflösung schlechter– Problem: Pre-Echo-Effekt Lösung: block/window switching

• Umwandlung von Zeit-Samples in Frequenz-Samples– MDCT auf 1024 Samples bei langem Fenster– MDCT auf 128 Samples (8 kurze Blöcke) bei kurzem Fenster

Bronke/ Kücük/ Campos Santos- AAC 26

MDCT

Bronke/ Kücük/ Campos Santos- AAC 27

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

• Problem: Was ist mit Eingangssignalen, die irgendwo zwischen "gleichmäßig" und "impulsiv" liegen, wenn am Ende eines an sich ruhigen Blocks noch ein recht impulsives Signal folgt?

• Antwort: Rauschen oder hörbare Artefakte

• Lösung: Temporal Noise Shaping (TNS)

• Informationen im ruhigeren Teil werden feingranular kodiert Rauschen im ruhigeren Abschnitt nimmt ab

• Informationen im lebendigeren Teil werden grobgranular kodiert Rauschen im lebhafteren Teil nimmt zu

• Durch das psychoakustische Modell wird das Rauschen durch die Dynamik des Signals weitestgehend maskiert unhörbar

Bronke/ Kücük/ Campos Santos- AAC 28

Temporal Noise Shaping (1)

Bronke/ Kücük/ Campos Santos- AAC 29

Temporal Noise Shaping (2)

• Ähnliche Kodierung von hochfrequenten Signalen, die in Stereo vorliegen, ohne das ein hörbarer Unterschied entsteht

• Beispiel: Menschliches Gehör kann hohe Töne wahrnehmen, aber die Tonhöhe nicht differenzieren „Sound localization“

• Vorgehensweise:– Monosignal kodieren– Signal einmalig speichern und auf zwei Kanäle verteilen– Datenrate, ohne Qualitätsverlust, senken

• Abschnittsweise einsetzbar

Bronke/ Kücük/ Campos Santos- AAC 30

Intensity Stereo

• Die Mid/Side Stereo Kodierung basiert auf der Kodierung der beiden parallelen Kanäle eines Stereo-Audio-Signals niedrige Frequenzen

• Zwei Varianten:– Side: Links/Rechts Aufteilung Differenzwert der Stereokanäle– Mid: Summen/Differenz-Variante Mittelwert der Stereokanäle

• Links-Rechts-Aufteilung ist bei Unterschieden zwischen linkem und rechtem Signal vorteilhaft (Diagramme rechts)

• Summen-Differenzen-Variante ist bei ähnlichem linken und rechten Kanal vorteilhaft, da kaum Differenzen übertragen werden (Diagramme links)

• Verfahren mit weniger Daten wird verwendet (Festlegung eines Bits)

Bronke/ Kücük/ Campos Santos- AAC 31

Mid/Side Stereo Coding (1)

Bronke/ Kücük/ Campos Santos- AAC 32

Mid/Side Stereo Coding (2)

MID SIDE

• Voraussage nur bei annähernd konstanten Abschnitten eines Audiosignals

• Statt gleiche Information zu wiederholen, wird eine kleine Wiederholungsanweisung gegeben überflüssige Daten werden entfernt

• Voraussage ist nur bei sich wiederholenden, ähnlichen, gleichmäßigen und ruhigen Signalen möglich– Anwendung auf lange Blöcke gleichmäßige Signale

• Stellt AAC fest, dass die Voraussage nicht stimmt, so ist das Originalsignal zu kodieren

• Prediction ist nur im Main-Profile enthalten (Rechenaufwändig)

Bronke/ Kücük/ Campos Santos- AAC 33

Prediction (1)

Bronke/ Kücük/ Campos Santos- AAC 34

Prediction (2)

Bronke/ Kücük/ Campos Santos- AAC 35

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

• Frequenzlinien werden in Gruppen aufgeteilt -> Scale factor bands

• Jede Gruppe hat einen Scale factor

• Scale factor reduziert die Schrittweite der Quantisierung entsprechend den Anforderungen des Scale factor bands Je größer die Schrittweite, desto größer das Quantisierungsrauschen

• Ermöglicht eine effiziente Kodierung

Bronke/ Kücük/ Campos Santos- AAC 36

Scale factor

• Größte Datenreduktion möglich

• Quantisierung auf Basis des psychoakustischen Modells

• Hörbares wird in diskrete Werte umgewandelt Huffman-Code-Tabelle Unhörbares entfällt

• Die Huffman-Kodierung ermöglicht häufig auftretende Koeffizienten mit weniger Daten darzustellen

• Seltener vorkommende Koeffizienten benötigen mehr Daten unproblematisch, das diese selten vorkommen

• Das Signal muss ggf. in mehreren Iterationen komprimiert werden Vorgegebene Bitrate einhalten benötigt Zeit Für verzögerungskritische Anwendungen AAC LD entwickelt

Bronke/ Kücük/ Campos Santos- AAC 37

Quantisierung

• Teil der Quantisierung

• Sollte vor der Huffmann-Kodierung eingesetzt werden

• In die Menge der vorliegenden Koeffizienten wird ein Wert von +1 oder -1 eingearbeitet

• Das bisherige Signal wird zwar geringfügig geändert, ist im Allgemeinen nicht hörbar

• Dadurch können bis zu vier Koeffizienten eingebunden werden:– z.B. Informationen über die Auslenkung des Signals, eine evtl.

Phasenverschiebung und Frequenzvorkommen

Bronke/ Kücük/ Campos Santos- AAC 38

Noiseless Coding

• Kodierung basiert auf der Häufigkeitsverteilung

• 12 vordefinierte Codebooks (Huffman-Tabellen)

• Auswahl der Tabelle mit dem besten Kompressionsergebnis für ein Frequenzspektrum

• Optimiert: • niedrige Frequenzen kurze Codewörter• hohe Frequenzen lange Codewörter

• Vorteil: Kein Speicherplatz für die Tabelle notwendig

Bronke/ Kücük/ Campos Santos- AAC 39

Huffman Coding

Bronke/ Kücük/ Campos Santos- AAC 40

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

• Zwei Kontrollschleifen zur Überprüfung der…

• …Bitraten– Rate Control Loop kontrolliert, ob bei der Quantisierung, die vom Benutzer

angegebene Bitrate eingehalten wird

• …Qualität– Distortion Control Loop kontrolliert, ob das Quantisierungsrauschen

maskiert ist unhörbar bleibt

Bronke/ Kücük/ Campos Santos- AAC 41

Kontrollmechanismus

Bronke/ Kücük/ Campos Santos- AAC 42

Enkodierungsprozess (Detail)

Pre-Processing Filter-Bank

Temporal Noise Shaping

Intensity Stereo

Bitstream Coding

M/S Prediction

Scale factors Quantizer Nioseless Coding

Input Signal

Output Signal

Psyc

hoac

ousti

c M

odel

Huffman Coding

Kontrollmechanismus für Bitrate und Quantisierungrauschen

• Bitstream Coding (oder Multiplexing) organisiert die Datenübertragung

• Datenströme können je nach Bedarf aufgeteilt oder zusammengefasst werden:– Je nach Bandbreite ist es sinnvoll zunächst ein Grundgerüst der Daten zu

übertragen und erst bei vorhandener Bandbreite diese mit weiteren Informationen zu füllen

• Die Übertragung der Daten in einem Schritt ist nicht immer sinnvoll Flexible Aufteilung des Datenstroms durch AAC

• Beispiel: – Ein Monosignal sicher übertragen und im Anschluss weitere Kanäle statt

Pausen im Stereosignal aufgrund von Bandbreitenengpässen hinzunehmen

Bronke/ Kücük/ Campos Santos- AAC 43

Bitstream Coding (1)

• AAC unterteilt den Datenstrom in zwei Bereiche:– Transportbereich, der die Übertragung garantiert und organisiert und

Bandbreiten effektiv ausnutzt– Zu übertragende Blöcke:

• Audiosignale der verschiedenen Kanäle• Konfigurationsdaten (Anzahl der Kanäle, Copyright-Angaben, Sampling

Rate, ...) • Verbindungselemente, die Daten für mehrere Audioelemente enthalten • Füllelemente, wenn eine bestimmte konstante Datenrate einzuhalten ist• Ende-Element

Bronke/ Kücük/ Campos Santos- AAC 44

Bitstream Coding (2)

Formate in MPEG-2 Part 7 + MPEG-4 Part 3:• Audio Data Interchange Format (ADIF)

• Audio Data Transport Stream (ADTS)

Weitere Formate in MPEG-4 Part 3: • Low-overhead Audio Transport Multiplex (LATM)

– Multiplexing von Nutzdaten und Audio-Konfigurationsinformationen

• Low Overhead Audio Stream (LOAS)– Selbst-synchronisierendes Streaming Format

Bronke/ Kücük/ Campos Santos- AAC 45

AAC - Formate

• Audio Interchange File Format:– Dateiformat (Containerformat) zum Speichern von LPCM (Linear Pulse Code

Modulation)-Audiodaten

– Inhalt: Single Header + AAC Audio Datenblock

– Entwickelt von Apple (Standard-Audioformat auf dem Mac)

– Im Vergleich zu MP3, Vorbis bietet LPCM keine Datenkompression. • Nachteil: Große Datenmengen beim Speichern in AIFF-Dateien• Vorteil: Audiodaten können verlustfrei und ohne zusätzlichen

Rechenaufwand verarbeitet werden

– Verbreitung: Tonstudios und Musikproduktion

Bronke/ Kücük/ Campos Santos- AAC 46

AAC - Formate (ADIF)

• Audio Data Transport Stream basiert auf MPEG-TS:– standardisiertes Kommunikationsprotokoll zur Übertragung von Audio

– spezifiziert in MPEG-2 Part 1

– die Ausgabe von digitalem Audio wird durch Multiplexing synchronisiert

– Transportströme bieten eine Fehlerkorrektur bei unzuverlässigen Medien und werden bei Broadcast-Medien wie DVB und ATSC eingesetzt

– AAC-Daten ADTS-Frame PES-Paket Multiplexing durch TS Übertragung

– Inhalt: Serie von Frames mit je einem Header + AAC Audio Datenblock

Bronke/ Kücük/ Campos Santos- AAC 47

AAC - Formate (ADTS)

Bronke/ Kücük/ Campos Santos- AAC 48

AAC - Profile

MPEG-2AAC

MPEG-4AAC-LC

MPEG-4HE-AAC

MPEG-4HE-AAC v2

PNS SBR PS

1997 1999 2003 2004

MPEG-4AAC-LD/ELD

1999

“noise always sounds the same”• Dient dazu den Speicherplatz effizienter zu nutzen.

– Annahme: menschliches Gehör kann keinen wesentlichen Unterschied zwischen Geräuschen wahrnehmen. Lediglich die Lautstärke wird wahrgenommen.

1. Es wird gezielt nach Rauschen im Audiosignal gesucht.

2. Beim codieren wird nur die Lautstärke gespeichert.

Bronke/ Kücük/ Campos Santos- AAC 49

Perceptual Noise Substitution (PNS)

3. Für diesen Bereich des Audiosignals wird ein Bit (flag) gesetzt, als Hinweis, dass es Rauschen enthält.

4. Der Decoder liest das gesetzte Bit, sowie die gespeicherte Lautstärke und erzeugt einen pseudozufälligen Wert.

• Ergebnis: Kein hörbarer Unterschied, da Rauschen durch anderes Rauschen ausgetauscht werden kann.

• Gesparter Platz kann von anderen Bändern belegt werden.

Bronke/ Kücük/ Campos Santos- AAC 50

Perceptual Noise Substitution (PNS)

• AAC Low Complexity

• Leistungsfähiger Audiocodec für gute Qualität bei niedrigen Bitraten

• Verwendung: – Apple iPod, iTunes, QuickTime– Autoradios– Mobile Musikspieler– Mobiltelefone

Bronke/ Kücük/ Campos Santos- AAC 51

AAC-LC

Versucht die Nachteile der Audiokompression auszugleichen.

Bronke/ Kücük/ Campos Santos- AAC 52

Spectral Band Replication (SBR)

Audiodatei mit 128Kbps

Audiodatei mit 64Kbps

•Das menschliche Gehör wird zu höheren Frequenzen hin immer weniger anspruchsvoll.•Hochfrequente Anteile korrelieren mit den niederfrequenten Anteile.

- Zwischen der Hüllkurve im tief- und hochfrequenten Bereich besteht eine deutliche Korrelation.

- Rekonstruktion erfolgt mittels Vergleichsdaten, die beim codieren gespeichert wurden.

Bronke/ Kücük/ Campos Santos- AAC 53

Spectral Band Replication (SBR)

1. Niederfrequenten Anteil replizieren.

2. Replizierten Anteil mit Hilfe der gespeicherten SBR-Daten anpassen.

Bronke/ Kücük/ Campos Santos- AAC 54

Spectral Band Replication (SBR)

Effizienz wird um bis zu 50% gesteigert.

• Bandbreitenreduzierung eines Stereosignals – Aus einem Stereosignal wird ein Monosignal mit Zusatzinformationen

gewonnen.– Monosignal wird aus der Summe der beiden Kanäle erzeugt.

Bronke/ Kücük/ Campos Santos- AAC 55

Parameteric Stereo (PS)

• Rekonstruktion durch Zusatzinformationen:1. Phasenlage2. Lautstärkedifferenz3. Raumklanginformationen

• Einbettung der Stereo-Parameter mit einer Bitrate von ca. 2–3 kBit/s

Bronke/ Kücük/ Campos Santos- AAC 56

Parameteric Stereo (PS)

• High Efficiency AAC • Kombination aus AAC-LC mit Spectral Band Replication (SBR)• HE-AAC v2 ist um Parametric Stereo (PS) erweitert• Effizienter Codec für besonders niedrige Bitraten• Bitraten:

– HE-AAC: 32 bis 48 kbit/s– HE-AAC v2: 16 bis 24 kbit/s

• Verwendung (Beispielhaft): – DVB-H– DMB– 3GPP

Bronke/ Kücük/ Campos Santos- AAC 57

HE-AAC / HE-AAC v2

Bronke/ Kücük/ Campos Santos- AAC 58

AAC - LD Audio-Codec für Sprache. Ermöglicht geringere Verzögerungszeiten für eine Zweiwege-

Kommunikation.

Die Verzögerungszeit beträgt immer 20 ms, unabhängig von der Datenrate.

Bronke/ Kücük/ Campos Santos- AAC 59

AAC - LD Hauptunterschiede zu anderen Profilen:

Halbierung der Fenstergröße: Von 1024 auf 512 Samples. Die Zeit für die Analyse der Fenstergröße verringert sich um den Faktor 2.

• Deaktivierung des Block-Switching:• Look-ahead-Verzögerung entfällt.• TNS als Ersatz zur Eliminierung des Pre-Echo-Effekts.

Verringerung oder Deaktivierung des Bitreservoirs: Begünstigt durch eine geringere Größe eine schnellere Übertragung. 0..32 Bits erlaubt.

Bronke/ Kücük/ Campos Santos- AAC 60

Ein Vergleich

Bronke/ Kücük/ Campos Santos- AAC 61

Ausprägungen und EinflussgrößenAAC MP3

Timing Erster Standard 4 Jahre nach MP3

Einführung mit dem Start der flächendeckenden Internetnutzung

Marktreife Hohe Marktreife: subjektive Audioqualität besser als MP3 Innovation

Kompatibilität Keine Rückwärtskomptabilität Rasche Integration in Windows-Umgebungen

Nutzbarkeit und

BedingungenLizenzpflichtig

Lizenzfreie Nutzung für 5 Jahre nach Verabschiedung.

Anschließend LizenzpflichtigMarktsituation Konkurrenz: MP3 Keine vergleichbare Nutzungsform

im Markt

Liefert gleichwertige Qualität schon bei 70% der Bitrate von MP3

Mehrkanalunterstützung - MP3: (2) 5- AAC: 48

Bronke/ Kücük/ Campos Santos- AAC 62

Verbesserungen

• Stationäre Signale: Bildung größerer Blöcke bestehend aus 1024 Samples. (1024P)Zum Vergleich bei MP3: 576 Samples (32 SB x 18P= 576)– Spart Speicherplatz bei korrelierenden Signalen.

• Dynamische Signale: Bildung kleinerer Blöcke bestehend aus 128 Samples. (128P)Zum Vergleich bei MP3: 192 Samples (32 SB x 6P = 192)– Ermöglicht genauere Kodierung von stark schwankenden Signalen.

Bronke/ Kücük/ Campos Santos- AAC 63

Verbesserungen

• Höhere Bitrate möglich (8 - 529 kBit/s)Zum Vergleich MP3 (8 - 320kBit/s)

• Kombination verschiedenster Tools möglich.– SBR– PNS– PS– …

Bronke/ Kücük/ Campos Santos- AAC 64

Verbesserungen

Bronke/ Kücük/ Campos Santos- AAC 65

AAC vs MP3

MP3 AAC

Filterbank Hybrid Reine MDCT

Blockgröße für stationäre Signale 576 1024

Blockgröße für dynamische Signale 192 128

Abtastrate 8kHz-48kHz 8kHz-192kHz

Bitrate 8-320 kBit/s 8-529 kBit/s

Audiokanäle max. 5 Max. 48

Variable Bitrate Ja ja

Bronke/ Kücük/ Campos Santos- AAC 66

Demos

Bronke/ Kücük/ Campos Santos- AAC 67

Demos-Übersicht• MP3 vs. AAC LC, HE, HEv2 vs. WAV

• 32 kBit/s Bitrate

• Hörtests

• Testdateien erzeugen:– cdEX: CD -> .wav– SUPER: .wav -> .mp3– NeroAAC: wav -> .mp4

• Analyse– Audacity 1.3 mit FFmpeg

Bronke/ Kücük/ Campos Santos- AAC 68

Profil-Demos und Hörtests

Bronke/ Kücük/ Campos Santos- AAC 69

Kurze Wiederholung…

MPEG-2AAC-LC

MPEG-4AAC-LC

MPEG-4HE-AAC

MPEG-4HE-AAC v2

PNS SBR PS

1997 1999 2003 2004

Bronke/ Kücük/ Campos Santos- AAC 70

AAC Profil LC

Dateigröße: 1,08 MB

Bronke/ Kücük/ Campos Santos- AAC 71

Hörtests PNS

Bronke/ Kücük/ Campos Santos- AAC 72

AAC Profil HE

Dateigröße: 1,10 MB

Bronke/ Kücük/ Campos Santos- AAC 73

Hörtests SBR

Bronke/ Kücük/ Campos Santos- AAC 74

AAC Profil HEv2

Dateigröße: 1,03 MB

He: 1,10 MB

Bronke/ Kücük/ Campos Santos- AAC 75

Hörtests

Bronke/ Kücük/ Campos Santos- AAC 76

AAC vs MP3 vs WAV

Bronke/ Kücük/ Campos Santos- AAC 77

AAC-Hev2 vs MP3 @32 kBit/sMP3AAC Hev2

Dateigröße: 1,03 MB Dateigröße: 0,926 MB

Bronke/ Kücük/ Campos Santos- AAC 78

AAC-Hev2 vs MP3 @32 kBit/s

WAVAAC Hev2

Dateigröße: 40,84 MBDateigröße: 1,03 MB

Bronke/ Kücük/ Campos Santos- AAC 79

AAC vs MP3

64 kBit/s 128 kBit/s0

0.51

1.52

2.53

3.54

4.55

MP3AAC

Bitrate

Bew

ertu

ng• Hörtest bestätigt die höhere subjektive Qualität des AAC-Codecs

gegenüber MP3.

80

EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit

Fazit

Bronke/ Kücük/ Campos Santos- AAC

81

Fazit

Bronke/ Kücük/ Campos Santos- AAC

Vorteile:Hohe Kompression, also hohe Qualität auch bei kleinen DateigrößenMultikanalfähig, also Surround-fähigHochaufgelöste Audiosignale mit bis zu 96kHz SamplingratenSchnelle und effiziente DekodierungSehr flexibel durch Nutzen verschiedener ProfileInternationaler Standard, also hohe Akzeptanz

z.B. durch Sony, Apple, Nintendo

82

Fazit

Bronke/ Kücük/ Campos Santos- AAC

NachteileEnkoder ist kompliziert zu implementierenViele Profile

In cosumer Markt oft nur LCImplementierung kostet GeldPatentiert

83

Duygu Kücükdk068@hdm-stuttgart.de

Filipe Santosfc009@hdm-stuttgart.de

Karol Bronkekarol.bronke@hdm-stuttgart.de

Vielen Dank!Kontakt:

84

Quellen

Bronke/ Kücük/ Campos Santos- AAC

•High-Fidelity Multichannel Audio Coding – Dal Tracy Yang, Chris Kyrlakais, CC Jay Kuo

•The MPEG Handbook , MPEG-1, MPEG-2, MPEG-3 Second Edition – John Watkins

•Durchstarten mit HTML5 – Mark Pilgrim

•http://www.iis.fraunhofer.de/bf/amm/produkte/audiocodec/audiocodecs/aaclc/

•Newness guide to Television & Video Technology – K.F. Ibrahim

•Zum Bedeutungsverlust formaler Standardisierung für die Marktrelevanz von Audio-Standards zur Online-Distribution

•Multimedia Signals and Systems – Mrinal Kr. Mandal

85

Quellen

Bronke/ Kücük/ Campos Santos- AAC

•http://en.wikipedia.org/wiki/Comparison_of_audio_codecs

•http://en.wikipedia.org/wiki/Advanced_Audio_Coding

•http://upload.wikimedia.org/wikipedia/commons/3/37/AAC_profiles.svg

•http://www.chip.de/artikel/aacPlus-Technischer-Hintergrund-2_12874269.html