Advanced Audio Coding - AAC
description
Transcript of Advanced Audio Coding - AAC
Bronke/ Kücük/ Campos Santos- AAC 1
Advanced
Audio
Coding
2
Hochschule der Medien Stuttgart
„Multimedia Codecs“
PräsentationDuygu KücükFilipe Campos SantosKarol Bronke
Computer Science & MediaMaster
AAC
Bronke/ Kücük/ Campos Santos- AAC
3
EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit
Agenda
Bronke/ Kücük/ Campos Santos- AAC
4
Advanced Audio Coding
Bronke/ Kücük/ Campos Santos- AAC
Audiokompressionsverfahren
standardisiert
verlustbehaftet
5
Ziele
Bronke/ Kücük/ Campos Santos- AAC
Nachfolger von MP3Schwächen von MP3 minimieren, also Kodierung verbessernKonkurrenz zu Ogg Vorbis, Windows Media Audio, …Bessere Qualität bei gleicher BitrateMultikanalität
6
Features
Bronke/ Kücük/ Campos Santos- AAC
Samplingrate 8 – 96 kHzMehrkanalfähig, bis zu 48 KanäleProfile, z.B.
Niedrig, für EchtzeitkodierungHoch, für High-End Kodierung
TaggingKopierschutzverfahren möglich
7
Standardisierung
Bronke/ Kücük/ Campos Santos- AAC
MPEG
…
8
Standardisierung
Bronke/ Kücük/ Campos Santos- AAC
Spezifiziert in zwei Standards Part 7 von MPEG-2ISO/IEC 13818-7:1997
Subpart 4 in Part 3 von MPEG-4ISO/IEC 14496-3:1999
…Aktuell
ISO/IEC 14496-3:2009
9
Anwendungen
Bronke/ Kücük/ Campos Santos- AAC
Teil des MPEG-2 StandardsAudiokern des MPEG-4 StandardsHE-AAC in digitalem Radio, Mobile TV, …Dateiendungen
.aac.3gp
.mp4
.m4a, .m4b, .m4p, .m4v, .m4r
10
Anwendungen
Bronke/ Kücük/ Campos Santos- AAC
11
Lizensierung
Bronke/ Kücük/ Campos Santos- AAC
• Keine Lizenz/-Patentgebühren zu zahlenVerbreitung
• Lizenzerwerb nötigImplemen-tierung
12
Lizensierung
Bronke/ Kücük/ Campos Santos- AAC
Volume Per Unit fee
Consumer Product 1 to 500,000 units $0.98
Consumer Product 50,000,001 or more $0.15
Professional Products (Decoder/ Encoder)
1 $5.00 / $50.00
Consumer PC Software (Decoder/Encoder)
1 $0.48 / $0.98
Cellular Telephone Committed Volume Option
1 to 7,500,000 $3,000,000
Cellular Telephone Committed Volume Option
From 50,000,000 $0.06 each
AAC basiert auf „Perceptual Model“Prinzip des „Perceptual Coding“Perceptual Model nutzt Maskierung Maskierung (psychoakustischer Effekt)Durch Enkodierer wird maskierter Ton entfernt, ohne die Klangqualität zu mindern
Bronke/ Kücük/ Campos Santos- AAC 13
Techn. Eigenschaften - Einführung
14
Techn. Eigenschaften - Hörmodell
Bronke/ Kücük/ Campos Santos- AAC
Töne mit einem Schalldruckpegel unterhalb des „Maskierers“ können nicht wahrgenommen werden Keine Kodierung notwendigSignale unter der Ruhehörschwelle nicht mitkodiertBei der Digitalisierung eines Audiosignals entsteht ein Quantisierungsrauschen
Schalldruckpegel erhöht sich jeweils um 6dB, wenn die Bitzahl der Quantisierung um 1 Bit verringert wird
Anzahl der Bits kann solange verringert werden, bis das Quantisierungsrauschen knapp unter der Hörschwelle liegt und so nicht mehr hörbar ist
15
Techn. Eigenschaften - Hörmodell
Bronke/ Kücük/ Campos Santos- AAC
Allgemein• Abtastung Umwandlung Analog zu Digital • Abtastrate Abtastung erfolgt in einer bestimmten Anzahl
pro Sekunde• Dadurch wird aus analogem Signal ein digitales Signal
SamplesAAC• Entfernt werden– Nicht wahrnehmbare Signalkomponenten – Redundanzen im kodierten Audiosignal
Bronke/ Kücük/ Campos Santos- AAC 16
Codierung - Ziele
Bronke/ Kücük/ Campos Santos- AAC 17
Encoder
Filterbank
Verarbeitung & Quantisierung
Bitstrom-enkodierung
Audiosignal
Bitstrom10110111010011110101
Psychoakustisches Modell
Bronke/ Kücük/ Campos Santos- AAC 18
Decoder
Audiosignal
Bitstrom101101110101
Inverse Filterbank
Verarbeitung & Dequantisierung
Bitstrom-dekodierung
• Enkodierung– Signalumwandlung von Zeitbereich in Frequenzbereich,
durch MDCT mit “Filter Banks”– Der Frequenzbereich wird auf Basis des psychoakustischen
Effekts quantisiert und enkodiert– Interne Fehlerkorrekturen– Signal speichern (AIFF) und übermitteln (ADTS) – Um beschädigten Samples vorzubeugen, wird eine
moderne Implementation des Luhn mod N-Algorithmus eingesetzt
Bronke/ Kücük/ Campos Santos- AAC 19
Vorgehen
Bronke/ Kücük/ Campos Santos- AAC 20
Enkodierungsprozess (Übersicht)
Pre-Processing Transform Spectral
Processing Quantization
Psychoacoustic Model
Multiplex
Input Signal
Compressed Bitstream
Bloc
k ty
pe
Threshold
Bronke/ Kücük/ Campos Santos- AAC 21
Dekodierungsprozess (Übersicht)
Inverse Quantization
Inverse Spectral
Processing
Inverse Transform
Post-Processing
Demultiplex
Output Signal
Compressed Bitstream
Bloc
k ty
pe
Bronke/ Kücük/ Campos Santos- AAC 22
Enkodierungsprozess (Detail)
Pre-Processing Filter-Bank
Temporal Noise Shaping
Intensity Stereo
Bitstream Coding
M/S Prediction
Scale factors Quantizer Noiseless Coding
Input Signal
Output Signal
Psyc
hoac
ousti
c M
odel
Huffman Coding
Kontrollmechanismus für Bitrate und Quantisierungsrauschen
• Audio-Signal wird in zeitliche Blöcke (Frames) zerlegt:– Abschnitte mit gleichmäßigem Klangbild (stationary) lange Blöcke– Impulsive Abschnitte (transient) kurze Blöcke– 1 langer Block (2048 Samples) = 8 kurze Blöcke (256 Samples)
• Auf Blöcke werden Fenster (Windows) gelegt Wechsel zwischen Blöcken möglich (block/window switching)– beugt dem Pre-Echo-Effekt vor, welches durch die MDCT verursacht wird
Bronke/ Kücük/ Campos Santos- AAC 23
Filter Bank (1)
• Übergangsregeln für „block/window switching“:– Vor einem kurzen Fenster sollte (nach mehreren langen Fenstern) ein langes
Start-Fenster liegen.– Vor einem langen Fenster sollte (nach einem kurzen Fenster) ein langes Stop-
Fenster liegen.
Bronke/ Kücük/ Campos Santos- AAC 24
Filter Bank (2)
• Zwei Window-Varianten auf lange Blöcke:– Sinus = Eignet sich für Signale mit dichter Spektraldarstellung– KBD (Kaiser-Bessel Derived) = Eignet sich für Signale mit weit entfernten
Frequenzbestandteilen
• Umwandlung von Zeit-Samples in Frequenz-Samples durch MDCT
Bronke/ Kücük/ Campos Santos- AAC 25
Filter Bank (3)
• Modifizierte diskrete Kosinustransformation bei Enkodierung
• Überlappung aufeinander folgender Frames um 50%– statt 2048 bzw. 256 Samples müssen
nur 1024 bzw. 128 Samples gespeichert werden
• Frequenzauflösung besser, Zeitauflösung schlechter– Problem: Pre-Echo-Effekt Lösung: block/window switching
• Umwandlung von Zeit-Samples in Frequenz-Samples– MDCT auf 1024 Samples bei langem Fenster– MDCT auf 128 Samples (8 kurze Blöcke) bei kurzem Fenster
Bronke/ Kücük/ Campos Santos- AAC 26
MDCT
Bronke/ Kücük/ Campos Santos- AAC 27
Enkodierungsprozess (Detail)
Pre-Processing Filter-Bank
Temporal Noise Shaping
Intensity Stereo
Bitstream Coding
M/S Prediction
Scale factors Quantizer Nioseless Coding
Input Signal
Output Signal
Psyc
hoac
ousti
c M
odel
Huffman Coding
Kontrollmechanismus für Bitrate und Quantisierungrauschen
• Problem: Was ist mit Eingangssignalen, die irgendwo zwischen "gleichmäßig" und "impulsiv" liegen, wenn am Ende eines an sich ruhigen Blocks noch ein recht impulsives Signal folgt?
• Antwort: Rauschen oder hörbare Artefakte
• Lösung: Temporal Noise Shaping (TNS)
• Informationen im ruhigeren Teil werden feingranular kodiert Rauschen im ruhigeren Abschnitt nimmt ab
• Informationen im lebendigeren Teil werden grobgranular kodiert Rauschen im lebhafteren Teil nimmt zu
• Durch das psychoakustische Modell wird das Rauschen durch die Dynamik des Signals weitestgehend maskiert unhörbar
Bronke/ Kücük/ Campos Santos- AAC 28
Temporal Noise Shaping (1)
Bronke/ Kücük/ Campos Santos- AAC 29
Temporal Noise Shaping (2)
• Ähnliche Kodierung von hochfrequenten Signalen, die in Stereo vorliegen, ohne das ein hörbarer Unterschied entsteht
• Beispiel: Menschliches Gehör kann hohe Töne wahrnehmen, aber die Tonhöhe nicht differenzieren „Sound localization“
• Vorgehensweise:– Monosignal kodieren– Signal einmalig speichern und auf zwei Kanäle verteilen– Datenrate, ohne Qualitätsverlust, senken
• Abschnittsweise einsetzbar
Bronke/ Kücük/ Campos Santos- AAC 30
Intensity Stereo
• Die Mid/Side Stereo Kodierung basiert auf der Kodierung der beiden parallelen Kanäle eines Stereo-Audio-Signals niedrige Frequenzen
• Zwei Varianten:– Side: Links/Rechts Aufteilung Differenzwert der Stereokanäle– Mid: Summen/Differenz-Variante Mittelwert der Stereokanäle
• Links-Rechts-Aufteilung ist bei Unterschieden zwischen linkem und rechtem Signal vorteilhaft (Diagramme rechts)
• Summen-Differenzen-Variante ist bei ähnlichem linken und rechten Kanal vorteilhaft, da kaum Differenzen übertragen werden (Diagramme links)
• Verfahren mit weniger Daten wird verwendet (Festlegung eines Bits)
Bronke/ Kücük/ Campos Santos- AAC 31
Mid/Side Stereo Coding (1)
Bronke/ Kücük/ Campos Santos- AAC 32
Mid/Side Stereo Coding (2)
MID SIDE
• Voraussage nur bei annähernd konstanten Abschnitten eines Audiosignals
• Statt gleiche Information zu wiederholen, wird eine kleine Wiederholungsanweisung gegeben überflüssige Daten werden entfernt
• Voraussage ist nur bei sich wiederholenden, ähnlichen, gleichmäßigen und ruhigen Signalen möglich– Anwendung auf lange Blöcke gleichmäßige Signale
• Stellt AAC fest, dass die Voraussage nicht stimmt, so ist das Originalsignal zu kodieren
• Prediction ist nur im Main-Profile enthalten (Rechenaufwändig)
Bronke/ Kücük/ Campos Santos- AAC 33
Prediction (1)
Bronke/ Kücük/ Campos Santos- AAC 34
Prediction (2)
Bronke/ Kücük/ Campos Santos- AAC 35
Enkodierungsprozess (Detail)
Pre-Processing Filter-Bank
Temporal Noise Shaping
Intensity Stereo
Bitstream Coding
M/S Prediction
Scale factors Quantizer Nioseless Coding
Input Signal
Output Signal
Psyc
hoac
ousti
c M
odel
Huffman Coding
Kontrollmechanismus für Bitrate und Quantisierungrauschen
• Frequenzlinien werden in Gruppen aufgeteilt -> Scale factor bands
• Jede Gruppe hat einen Scale factor
• Scale factor reduziert die Schrittweite der Quantisierung entsprechend den Anforderungen des Scale factor bands Je größer die Schrittweite, desto größer das Quantisierungsrauschen
• Ermöglicht eine effiziente Kodierung
Bronke/ Kücük/ Campos Santos- AAC 36
Scale factor
• Größte Datenreduktion möglich
• Quantisierung auf Basis des psychoakustischen Modells
• Hörbares wird in diskrete Werte umgewandelt Huffman-Code-Tabelle Unhörbares entfällt
• Die Huffman-Kodierung ermöglicht häufig auftretende Koeffizienten mit weniger Daten darzustellen
• Seltener vorkommende Koeffizienten benötigen mehr Daten unproblematisch, das diese selten vorkommen
• Das Signal muss ggf. in mehreren Iterationen komprimiert werden Vorgegebene Bitrate einhalten benötigt Zeit Für verzögerungskritische Anwendungen AAC LD entwickelt
Bronke/ Kücük/ Campos Santos- AAC 37
Quantisierung
• Teil der Quantisierung
• Sollte vor der Huffmann-Kodierung eingesetzt werden
• In die Menge der vorliegenden Koeffizienten wird ein Wert von +1 oder -1 eingearbeitet
• Das bisherige Signal wird zwar geringfügig geändert, ist im Allgemeinen nicht hörbar
• Dadurch können bis zu vier Koeffizienten eingebunden werden:– z.B. Informationen über die Auslenkung des Signals, eine evtl.
Phasenverschiebung und Frequenzvorkommen
Bronke/ Kücük/ Campos Santos- AAC 38
Noiseless Coding
• Kodierung basiert auf der Häufigkeitsverteilung
• 12 vordefinierte Codebooks (Huffman-Tabellen)
• Auswahl der Tabelle mit dem besten Kompressionsergebnis für ein Frequenzspektrum
• Optimiert: • niedrige Frequenzen kurze Codewörter• hohe Frequenzen lange Codewörter
• Vorteil: Kein Speicherplatz für die Tabelle notwendig
Bronke/ Kücük/ Campos Santos- AAC 39
Huffman Coding
Bronke/ Kücük/ Campos Santos- AAC 40
Enkodierungsprozess (Detail)
Pre-Processing Filter-Bank
Temporal Noise Shaping
Intensity Stereo
Bitstream Coding
M/S Prediction
Scale factors Quantizer Nioseless Coding
Input Signal
Output Signal
Psyc
hoac
ousti
c M
odel
Huffman Coding
Kontrollmechanismus für Bitrate und Quantisierungrauschen
• Zwei Kontrollschleifen zur Überprüfung der…
• …Bitraten– Rate Control Loop kontrolliert, ob bei der Quantisierung, die vom Benutzer
angegebene Bitrate eingehalten wird
• …Qualität– Distortion Control Loop kontrolliert, ob das Quantisierungsrauschen
maskiert ist unhörbar bleibt
Bronke/ Kücük/ Campos Santos- AAC 41
Kontrollmechanismus
Bronke/ Kücük/ Campos Santos- AAC 42
Enkodierungsprozess (Detail)
Pre-Processing Filter-Bank
Temporal Noise Shaping
Intensity Stereo
Bitstream Coding
M/S Prediction
Scale factors Quantizer Nioseless Coding
Input Signal
Output Signal
Psyc
hoac
ousti
c M
odel
Huffman Coding
Kontrollmechanismus für Bitrate und Quantisierungrauschen
• Bitstream Coding (oder Multiplexing) organisiert die Datenübertragung
• Datenströme können je nach Bedarf aufgeteilt oder zusammengefasst werden:– Je nach Bandbreite ist es sinnvoll zunächst ein Grundgerüst der Daten zu
übertragen und erst bei vorhandener Bandbreite diese mit weiteren Informationen zu füllen
• Die Übertragung der Daten in einem Schritt ist nicht immer sinnvoll Flexible Aufteilung des Datenstroms durch AAC
• Beispiel: – Ein Monosignal sicher übertragen und im Anschluss weitere Kanäle statt
Pausen im Stereosignal aufgrund von Bandbreitenengpässen hinzunehmen
Bronke/ Kücük/ Campos Santos- AAC 43
Bitstream Coding (1)
• AAC unterteilt den Datenstrom in zwei Bereiche:– Transportbereich, der die Übertragung garantiert und organisiert und
Bandbreiten effektiv ausnutzt– Zu übertragende Blöcke:
• Audiosignale der verschiedenen Kanäle• Konfigurationsdaten (Anzahl der Kanäle, Copyright-Angaben, Sampling
Rate, ...) • Verbindungselemente, die Daten für mehrere Audioelemente enthalten • Füllelemente, wenn eine bestimmte konstante Datenrate einzuhalten ist• Ende-Element
Bronke/ Kücük/ Campos Santos- AAC 44
Bitstream Coding (2)
Formate in MPEG-2 Part 7 + MPEG-4 Part 3:• Audio Data Interchange Format (ADIF)
• Audio Data Transport Stream (ADTS)
Weitere Formate in MPEG-4 Part 3: • Low-overhead Audio Transport Multiplex (LATM)
– Multiplexing von Nutzdaten und Audio-Konfigurationsinformationen
• Low Overhead Audio Stream (LOAS)– Selbst-synchronisierendes Streaming Format
Bronke/ Kücük/ Campos Santos- AAC 45
AAC - Formate
• Audio Interchange File Format:– Dateiformat (Containerformat) zum Speichern von LPCM (Linear Pulse Code
Modulation)-Audiodaten
– Inhalt: Single Header + AAC Audio Datenblock
– Entwickelt von Apple (Standard-Audioformat auf dem Mac)
– Im Vergleich zu MP3, Vorbis bietet LPCM keine Datenkompression. • Nachteil: Große Datenmengen beim Speichern in AIFF-Dateien• Vorteil: Audiodaten können verlustfrei und ohne zusätzlichen
Rechenaufwand verarbeitet werden
– Verbreitung: Tonstudios und Musikproduktion
Bronke/ Kücük/ Campos Santos- AAC 46
AAC - Formate (ADIF)
• Audio Data Transport Stream basiert auf MPEG-TS:– standardisiertes Kommunikationsprotokoll zur Übertragung von Audio
– spezifiziert in MPEG-2 Part 1
– die Ausgabe von digitalem Audio wird durch Multiplexing synchronisiert
– Transportströme bieten eine Fehlerkorrektur bei unzuverlässigen Medien und werden bei Broadcast-Medien wie DVB und ATSC eingesetzt
– AAC-Daten ADTS-Frame PES-Paket Multiplexing durch TS Übertragung
– Inhalt: Serie von Frames mit je einem Header + AAC Audio Datenblock
Bronke/ Kücük/ Campos Santos- AAC 47
AAC - Formate (ADTS)
Bronke/ Kücük/ Campos Santos- AAC 48
AAC - Profile
MPEG-2AAC
MPEG-4AAC-LC
MPEG-4HE-AAC
MPEG-4HE-AAC v2
PNS SBR PS
1997 1999 2003 2004
MPEG-4AAC-LD/ELD
1999
“noise always sounds the same”• Dient dazu den Speicherplatz effizienter zu nutzen.
– Annahme: menschliches Gehör kann keinen wesentlichen Unterschied zwischen Geräuschen wahrnehmen. Lediglich die Lautstärke wird wahrgenommen.
1. Es wird gezielt nach Rauschen im Audiosignal gesucht.
2. Beim codieren wird nur die Lautstärke gespeichert.
Bronke/ Kücük/ Campos Santos- AAC 49
Perceptual Noise Substitution (PNS)
3. Für diesen Bereich des Audiosignals wird ein Bit (flag) gesetzt, als Hinweis, dass es Rauschen enthält.
4. Der Decoder liest das gesetzte Bit, sowie die gespeicherte Lautstärke und erzeugt einen pseudozufälligen Wert.
• Ergebnis: Kein hörbarer Unterschied, da Rauschen durch anderes Rauschen ausgetauscht werden kann.
• Gesparter Platz kann von anderen Bändern belegt werden.
Bronke/ Kücük/ Campos Santos- AAC 50
Perceptual Noise Substitution (PNS)
• AAC Low Complexity
• Leistungsfähiger Audiocodec für gute Qualität bei niedrigen Bitraten
• Verwendung: – Apple iPod, iTunes, QuickTime– Autoradios– Mobile Musikspieler– Mobiltelefone
Bronke/ Kücük/ Campos Santos- AAC 51
AAC-LC
Versucht die Nachteile der Audiokompression auszugleichen.
Bronke/ Kücük/ Campos Santos- AAC 52
Spectral Band Replication (SBR)
Audiodatei mit 128Kbps
Audiodatei mit 64Kbps
•Das menschliche Gehör wird zu höheren Frequenzen hin immer weniger anspruchsvoll.•Hochfrequente Anteile korrelieren mit den niederfrequenten Anteile.
- Zwischen der Hüllkurve im tief- und hochfrequenten Bereich besteht eine deutliche Korrelation.
- Rekonstruktion erfolgt mittels Vergleichsdaten, die beim codieren gespeichert wurden.
Bronke/ Kücük/ Campos Santos- AAC 53
Spectral Band Replication (SBR)
1. Niederfrequenten Anteil replizieren.
2. Replizierten Anteil mit Hilfe der gespeicherten SBR-Daten anpassen.
Bronke/ Kücük/ Campos Santos- AAC 54
Spectral Band Replication (SBR)
Effizienz wird um bis zu 50% gesteigert.
• Bandbreitenreduzierung eines Stereosignals – Aus einem Stereosignal wird ein Monosignal mit Zusatzinformationen
gewonnen.– Monosignal wird aus der Summe der beiden Kanäle erzeugt.
Bronke/ Kücük/ Campos Santos- AAC 55
Parameteric Stereo (PS)
• Rekonstruktion durch Zusatzinformationen:1. Phasenlage2. Lautstärkedifferenz3. Raumklanginformationen
• Einbettung der Stereo-Parameter mit einer Bitrate von ca. 2–3 kBit/s
Bronke/ Kücük/ Campos Santos- AAC 56
Parameteric Stereo (PS)
• High Efficiency AAC • Kombination aus AAC-LC mit Spectral Band Replication (SBR)• HE-AAC v2 ist um Parametric Stereo (PS) erweitert• Effizienter Codec für besonders niedrige Bitraten• Bitraten:
– HE-AAC: 32 bis 48 kbit/s– HE-AAC v2: 16 bis 24 kbit/s
• Verwendung (Beispielhaft): – DVB-H– DMB– 3GPP
Bronke/ Kücük/ Campos Santos- AAC 57
HE-AAC / HE-AAC v2
Bronke/ Kücük/ Campos Santos- AAC 58
AAC - LD Audio-Codec für Sprache. Ermöglicht geringere Verzögerungszeiten für eine Zweiwege-
Kommunikation.
Die Verzögerungszeit beträgt immer 20 ms, unabhängig von der Datenrate.
Bronke/ Kücük/ Campos Santos- AAC 59
AAC - LD Hauptunterschiede zu anderen Profilen:
Halbierung der Fenstergröße: Von 1024 auf 512 Samples. Die Zeit für die Analyse der Fenstergröße verringert sich um den Faktor 2.
• Deaktivierung des Block-Switching:• Look-ahead-Verzögerung entfällt.• TNS als Ersatz zur Eliminierung des Pre-Echo-Effekts.
Verringerung oder Deaktivierung des Bitreservoirs: Begünstigt durch eine geringere Größe eine schnellere Übertragung. 0..32 Bits erlaubt.
Bronke/ Kücük/ Campos Santos- AAC 60
Ein Vergleich
Bronke/ Kücük/ Campos Santos- AAC 61
Ausprägungen und EinflussgrößenAAC MP3
Timing Erster Standard 4 Jahre nach MP3
Einführung mit dem Start der flächendeckenden Internetnutzung
Marktreife Hohe Marktreife: subjektive Audioqualität besser als MP3 Innovation
Kompatibilität Keine Rückwärtskomptabilität Rasche Integration in Windows-Umgebungen
Nutzbarkeit und
BedingungenLizenzpflichtig
Lizenzfreie Nutzung für 5 Jahre nach Verabschiedung.
Anschließend LizenzpflichtigMarktsituation Konkurrenz: MP3 Keine vergleichbare Nutzungsform
im Markt
Liefert gleichwertige Qualität schon bei 70% der Bitrate von MP3
Mehrkanalunterstützung - MP3: (2) 5- AAC: 48
Bronke/ Kücük/ Campos Santos- AAC 62
Verbesserungen
• Stationäre Signale: Bildung größerer Blöcke bestehend aus 1024 Samples. (1024P)Zum Vergleich bei MP3: 576 Samples (32 SB x 18P= 576)– Spart Speicherplatz bei korrelierenden Signalen.
• Dynamische Signale: Bildung kleinerer Blöcke bestehend aus 128 Samples. (128P)Zum Vergleich bei MP3: 192 Samples (32 SB x 6P = 192)– Ermöglicht genauere Kodierung von stark schwankenden Signalen.
Bronke/ Kücük/ Campos Santos- AAC 63
Verbesserungen
• Höhere Bitrate möglich (8 - 529 kBit/s)Zum Vergleich MP3 (8 - 320kBit/s)
• Kombination verschiedenster Tools möglich.– SBR– PNS– PS– …
Bronke/ Kücük/ Campos Santos- AAC 64
Verbesserungen
Bronke/ Kücük/ Campos Santos- AAC 65
AAC vs MP3
MP3 AAC
Filterbank Hybrid Reine MDCT
Blockgröße für stationäre Signale 576 1024
Blockgröße für dynamische Signale 192 128
Abtastrate 8kHz-48kHz 8kHz-192kHz
Bitrate 8-320 kBit/s 8-529 kBit/s
Audiokanäle max. 5 Max. 48
Variable Bitrate Ja ja
Bronke/ Kücük/ Campos Santos- AAC 66
Demos
Bronke/ Kücük/ Campos Santos- AAC 67
Demos-Übersicht• MP3 vs. AAC LC, HE, HEv2 vs. WAV
• 32 kBit/s Bitrate
• Hörtests
• Testdateien erzeugen:– cdEX: CD -> .wav– SUPER: .wav -> .mp3– NeroAAC: wav -> .mp4
• Analyse– Audacity 1.3 mit FFmpeg
Bronke/ Kücük/ Campos Santos- AAC 68
Profil-Demos und Hörtests
Bronke/ Kücük/ Campos Santos- AAC 69
Kurze Wiederholung…
MPEG-2AAC-LC
MPEG-4AAC-LC
MPEG-4HE-AAC
MPEG-4HE-AAC v2
PNS SBR PS
1997 1999 2003 2004
Bronke/ Kücük/ Campos Santos- AAC 70
AAC Profil LC
Dateigröße: 1,08 MB
Bronke/ Kücük/ Campos Santos- AAC 71
Hörtests PNS
Bronke/ Kücük/ Campos Santos- AAC 72
AAC Profil HE
Dateigröße: 1,10 MB
Bronke/ Kücük/ Campos Santos- AAC 73
Hörtests SBR
Bronke/ Kücük/ Campos Santos- AAC 74
AAC Profil HEv2
Dateigröße: 1,03 MB
He: 1,10 MB
Bronke/ Kücük/ Campos Santos- AAC 75
Hörtests
Bronke/ Kücük/ Campos Santos- AAC 76
AAC vs MP3 vs WAV
Bronke/ Kücük/ Campos Santos- AAC 77
AAC-Hev2 vs MP3 @32 kBit/sMP3AAC Hev2
Dateigröße: 1,03 MB Dateigröße: 0,926 MB
Bronke/ Kücük/ Campos Santos- AAC 78
AAC-Hev2 vs MP3 @32 kBit/s
WAVAAC Hev2
Dateigröße: 40,84 MBDateigröße: 1,03 MB
Bronke/ Kücük/ Campos Santos- AAC 79
AAC vs MP3
64 kBit/s 128 kBit/s0
0.51
1.52
2.53
3.54
4.55
MP3AAC
Bitrate
Bew
ertu
ng• Hörtest bestätigt die höhere subjektive Qualität des AAC-Codecs
gegenüber MP3.
80
EinführungStandardisierung & LizensierungAnwendungenLizensierungTechnische EigenschaftenCodierungFormate & ProfilePerformance & VergleichDemos und HörtestsFazit
Fazit
Bronke/ Kücük/ Campos Santos- AAC
81
Fazit
Bronke/ Kücük/ Campos Santos- AAC
Vorteile:Hohe Kompression, also hohe Qualität auch bei kleinen DateigrößenMultikanalfähig, also Surround-fähigHochaufgelöste Audiosignale mit bis zu 96kHz SamplingratenSchnelle und effiziente DekodierungSehr flexibel durch Nutzen verschiedener ProfileInternationaler Standard, also hohe Akzeptanz
z.B. durch Sony, Apple, Nintendo
82
Fazit
Bronke/ Kücük/ Campos Santos- AAC
NachteileEnkoder ist kompliziert zu implementierenViele Profile
In cosumer Markt oft nur LCImplementierung kostet GeldPatentiert
83
Duygu Kücü[email protected]
Filipe [email protected]
Karol [email protected]
Vielen Dank!Kontakt:
84
Quellen
Bronke/ Kücük/ Campos Santos- AAC
•High-Fidelity Multichannel Audio Coding – Dal Tracy Yang, Chris Kyrlakais, CC Jay Kuo
•The MPEG Handbook , MPEG-1, MPEG-2, MPEG-3 Second Edition – John Watkins
•Durchstarten mit HTML5 – Mark Pilgrim
•http://www.iis.fraunhofer.de/bf/amm/produkte/audiocodec/audiocodecs/aaclc/
•Newness guide to Television & Video Technology – K.F. Ibrahim
•Zum Bedeutungsverlust formaler Standardisierung für die Marktrelevanz von Audio-Standards zur Online-Distribution
•Multimedia Signals and Systems – Mrinal Kr. Mandal
85
Quellen
Bronke/ Kücük/ Campos Santos- AAC
•http://en.wikipedia.org/wiki/Comparison_of_audio_codecs
•http://en.wikipedia.org/wiki/Advanced_Audio_Coding
•http://upload.wikimedia.org/wikipedia/commons/3/37/AAC_profiles.svg
•http://www.chip.de/artikel/aacPlus-Technischer-Hintergrund-2_12874269.html