MASK: Robust Local Features for Audio Fingerprinting

Xavier Anguera, Antonio Garzón and Tomasz Adamek

Telefonica Research

Outline

• What is audio fingerprinting• MASK proposal• Experiments• Conclusions

watermarking fingerprinting

What makes a good audio fingerprint?

MASK FIngerprint

Robustness

EfficiencyCompactness

Discriminability

MASK == Masked Audio Spectral Keypoints

Considered prior art

• Avery Wang, “An industrial strength audio search algorithm,” in Proc. ISMIR, 2003.

• Jaap Haitsma and Antonius Kalker, “A highly robust audio fingerprinting system,” in Proc. ISMIR, 2002.

• Shumeet Baluja and Michele Covell, “Waveprint: Efficient wavelet-based audio fingerprinting”, Proc. Pattern Recognition 41 (2008)

FFT 1024, bandwidth limited to 300-3KHz

10ms, 100ms Hamming window

18 or 34 MEL-spectrum bands

Selection of salient spectral points

1. Detect all maximas2. Trim to the desired

number

(“beautiful”, Timit-female) time

Mel spectrum

α=0.98 σ=40

Spectral masking around salient points

Spectral Regions• Include one or several time-

frequency values• Overlaps are allowed• The number of comparisons

defines the size of the fingerprint• Designed manually (for now)

Current MASK regions

19 frames = 190ms

5 MEL bands

Fingerprint encoding

• 4-5 bits for the MEL band where the maxima is located

• 22 Bits obtained from spectral regions comparison

Indexing and retrieval

011…00001…01

…100…11

(movie1, 10); (movie6, 4); (movie9, 1) ; (movie7, 34) (movie5, 35); (movie7, 80)…(movie9, 24); (movie3, 5); (movie8, 11)

Reference inverted file index

MASK FP Content ID

Time offset

QUERY MASK0->011…001->100…11

…13->111…0114->011…0115->000…10

Exact matching

-Nq 0 Nq

Matching Segment end

Matching segment start

Hamming > 4 -> 0Hamming < 4 -> 1 Final score

Experimental section

database

NIST-TRECVID 2010-2011 data for video-copy detection– 400h reference videos– 1400 audio queries per year (201 unique videos X 7)– 7 audio transformations

• original• MP3 compression• MP3 compression + multiband companding• Bandwidth limit (500-3K) + single-band companding• Mixed with speech• Mixed with speech + multiband companding• Mixed with speech + bandwidth limit + monoband companding

Metric & baseline

• normalized detection cost rate (NDCR) in balanced profile

• Compare results with a similar fingerprint to the Philips fingerprint

Jaap Haitsma and Antonius Kalker, “A highly robust audio fingerprinting system,” in Proc. International Symposium on Music Information Retrieval (ISMIR), 2002.

Comparison per transformation

Scores histogram

Conclusions

• A novel binary fingerprint is proposed to improve on some shortcomings from well reputed prior art.

• We show that we can extract the FP and use it for VCD with excellent results

MASK: Robust Local Features for Audio Fingerprinting

Technology

Transcript of MASK: Robust Local Features for Audio Fingerprinting

Molecular Analyst Fingerprinting, Fingerprinting Plus, and Fingerprinting … · 2009. 9. 3. · Molecular Analyst Fingerprinting, Fingerprinting Plus, and Fingerprinting DST Software

DNA Fingerprinting. Content The structure of DNA History of DNA fingerprinting DNA Electrophoresis DNA fingerprinting application.

Digital Fingerprinting

Fingerprinting Merit Badge Pamphlet - be4real.combe4real.com/ScoutingStuff/MeritBadgeBooks/Fingerprinting Merit... · qqA Troop 1292 # MERIT BADGE SERIES FINGERPRINTING Fingerprint

Occlusion Robust Face Recognition Based on Mask Learning With … · 2019. 10. 23. · Occlusion Robust Face Recognition Based on Mask Learning With Pairwise Differential Siamese

ArubaOS DHCP Fingerprinting - Airheads CommunityArubaOS DHCP Fingerprinting Application Note Aruba Networks, Inc. Deploying DHCP Fingerprinting | 9!! un_0485!!! The ArubaOS DHCP fingerprinting

FINGERPRINTING ANALYSIS

MiniCase4 Fingerprinting

Robust video fingerprinting system Daniel Pereirad.pereira@skillupjapan.co.jp Luis Loyolaloyola@skillupjapan.co.jp.

IEEE TRANSACTIONS ON ROBOTICS 1 Robust … · IEEE TRANSACTIONS ON ROBOTICS 1 Robust Recognition of Simultaneous Speech By a ... missing feature theory-based speech ... mask only

ROBUST WATERMARKING TECHNIQUES FOR COLOR …scc/seminars/ROBUST WATERMARKING... · Cryptography, Steganography and Watermarking ¾Fingerprinting uses some kind of hash functions to

Robust video fingerprinting system

Challenging convention – outperforming …€¢ Robust and accurate quantification of milk powder • PASS/FAIL analysis of incoming goods with FingerPrinting • FDA CFR 21 Part

Watermarking and Fingerprinting for Global Broadcast ... · Watermarking & Fingerprinting Video Watermarking (VWM) Audio Fingerprinting (AFP) Audio Watermarking (AWM) Video Fingerprinting

Cytometric Fingerprinting: Quantitative … Fingerprinting

DNA Fingerprinting

Brain Fingerprinting

Karyotypes, DNA Fingerprinting, and Meiosis · DNA Fingerprinting and Karyotyping ... DNA Fingerprinting ... Karyotypes, DNA Fingerprinting, and Meiosis Author: ajohnson01

Barin Fingerprinting

A Robust Classifier for Passive TCP/IP Fingerprinting · A Robust Classiﬁer for Passive TCP/IP Fingerprinting Rob Beverly MIT CSAIL rbeverly@csail.mit.edu April 20, 2004 PAM 2004