Audio Indexing: Feature Extraction

This document discusses audio indexing, which typically involves feature extraction from an audio signal, feature selection, and classification. Common feature extraction methods include temporal features directly from the time domain signal, such as crest factor and envelope properties. Spectral features are computed from the Fourier transform spectrum, including statistical moments. Cepstral features like MFCCs are also often used as they model the signal as a source-filter system like speech. The extracted features are then classified to recognize instruments, genres, or other properties of the audio content.

Uploaded by

Srinivas

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views1 page

Audio Indexing: Feature Extraction

Uploaded by

Srinivas

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Audio Indexing

Figure 1. A typical architecture for a statistical audio indexing system based on a traditional bag-of frames
approach. In a problem of automatic musical instrument recognition, each class represents an instrument or a A
family of instruments.

the musical signal. Note that the knowledge of note crossing rate and envelope amplitude modula-
onset positions allows for other important applications tion.
such as Audio-to-Audio alignment or Audio-to-Score • Cepstral features: Such features are widely used
alignment. in speech recognition or speaker recognition due
However a number of different audio indexing to a clear consensus on their appropriateness for
tasks will share a similar architecture. In fact, a typical these applications. This is duly justified by the fact
architecture of an audio indexing system includes two that such features allow to estimate the contribu-
or three major components: A feature extraction module tion of the filter (or vocal tract) in a source-filter
sometimes associated with a feature selection module model of speech production. They are also often
and a classification or decision module. This typical used in audio indexing applications since many
“bag-of-frames” approach is depicted in Figure 1. audio sources also obey a source filter model. The
These modules are further detailed below. usual features include the Mel-Frequency Cepstral
Coefficients (MFCC), and the Linear-Predictive
Feature Extraction Cepstral Coefficients (LPCC).
• Spectral features: These features are usually com-
The feature extraction module aims at representing puted on the spectrum (magnitude of the Fourier
the audio signal using a reduced set of features that Transform) of the time domain signal. They in-
well characterize the signal properties. The features clude the first four spectral statistical moments,
proposed in the literature can be roughly classified in namely the spectral centroid, the spectral width,
four categories: the spectral asymmetry defined from the spectral
skewness, and the spectral kurtosis describing
• Temporal features: These features are directly the peakedness/flatness of the spectrum. A num-
computed on the time domain signal. The ad- ber of spectral features were also defined in the
vantage of such features is that they are usually framework of MPEG-7 such as for example the
straightforward to compute. They include amongst MPEG-7 Audio Spectrum Flatness and Spectral
others the crest factor, temporal centroid, zero- Crest Factors which are processed over a number
of frequency bands (ISO, 2001). Other features

Instrument Recognition
No ratings yet
Instrument Recognition
1 page
Feature Analysis and Extraction For Audio Automatic Classification
No ratings yet
Feature Analysis and Extraction For Audio Automatic Classification
6 pages
Variation and The Frequency
No ratings yet
Variation and The Frequency
1 page
Content-Based Classification of Musical Instrument Timbres: Agostini Longari Pollastri
100% (1)
Content-Based Classification of Musical Instrument Timbres: Agostini Longari Pollastri
8 pages
Musical Instrument Timbres Classification With Spectum
100% (1)
Musical Instrument Timbres Classification With Spectum
10 pages
First Research Paper
No ratings yet
First Research Paper
15 pages
Automatic Music Timbre Indexing
No ratings yet
Automatic Music Timbre Indexing
1 page
3 Deec 51 Ae 28 Ba 013 A 4
No ratings yet
3 Deec 51 Ae 28 Ba 013 A 4
5 pages
Efficient Index-Based Audio Matching
No ratings yet
Efficient Index-Based Audio Matching
14 pages
Review Analysis of Real World Noise: Dheeraj Joshi, Prashant Moud
No ratings yet
Review Analysis of Real World Noise: Dheeraj Joshi, Prashant Moud
6 pages
article - audio intent detection classification problem
No ratings yet
article - audio intent detection classification problem
4 pages
Chap 5 Audio Dbms
No ratings yet
Chap 5 Audio Dbms
16 pages
ZsaDescriptors A Library
No ratings yet
ZsaDescriptors A Library
5 pages
11111111111111
No ratings yet
11111111111111
4 pages
Musical Genre Classification by Instrumental Features: Dannenberg, Thom, and Watson
No ratings yet
Musical Genre Classification by Instrumental Features: Dannenberg, Thom, and Watson
4 pages
s10844-010-0140-5
No ratings yet
s10844-010-0140-5
22 pages
Es Sem04 Paper 04307909
No ratings yet
Es Sem04 Paper 04307909
17 pages
Automatic Musical Instrument
No ratings yet
Automatic Musical Instrument
1 page
1804.01212
No ratings yet
1804.01212
19 pages
Audio Segmentation in AAC Domain For Content
No ratings yet
Audio Segmentation in AAC Domain For Content
4 pages
Cross-Correlation As A Measure For Cross-Modal Analysis of Music and Floor Data
No ratings yet
Cross-Correlation As A Measure For Cross-Modal Analysis of Music and Floor Data
5 pages
Multimedia Auditory Signal Analysis
No ratings yet
Multimedia Auditory Signal Analysis
17 pages
Music database retrieval based on spectral similarity.
No ratings yet
Music database retrieval based on spectral similarity.
9 pages
Aggregate Features and A B For Music Classification: DA Oost
No ratings yet
Aggregate Features and A B For Music Classification: DA Oost
12 pages
JournalNX-Mp3 File Retrieval
No ratings yet
JournalNX-Mp3 File Retrieval
3 pages
Information 12 00263 v2
No ratings yet
Information 12 00263 v2
15 pages
Automatic Genre Classification of Music Content: (A Survey)
No ratings yet
Automatic Genre Classification of Music Content: (A Survey)
28 pages
Audio Indexing: Gaël Richard
No ratings yet
Audio Indexing: Gaël Richard
1 page
(Burges, Platt, Jana) Distortion Discriminant Anal
No ratings yet
(Burges, Platt, Jana) Distortion Discriminant Anal
10 pages
Advanced Audio Identification Using MPEG-7 Content Description
No ratings yet
Advanced Audio Identification Using MPEG-7 Content Description
12 pages
Content-Based Music Similarity Search and Emotion Detection
No ratings yet
Content-Based Music Similarity Search and Emotion Detection
4 pages
Speaker Recognition Using Vocal Tract Features
No ratings yet
Speaker Recognition Using Vocal Tract Features
5 pages
spearfinal05
No ratings yet
spearfinal05
4 pages
Chapter - 1: 1.1 Introduction To Music Genre Classification
No ratings yet
Chapter - 1: 1.1 Introduction To Music Genre Classification
57 pages
Speaker Recognition System Using MFCC and Vector Quantization
No ratings yet
Speaker Recognition System Using MFCC and Vector Quantization
7 pages
Music Source Separation: Francisco Javier Cifuentes Garc Ia
No ratings yet
Music Source Separation: Francisco Javier Cifuentes Garc Ia
7 pages
A Music Data Mining and Retrieval Primer: Dan Berger Dberger@cs - Ucr.edu May 27, 2003
No ratings yet
A Music Data Mining and Retrieval Primer: Dan Berger Dberger@cs - Ucr.edu May 27, 2003
6 pages
Vocal Segment Classification in Popular Music
No ratings yet
Vocal Segment Classification in Popular Music
6 pages
An Audio Classification Approach Using Feature Extraction Neural Network Classification Approch
No ratings yet
An Audio Classification Approach Using Feature Extraction Neural Network Classification Approch
6 pages
Timbre Id
No ratings yet
Timbre Id
6 pages
Final Survey Paper1
No ratings yet
Final Survey Paper1
5 pages
Similarly Presented and Having
No ratings yet
Similarly Presented and Having
1 page
Querying Large Collections of Music For Similarity Matt Welsh
No ratings yet
Querying Large Collections of Music For Similarity Matt Welsh
13 pages
Audio-Based Music Classification
100% (1)
Audio-Based Music Classification
47 pages
Computer Vision For Music Identification
No ratings yet
Computer Vision For Music Identification
8 pages
Audio Fingerprinting Based On Normalized Spectral Subband Moments
No ratings yet
Audio Fingerprinting Based On Normalized Spectral Subband Moments
4 pages
icme06-final
No ratings yet
icme06-final
4 pages
Pitch Histograms in Audio and Symbolic
No ratings yet
Pitch Histograms in Audio and Symbolic
24 pages
AudioFingerprinting
No ratings yet
AudioFingerprinting
5 pages
A Comparative Study in Automatic Recognition of Broadcast Audio
No ratings yet
A Comparative Study in Automatic Recognition of Broadcast Audio
4 pages
Expert Systems With Applications: P. Dhanalakshmi, S. Palanivel, V. Ramalingam
No ratings yet
Expert Systems With Applications: P. Dhanalakshmi, S. Palanivel, V. Ramalingam
7 pages
Similarity_Analysis_of_Modern_Genre_Music_Based_on_Billboard_Hits
No ratings yet
Similarity_Analysis_of_Modern_Genre_Music_Based_on_Billboard_Hits
11 pages
Audio Matching Via Chroma-Based Statistical Features
No ratings yet
Audio Matching Via Chroma-Based Statistical Features
8 pages
Speech Chapter 4
No ratings yet
Speech Chapter 4
41 pages
Emilia ResearchWork
No ratings yet
Emilia ResearchWork
114 pages
Basic Features of Audio Signals (音訊的基本特徵) : Jyh-Shing Roger Jang (張智星) MIR Lab, CS Dept, Tsing Hua Univ. Hsinchu, Taiwan
No ratings yet
Basic Features of Audio Signals (音訊的基本特徵) : Jyh-Shing Roger Jang (張智星) MIR Lab, CS Dept, Tsing Hua Univ. Hsinchu, Taiwan
18 pages
Evaluation MFCC For Music Similarity
No ratings yet
Evaluation MFCC For Music Similarity
5 pages
025 What Effect Audio Quality Robustness MFCC Chroma Features
No ratings yet
025 What Effect Audio Quality Robustness MFCC Chroma Features
6 pages
Digital Filters Design for Signal and Image Processing
From Everand
Digital Filters Design for Signal and Image Processing
Mohamed Najim
No ratings yet
Time-Frequency Domain for Segmentation and Classification of Non-stationary Signals: The Stockwell Transform Applied on Bio-signals and Electric Signals
From Everand
Time-Frequency Domain for Segmentation and Classification of Non-stationary Signals: The Stockwell Transform Applied on Bio-signals and Electric Signals
Ali Moukadem
No ratings yet
Bio in For Matics
No ratings yet
Bio in For Matics
1 page
Bibliomining For Library Decision-Making: Background
No ratings yet
Bibliomining For Library Decision-Making: Background
1 page
Machine Learning Tools: (Scherf Et. Al. 2005)
No ratings yet
Machine Learning Tools: (Scherf Et. Al. 2005)
1 page
Discussed The Application
No ratings yet
Discussed The Application
1 page
Databases and Ontologies
No ratings yet
Databases and Ontologies
1 page
Bioinformatics Programmers
No ratings yet
Bioinformatics Programmers
1 page
Historic Nature of Data
No ratings yet
Historic Nature of Data
1 page
Familiar With The Browser
No ratings yet
Familiar With The Browser
1 page
Bibliomining For Library Decision-Making: Key Terms
No ratings yet
Bibliomining For Library Decision-Making: Key Terms
1 page
Provides More Accurate Recommendations
No ratings yet
Provides More Accurate Recommendations
1 page
American Standard Code For Informa
No ratings yet
American Standard Code For Informa
1 page
Have Realized The Importance
No ratings yet
Have Realized The Importance
1 page
Modified For This Purpose
No ratings yet
Modified For This Purpose
1 page
Key Terms: A Bayesian Based Machine Learning Application To Task Analysis
No ratings yet
Key Terms: A Bayesian Based Machine Learning Application To Task Analysis
1 page
Business Areas Served
No ratings yet
Business Areas Served
1 page
Categories of Customer Behavior
No ratings yet
Categories of Customer Behavior
1 page
Best Practices in Data Warehousing: Les Pang
No ratings yet
Best Practices in Data Warehousing: Les Pang
1 page
The Framework For Behavioral Pattern-Based Clustering
No ratings yet
The Framework For Behavioral Pattern-Based Clustering
1 page
A Bayesian Based Machine Learning Application To Task Analysis
No ratings yet
A Bayesian Based Machine Learning Application To Task Analysis
1 page
Recorded Phone Conversations Between
No ratings yet
Recorded Phone Conversations Between
1 page
Task Analysis Compared
No ratings yet
Task Analysis Compared
1 page
Bayesian Based Machine Learning
No ratings yet
Bayesian Based Machine Learning
1 page
A Small Set of Digital Library
No ratings yet
A Small Set of Digital Library
1 page
What Are Musical Pitch
No ratings yet
What Are Musical Pitch
1 page
Support Vector Machines
No ratings yet
Support Vector Machines
1 page
Their Semantic and Multidimen
No ratings yet
Their Semantic and Multidimen
1 page
Proceedings of International Symposium
No ratings yet
Proceedings of International Symposium
1 page
Dirlik Examples
No ratings yet
Dirlik Examples
13 pages
Energy Detectiion of Unknown Deterministic Signals by Harry Urkowitz
No ratings yet
Energy Detectiion of Unknown Deterministic Signals by Harry Urkowitz
9 pages
Instant download Pulsed Electromagnetic Fields for Clinical Applications 1st Edition Marko Markov (Editor) pdf all chapter
100% (3)
Instant download Pulsed Electromagnetic Fields for Clinical Applications 1st Edition Marko Markov (Editor) pdf all chapter
55 pages
Stochastic Formulation of Ecological Models and Their Applications
No ratings yet
Stochastic Formulation of Ecological Models and Their Applications
9 pages
Unit 3 Cathode Ray Oscilloscope: Subject Code: EC306 Class: BE (ECE) - 2 Year
No ratings yet
Unit 3 Cathode Ray Oscilloscope: Subject Code: EC306 Class: BE (ECE) - 2 Year
39 pages
LN86S-FC
No ratings yet
LN86S-FC
11 pages
Signals and Systems
No ratings yet
Signals and Systems
3 pages
Sampling Theorem and Pulse Modulation
No ratings yet
Sampling Theorem and Pulse Modulation
27 pages
سلاسل ماركوف 1
No ratings yet
سلاسل ماركوف 1
49 pages
Unit 4 Nyquist Sampling Theorem, Pulse Amplitude
No ratings yet
Unit 4 Nyquist Sampling Theorem, Pulse Amplitude
40 pages
W1129
No ratings yet
W1129
16 pages
IEEE Tutorial Course - High Impedance Faults
No ratings yet
IEEE Tutorial Course - High Impedance Faults
48 pages
Sankaran Et Al 2012 Suppression of High Mach Number Rocket Jet Noise by Water Injection
No ratings yet
Sankaran Et Al 2012 Suppression of High Mach Number Rocket Jet Noise by Water Injection
7 pages
Dpipe: Calculation Sample and Recommended Sequence For Entering Input Data
No ratings yet
Dpipe: Calculation Sample and Recommended Sequence For Entering Input Data
14 pages
Non-Destructive Testing of Joints in Precast Element Structures
No ratings yet
Non-Destructive Testing of Joints in Precast Element Structures
10 pages
SIGNALPROCESSING KTU Whole Syllabus
No ratings yet
SIGNALPROCESSING KTU Whole Syllabus
65 pages
Chapter One
No ratings yet
Chapter One
29 pages
Spectrum Averaging vs. More Spectrum Lines - A Comparative Study of Enhancement Effects On Spectrum
No ratings yet
Spectrum Averaging vs. More Spectrum Lines - A Comparative Study of Enhancement Effects On Spectrum
12 pages
A Procedure For Combining Vertical and Horizontal Seismic Action Effects
No ratings yet
A Procedure For Combining Vertical and Horizontal Seismic Action Effects
19 pages
Signals and Systems
100% (1)
Signals and Systems
69 pages
PTSP Jntu Previous Question Papers
0% (1)
PTSP Jntu Previous Question Papers
24 pages
Sensitivity Analysis of SHAKE Based Soil Site Response Modelling
No ratings yet
Sensitivity Analysis of SHAKE Based Soil Site Response Modelling
10 pages
Strong Ground Motion
No ratings yet
Strong Ground Motion
43 pages
Slgnal: A Calculation of The Capacity of A Twisted-Wire Pair
No ratings yet
Slgnal: A Calculation of The Capacity of A Twisted-Wire Pair
3 pages
Automatic Multichannel Volcano-Seismic Classification Using Machine Learning and EMD
No ratings yet
Automatic Multichannel Volcano-Seismic Classification Using Machine Learning and EMD
10 pages
Image Deconvolution by Nonlinear Signal Processing: Bahram Javidi, H. John Caulfield, and Joseph L. Horner
No ratings yet
Image Deconvolution by Nonlinear Signal Processing: Bahram Javidi, H. John Caulfield, and Joseph L. Horner
6 pages
Voice Morphing
83% (6)
Voice Morphing
23 pages
Taha Load Patren 3
No ratings yet
Taha Load Patren 3
48 pages
Sivakumar2017 Chapter StochasticTimeSeriesMethods
No ratings yet
Sivakumar2017 Chapter StochasticTimeSeriesMethods
48 pages
R16B TECHEIESyllabus
No ratings yet
R16B TECHEIESyllabus
24 pages

Audio Indexing: Feature Extraction

Uploaded by

Audio Indexing: Feature Extraction

Uploaded by

Audio Indexing

You might also like