Kullback-Leibler Divergence

The Kullback–Leibler divergence (KL divergence) is a measure of how one probability distribution diverges from a second, expected probability distribution. It is always non-negative and is equal to zero if and only if the two distributions are identical. The KL divergence compares the entropy of two distributions over the same random variable and can act as a measure of dissimilarity between distributions. It is commonly used as a "distance" measure between probability distributions in information theory and machine learning.

Uploaded by

AsemSaleh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

129 views6 pages

Kullback-Leibler Divergence

Uploaded by

AsemSaleh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 6

KullbackLeibler

Divergence
Contents
Definition
Properties of the Kullback-Leibler Divergence
K-L as a distance
Example
Definition
For two probability distributions f (x) and g(x) for a random
variable X, the Kullback-Leibler divergence or relative entropy
is given as:

where 0 log 0/g = 0 and p log f/0 =

The K-L Divergence compares the entropy of two distributions
over the same random variable.
In many respects it acts as a measure of dissimilarity or
distance between
distributions
Properties of the Kullback-Leibler
Divergence
D(f ||g) 0; //Positivie
D(f ||g) = 0 iff f (x) = g(x) for all x X;
D(f ||g) D(g||f ); //Asymmetric
I (X;Y ) = D(f (x, y)||f (x)f (y)). //Mutual Information

So the mutual information is the KL divergence between f (x,

y) and f (x)f (y).
It measures how far a distribution is from independence.
K-L as a distance
Tool for distinguishing between statistical populations
The Quantity log [f(x)/g(x)] is referred to as the information
in x for discrimination between the distributions f and g
Their divergence is then the mean information for
discrimination per observation from P
Example
For a random variable X = {0, 1} assume two distributions f
(x) and g(x) with
f (0) = 1 r , f (1) = r and g(0) = 1 s, g(1) = s:

If r = s then D(f ||g) = D(g||f ) = 0. //Same distribution

If r = 1/2 and s = 1/4 :

Advance Probability
No ratings yet
Advance Probability
246 pages
Kullback-Leibler Divergence
No ratings yet
Kullback-Leibler Divergence
22 pages
6 Wgan
No ratings yet
6 Wgan
215 pages
Adrl App
No ratings yet
Adrl App
139 pages
Info
No ratings yet
Info
79 pages
Kullback-Leibler Divergence - Wikipedia
No ratings yet
Kullback-Leibler Divergence - Wikipedia
23 pages
Lecture 17 - KL Divergence, Autoencoders
No ratings yet
Lecture 17 - KL Divergence, Autoencoders
54 pages
DSAI514 Lec1 Background in Prob Part3
No ratings yet
DSAI514 Lec1 Background in Prob Part3
25 pages
R Enyi Divergence and Kullback-Leibler Divergence: Tim Van Erven Peter Harremo Es, Member, IEEE
No ratings yet
R Enyi Divergence and Kullback-Leibler Divergence: Tim Van Erven Peter Harremo Es, Member, IEEE
24 pages
2a Probability
No ratings yet
2a Probability
25 pages
DSAI514 Lec2 Point Estimation Part 1
No ratings yet
DSAI514 Lec2 Point Estimation Part 1
11 pages
Statistical Distances
No ratings yet
Statistical Distances
12 pages
E4 Convdist
No ratings yet
E4 Convdist
20 pages
On Divergences and Informations in Statistics and Information Theory
No ratings yet
On Divergences and Informations in Statistics and Information Theory
19 pages
Lecture 2 Slides With Q&A 20242025
No ratings yet
Lecture 2 Slides With Q&A 20242025
38 pages
R Enyi Divergence and Kullback-Leibler Divergence: Tim Van Erven Peter Harremo Es, Member, IEEE
No ratings yet
R Enyi Divergence and Kullback-Leibler Divergence: Tim Van Erven Peter Harremo Es, Member, IEEE
24 pages
Kullback-Leibler Divergence
No ratings yet
Kullback-Leibler Divergence
13 pages
A Gentle Introduction To Cross-Entropy For Machine Learning
No ratings yet
A Gentle Introduction To Cross-Entropy For Machine Learning
24 pages
Distance
No ratings yet
Distance
18 pages
MUML Preliminiaries
No ratings yet
MUML Preliminiaries
24 pages
Dialnet GeodesicDistributionInGraphTheory 5232963
No ratings yet
Dialnet GeodesicDistributionInGraphTheory 5232963
12 pages
Reply To Various Issues Around The L 1-Norm Distan
No ratings yet
Reply To Various Issues Around The L 1-Norm Distan
8 pages
KL Divergence
No ratings yet
KL Divergence
8 pages
5th Lesson Comparison Tests
No ratings yet
5th Lesson Comparison Tests
15 pages
F Divergence PDF
No ratings yet
F Divergence PDF
13 pages
Divergence, Entropy, Information: Phil Chodrow
No ratings yet
Divergence, Entropy, Information: Phil Chodrow
18 pages
Sketching Information Divergence
No ratings yet
Sketching Information Divergence
15 pages
Divergences
No ratings yet
Divergences
8 pages
New Proofs
No ratings yet
New Proofs
8 pages
Information Theory and Log-Likelihood Models: A Basis For Model Selection and Inference
No ratings yet
Information Theory and Log-Likelihood Models: A Basis For Model Selection and Inference
22 pages
Kullback Leibler Divergence Monotonicity of The Metropolis Hastings Markov Chains
No ratings yet
Kullback Leibler Divergence Monotonicity of The Metropolis Hastings Markov Chains
6 pages
2a Probability4
No ratings yet
2a Probability4
7 pages
Divergence Measures Based On The Shannon Entropy: Member
No ratings yet
Divergence Measures Based On The Shannon Entropy: Member
7 pages
Sol Information Theory 1
No ratings yet
Sol Information Theory 1
4 pages
Ri D RQ Ri Qi: That Which Follows From Observations and Facts Rather Than From Theory or Logic
No ratings yet
Ri D RQ Ri Qi: That Which Follows From Observations and Facts Rather Than From Theory or Logic
2 pages
Worksheet 1
No ratings yet
Worksheet 1
2 pages
Lecture 3: Entropy, Relative Entropy, and Mutual Information
No ratings yet
Lecture 3: Entropy, Relative Entropy, and Mutual Information
5 pages
Midterm Lab Quiz 1 - Attempt Review
No ratings yet
Midterm Lab Quiz 1 - Attempt Review
7 pages
Principal Component Analysis
100% (1)
Principal Component Analysis
17 pages
Tom Belulovich: N N N 1 N N 1 N N 1 N N 1 N
No ratings yet
Tom Belulovich: N N N 1 N N 1 N N 1 N N 1 N
5 pages
Relative Entropy
No ratings yet
Relative Entropy
6 pages
Kullback-Leibler Divergence Estimation of Continuous Distributions
No ratings yet
Kullback-Leibler Divergence Estimation of Continuous Distributions
5 pages
At Salak Is 2009
No ratings yet
At Salak Is 2009
2 pages
EE5143 Tutorial2
No ratings yet
EE5143 Tutorial2
2 pages
Information Geometry of Maxent Principle
No ratings yet
Information Geometry of Maxent Principle
37 pages
Statistical Distance
No ratings yet
Statistical Distance
3 pages
Class3 ML MaxEnt
No ratings yet
Class3 ML MaxEnt
6 pages
Lecture 3: Entropy, Relative Entropy, and Mutual Information
No ratings yet
Lecture 3: Entropy, Relative Entropy, and Mutual Information
5 pages
Divergence Tests
No ratings yet
Divergence Tests
2 pages
2.4 Measuring The Goodness of Fit
No ratings yet
2.4 Measuring The Goodness of Fit
5 pages
A Gentle Introduction To The Kernel Distance: 1 Definitions
No ratings yet
A Gentle Introduction To The Kernel Distance: 1 Definitions
9 pages
Proposed Algorithm
No ratings yet
Proposed Algorithm
3 pages
Cse 150 HW1
No ratings yet
Cse 150 HW1
2 pages
Entropy and Kullback-Leibler Divergence
No ratings yet
Entropy and Kullback-Leibler Divergence
5 pages
Father Friends Mother Sons Sister Wife Brother I Love You
No ratings yet
Father Friends Mother Sons Sister Wife Brother I Love You
66 pages
Notes On Kullback-Leibler Divergence and Likelihood Theory
No ratings yet
Notes On Kullback-Leibler Divergence and Likelihood Theory
4 pages
MIT18.650. Statistics For Applications Fall 2016. Problem Set 3
No ratings yet
MIT18.650. Statistics For Applications Fall 2016. Problem Set 3
3 pages
Poster Distances
No ratings yet
Poster Distances
1 page
Poster Distances
No ratings yet
Poster Distances
1 page
Distributed Shared Memory
100% (1)
Distributed Shared Memory
20 pages
Decision Trees
100% (2)
Decision Trees
16 pages
KNIME - Seven Techs For Dimensionality Reduction
No ratings yet
KNIME - Seven Techs For Dimensionality Reduction
17 pages
Multimedia Information Retrieval
No ratings yet
Multimedia Information Retrieval
11 pages
A Short Introduction To System Biology
No ratings yet
A Short Introduction To System Biology
12 pages
Quantum Mechanical Explanation For Dark Energy, Cosmic Coincidence, Flatness, Age, and Size of The Universe
No ratings yet
Quantum Mechanical Explanation For Dark Energy, Cosmic Coincidence, Flatness, Age, and Size of The Universe
8 pages
Calculus Refresher
From Everand
Calculus Refresher
A. A. Klaf
3/5 (8)
Elements of Partial Differential Equations
From Everand
Elements of Partial Differential Equations
Ian N. Sneddon
4.5/5 (14)
The Summation of Series
From Everand
The Summation of Series
Harold T. Davis
4/5 (1)

Kullback-Leibler Divergence

Uploaded by

Kullback-Leibler Divergence

Uploaded by

KullbackLeibler

where 0 log 0/g = 0 and p log f/0 =

So the mutual information is the KL divergence between f (x,

If r = s then D(f ||g) = D(g||f ) = 0. //Same distribution

If r = 1/2 and s = 1/4 :

You might also like