0% found this document useful (0 votes)

250 views

Pca Vs Pls

The document compares PCA and PLS methods. It first discusses linear regression and its optimization problem to minimize squared error. It then covers PCA, which finds the directions of maximum variance in the data through eigendecomposition of the covariance matrix to compress the data, ignoring information about the variable y. PLS is then discussed as relating the projection directions to both X and y.

Uploaded by

Bryan R. Balajadia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

250 views

Pca Vs Pls

Uploaded by

Bryan R. Balajadia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 20

PCA vs PLS

Maya Hristakeva

University of California, Santa Cruz

May 13, 2009

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 1 / 20

Outline

1 Linear Regression

2 Prinicpal Component Analysis

3 Partial Least Squares

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 2 / 20

Outline

Setup

Data matrix (instances as columns):

X = [x1 ... xT ] ∈ RN x T

Reference values:

y = [y1 ... yT ]T ∈ RT x 1

Goal: minimize square loss

T
1X T 1
min (xi w − yi )2 ≡ min ||XT w − y||2
w 2 w 2
i=1

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 3 / 20

Outline

Variance and Covariance

1
PT
Expectation of X = [x1 ... xT ]: E[X] = T i=1 xi
Variance of X:
T
1 X
var(X) = cov(X, X) = (xi − E[X])(xi − E[X])T
T i=1

Covariance of X = [x1 ... xT ] and Z = [z1 ... zT ]

T
1 X
cov(X, Z) = (xi − E[X])(zi − E[Z])T
T i=1

In this presentation, we assume that X and y are mean-centered:

E[X] = 0 and E[y] = 0

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 4 / 20

Linear Regression

Outline

1 Linear Regression

2 Prinicpal Component Analysis

3 Partial Least Squares

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 5 / 20

Linear Regression

Linear Regression
Least Squares optimization problem:
T
1X T 1
L(w) = min (xi w − yi )2 ≡ min ||XT w − y||2
w 2 w 2
i=1

Differentiate w.r.t. w:

∇w L(w) = X(XT w − y) = 0
XXT w = Xy

Exact solution:
w? = (XXT )−1 Xy
Note: XXT is not always invertible

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 6 / 20

Linear Regression

Ridge Regression

Regularization penalizes large values of ||w||22

1 λ
L(w) = min ||XT w − y||2 + ||w||2
w 2 2
Differentiate w.r.t. w:

∇w L(w) = X(XT w − y) + λw = 0
(XXT + λI)w = Xy

Exact solution:
w? = (XXT + λI)−1 Xy
Note: XXT + λI is always invertible for λ > 0

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 7 / 20

Prinicpal Component Analysis

Outline

1 Linear Regression

2 Prinicpal Component Analysis

3 Partial Least Squares

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 8 / 20

Prinicpal Component Analysis

Compression Loss Minimization

Find a rank k projection matrix P for which the compression loss is

minimized:
T
X
min ||Pxi − xi ||2 ≡ min ||PX − X||2
P P
i=1
= min tr ((I − P)XXT )
P
= max tr (PXXT )
P
T
X
= max tr var (P̃T xi )
P̃
i=1

where P is a projection matrix of rank k.

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 9 / 20

Prinicpal Component Analysis

Projection Matrix Properties

Properties of P:
P2 = P ∈ RNxN
P = ki=1 pi pTi = P̃P̃T for P̃ = [p1 ...pk ] ∈ RNxK
P

pTi pi = 1 (i.e. pi has unit-length)

pTi pj = 0 for i 6= j (i.e. pi and pj are orthogonal)

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 10 / 20

Prinicpal Component Analysis

Variance Maximization
Find k projection directions P̃ = [p1 ...pk ] for which the variance of
the compressed data (P̃T X) is maximized:
T T
X 1 X T
max tr var (P̃T xi ) ≡ max tr (P̃ xi )(P̃T xi )T
P̃
i=1
P̃ T i=1
N
1 X T
= max tr (xi P̃P̃T} xi )
P̃ T i=1 | {z
P
N
1 X
= max tr (P (xi xTi ))
P T i=1
1
= max tr (P XXT )
P
|T {z }
C

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 11 / 20

Prinicpal Component Analysis

PCA Solution
Let C = XXT : covariance matrix of X
X
max tr (PC) = max tr (P( γi ci cTi )
P P
i
X
= max γi tr (cTi Pci )
P | {zP }
i
cT
i Pci ≤1, i cT
i Pci =k
X
≤ max
P γi δi
0≤δi ≤1, i δi =k
i
k
X
= max γij = k largest eigenvalues of C
1≤i1 <i2 <ik ≤n
j=1

Hence, P consists of the eigenvectors corresponding to the k largest

eigenvalues of C.
Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 12 / 20
Prinicpal Component Analysis

Principal Component Regression

Principal Component Regression ≡ PCA + Linear Regression

Use PCA to find a k−rank projection matrix P = P̃P̃T

min ||PX − X||2

Minimize square loss

1
arg min ||(P̃T X)T w − y||2
w 2
Solution:

w? = (P̃T XXT P̃)−1 P̃T Xy ∈ Rk x 1

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 13 / 20

Prinicpal Component Analysis

Summary of PCA

Finds a set of k orthogonal direction

Directions of maximum variance of XXT
Minimizes compression error (i.e. best approximation of X)
Ignores all information about y while constructing the projection
matrix P

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 14 / 20

Partial Least Squares

Outline

1 Linear Regression

2 Prinicpal Component Analysis

3 Partial Least Squares

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 15 / 20

Partial Least Squares

Partial Least Squares (PLS)

Finds components from X that are also relevant to y
PLS finds projection directions for which the covariance between
X and y is maximized:
T
X
T 2
arg max(cov (X pi , y)) = arg max( (xTj pi )yj )2
pi pi
j=1
T
X
= arg max(tr (pTi (xj yj ))2
pi
j=1

= arg max(tr (pTi Xy))2

= arg max(pTi Xy)(pTi Xy)T

= arg max pTi XyyT XT pi

pi
Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 16 / 20
Partial Least Squares

Finding the First PLS Direction p1

Finding p1

arg max pT1 XyyT XT p1 s.t. pT1 p1 = 1

L(p1 , λ) = pT1 XyyT XT p1 − λ(pT1 p1 − 1)

∇p1 L = XyyT XT p1 − λp1 = 0
XyyT XT p1 = λp1

Hence, p1 is the largest eigenvector of XyyT XT .

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 17 / 20

Partial Least Squares

Finding the remaining k − 1 PLS directions

Since (XyyT XT ) is a rank-1 matrix, an additional orthogonality

constraints is used to find the remaining k − 1 PLS projection
directions

arg max pTi XyyT XT pi

s.t. pTi pi = 1 and pTi XXT pj = 0 for1 ≤ j < i

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 18 / 20

Partial Least Squares

PLS Regression
PLS Regression ≡ PLS Decomposition + Linear Regression
Use PLS to find a projection directions pi

max(cov (XT pi , y))2

s.t. pTi pi = 1 and pTi XXT pj = 0 for1 ≤ j < i

Minimize square loss
1
arg min ||(P̃T X)T w − y||2
w 2
Solution:
w? = (P̃T XXT P̃)−1 P̃T Xy
for P̃ = [p1 ... pk ]
Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 19 / 20
Partial Least Squares

Summary

PCA and PLS:

Differ in the optimization problem they solve to find a projection
matrix P
Are all linear decomposition techniques
Can be combined with various loss function other than square
loss

Maya Hristakeva et.al. (UCSC) PCA vs PLS May 13, 2009 20 / 20

Chapter 10. Dimensionality Reduction With PCA
No ratings yet
Chapter 10. Dimensionality Reduction With PCA
23 pages
Dimension Reduction
No ratings yet
Dimension Reduction
23 pages
Principal Components Regression
No ratings yet
Principal Components Regression
14 pages
SSRN-id1631359
No ratings yet
SSRN-id1631359
17 pages
DimensionalityReduction Pca
No ratings yet
DimensionalityReduction Pca
24 pages
کتاب نهم بارگزاری شده
No ratings yet
کتاب نهم بارگزاری شده
55 pages
Partial Least Squares Regression and Projection On Latent Structure Regression (PLS Regression)
No ratings yet
Partial Least Squares Regression and Projection On Latent Structure Regression (PLS Regression)
10 pages
Chemometrics in EXCEL - 8
No ratings yet
Chemometrics in EXCEL - 8
24 pages
Overview and Recent Advances in Partial Least Squares: Lecture Notes in Computer Science November 2005
No ratings yet
Overview and Recent Advances in Partial Least Squares: Lecture Notes in Computer Science November 2005
19 pages
Pca PDF
No ratings yet
Pca PDF
6 pages
An Overview of Methods in Linear Least-Squares Regression
No ratings yet
An Overview of Methods in Linear Least-Squares Regression
69 pages
Machine Learning (CSO851) - Lecture 03
No ratings yet
Machine Learning (CSO851) - Lecture 03
71 pages
11668a5f867641748200d0bfd6a889a3_hst951_7
No ratings yet
11668a5f867641748200d0bfd6a889a3_hst951_7
32 pages
PCA ChrisDing4
No ratings yet
PCA ChrisDing4
74 pages
Lecture 9 - Data Reduction
No ratings yet
Lecture 9 - Data Reduction
36 pages
Lec_16_PCA
No ratings yet
Lec_16_PCA
64 pages
Pca PDF
No ratings yet
Pca PDF
33 pages
Data Analytics Courses in Pune
No ratings yet
Data Analytics Courses in Pune
25 pages
Lecture 12 - Unsupervised- PCA
No ratings yet
Lecture 12 - Unsupervised- PCA
17 pages
Dimension Reduction and Hidden Structure: 1.1 Principal Component Analysis (PCA)
No ratings yet
Dimension Reduction and Hidden Structure: 1.1 Principal Component Analysis (PCA)
40 pages
Probabilistic & Unsupervised Learning: Maneesh@gatsby - Ucl.ac - Uk
No ratings yet
Probabilistic & Unsupervised Learning: Maneesh@gatsby - Ucl.ac - Uk
10 pages
New Routes From Minimal Approximation Error To Principal Components
No ratings yet
New Routes From Minimal Approximation Error To Principal Components
14 pages
Principal Component Regression, Partial Least Squares, Linear Classification
No ratings yet
Principal Component Regression, Partial Least Squares, Linear Classification
19 pages
Pca Lda Lobo
No ratings yet
Pca Lda Lobo
20 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
60 pages
Literature Review On Partial Least Squares
100% (2)
Literature Review On Partial Least Squares
4 pages
PCA
100% (1)
PCA
33 pages
W4.2 DataPreProcessing-PCA (1)
No ratings yet
W4.2 DataPreProcessing-PCA (1)
22 pages
bbl016
No ratings yet
bbl016
13 pages
Week12_PCA_BayesianInference_before_lecture
No ratings yet
Week12_PCA_BayesianInference_before_lecture
82 pages
PCA
100% (1)
PCA
45 pages
PCA1
No ratings yet
PCA1
45 pages
Abdi 2003 PLSRegression
No ratings yet
Abdi 2003 PLSRegression
7 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
45 pages
2 - 4 Principal Component Analysis (PCA)
No ratings yet
2 - 4 Principal Component Analysis (PCA)
15 pages
10 Pca
No ratings yet
10 Pca
26 pages
PCA Basics
No ratings yet
PCA Basics
1 page
5 Data Pre Processing III
No ratings yet
5 Data Pre Processing III
30 pages
Journal of Statistical Software: The Pls Package: Principal Component and Partial Least Squares Regression in R
No ratings yet
Journal of Statistical Software: The Pls Package: Principal Component and Partial Least Squares Regression in R
23 pages
PCA Princeton
No ratings yet
PCA Princeton
26 pages
Dim Reduction & Pattern Recognition
No ratings yet
Dim Reduction & Pattern Recognition
63 pages
AA11_Unsupervised Learning_2024 (2)
No ratings yet
AA11_Unsupervised Learning_2024 (2)
39 pages
Lecture 9_PCA
No ratings yet
Lecture 9_PCA
44 pages
Principal Components Analysis
No ratings yet
Principal Components Analysis
16 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
19 pages
Week 9 Lecture - Revision Test-dual-translated
No ratings yet
Week 9 Lecture - Revision Test-dual-translated
92 pages
10-701/15-781, Machine Learning: Homework 5: Aarti Singh Carnegie Mellon University
No ratings yet
10-701/15-781, Machine Learning: Homework 5: Aarti Singh Carnegie Mellon University
13 pages
PCA and Sparse PCA Principal Component Analysis
No ratings yet
PCA and Sparse PCA Principal Component Analysis
2 pages
Lecture 3
No ratings yet
Lecture 3
14 pages
PCA revis-BoW PDF
No ratings yet
PCA revis-BoW PDF
47 pages
Partial Least Square
No ratings yet
Partial Least Square
29 pages
Data Reduction Techniques
No ratings yet
Data Reduction Techniques
41 pages
abdi-PLSC and PLSR2012
No ratings yet
abdi-PLSC and PLSR2012
31 pages
Dimensionality Reduction by Pca: Non - Feasible
No ratings yet
Dimensionality Reduction by Pca: Non - Feasible
26 pages
Kumar 2017
No ratings yet
Kumar 2017
13 pages
PCA Biology
No ratings yet
PCA Biology
45 pages
Presentation
No ratings yet
Presentation
31 pages
Useful Formulae: Mathematical & Physical
From Everand
Useful Formulae: Mathematical & Physical
Matthew Watkins
No ratings yet
Topics on Tournaments in Graph Theory
From Everand
Topics on Tournaments in Graph Theory
John W. Moon
No ratings yet
Student Solutions Manual to Accompany Economic Dynamics in Discrete Time, secondedition
From Everand
Student Solutions Manual to Accompany Economic Dynamics in Discrete Time, secondedition
Yue Jiang
4.5/5 (2)
Quantum Machine Learning
No ratings yet
Quantum Machine Learning
24 pages
Course Structure Syllabus B.tech ME
No ratings yet
Course Structure Syllabus B.tech ME
48 pages
EigenFunctions, EigenValues & Examples
No ratings yet
EigenFunctions, EigenValues & Examples
5 pages
AM Syllabus Mumbai University BSC It
No ratings yet
AM Syllabus Mumbai University BSC It
2 pages
R22B Tech CSDCourseStructure, IIIYearSyllabus
No ratings yet
R22B Tech CSDCourseStructure, IIIYearSyllabus
65 pages
Rayleigh-Ritz Analysis of Sandwich Beams: Journal of Sound and Ibration (2001) 241 (4), 643) 652
No ratings yet
Rayleigh-Ritz Analysis of Sandwich Beams: Journal of Sound and Ibration (2001) 241 (4), 643) 652
10 pages
Analisis Sistem Dinamik ... (13 HLM)
No ratings yet
Analisis Sistem Dinamik ... (13 HLM)
7 pages
18.085 Computational Science and Engineering I: Mit Opencourseware
No ratings yet
18.085 Computational Science and Engineering I: Mit Opencourseware
13 pages
ML - Module 2
No ratings yet
ML - Module 2
16 pages
Linear Algebra Notes
No ratings yet
Linear Algebra Notes
3 pages
Graph Representation Learning
No ratings yet
Graph Representation Learning
141 pages
Practice Questions
No ratings yet
Practice Questions
395 pages
bemech-r2023book (1)
No ratings yet
bemech-r2023book (1)
155 pages
SEMESTER new curriculum
No ratings yet
SEMESTER new curriculum
44 pages
268 - MA8251 Engineering Mathematics II - Anna University 2017 Regulation Syllabus
No ratings yet
268 - MA8251 Engineering Mathematics II - Anna University 2017 Regulation Syllabus
3 pages
Ee263 Homework Solutions
100% (1)
Ee263 Homework Solutions
4 pages
MML Book PDF
No ratings yet
MML Book PDF
416 pages
(George v. Bassis) Kms-Condition
No ratings yet
(George v. Bassis) Kms-Condition
12 pages
Lab-Manual TIET MATLAB
No ratings yet
Lab-Manual TIET MATLAB
24 pages
Ma3151 Matrices and Calculus 1876243520 Que Bank (Ma3151) Mat&Cal
No ratings yet
Ma3151 Matrices and Calculus 1876243520 Que Bank (Ma3151) Mat&Cal
19 pages
Homework 7 Solutions: 5.2 - Diagonalizability
No ratings yet
Homework 7 Solutions: 5.2 - Diagonalizability
7 pages
M.Sc. Data Science Syllabus Final draft for submission (1)
No ratings yet
M.Sc. Data Science Syllabus Final draft for submission (1)
33 pages
BSC (Chem) Final Version Jan05
No ratings yet
BSC (Chem) Final Version Jan05
50 pages
Unit 1 Engg Maths
No ratings yet
Unit 1 Engg Maths
166 pages
PHYS4055 - Mathematical Methods 1 (Dec. Exam) - Course Handbook
No ratings yet
PHYS4055 - Mathematical Methods 1 (Dec. Exam) - Course Handbook
3 pages
Revision For Phase Portraits
No ratings yet
Revision For Phase Portraits
3 pages
Lee Smolin-Temporal Relationalism
No ratings yet
Lee Smolin-Temporal Relationalism
34 pages
8.06 Barton Notes
No ratings yet
8.06 Barton Notes
176 pages
Mat4101 Linear-Algebra-And-optimization Th 1.0 4 Mat4101 Linear Algebra and Optimization
No ratings yet
Mat4101 Linear-Algebra-And-optimization Th 1.0 4 Mat4101 Linear Algebra and Optimization
3 pages
Final Solutions
No ratings yet
Final Solutions
15 pages