首先了解一下二维正态分布(没有学概率论正态分布了解限于高中知识)
二维正态分布
设(X,Y)设(X,Y)设(X,Y)~N(μ1,σ12;μ2,σ22;ρ)N(\mu_1,\sigma^2_1;\mu_2,\sigma^2_2;\rho)N(μ1,σ12;μ2,σ22;ρ)
(1) cov(X,Y)=ρσ1σ2cov(X,Y)=\rho\sigma_1\sigma_2cov(X,Y)=ρσ1σ2
由相关系数的定义:ρ=cov(X,Y)D(X)D(Y)\rho =\frac{cov(X,Y)}{\sqrt{D(X)D(Y)}}ρ=D(X)D(Y)cov(X,Y),可以得出。
(2) Z=k1X+k2Y+bZ=k_1X+k_2Y+bZ=k1X+k2Y+b服从正态分布
则有如下性质:
D(Z)=k12σ12+k22σ22+2k1k2ρσ1σ2D(Z) = k_1^2\sigma_1^2+k_2^2\sigma_2^2+2k_1k_2\rho\sigma_1\sigma_2D(Z)=k12σ12+k22σ22+2k1k2ρσ1σ2
(3) X与Y独立⇔ρ=0X与Y独立 \Leftrightarrow \rho=0X与Y独立⇔ρ=0
多维正态分布
函数形式:
f(x1,x2,...,xp)=1(2π)p2∣V∣12e−12(X−μ)TV−1(X−μ)f(x_1,x_2,...,x_p)=\frac{1}{(2\pi)^{\frac p2}|V|^\frac 12}e^{-\frac 12(X-\mu)^TV^{-1}(X-\mu)}f(x1,x2,...,xp)=(2π)2p∣V∣211e−21(X−μ)TV−1(X−μ), 其中V是协方差矩阵
对比一下一维的形式
f(x1,x2,...,xp)=12πσe−(x−μ)22σ2f(x_1,x_2,...,x_p)=\frac{1}{\sqrt{2\pi}\sigma} e^{\frac{-(x-\mu)^2}{2\sigma^2}}f(x1,x2,...,xp)=2πσ1e2σ2−(x−μ)2
性质
去掉了一些我觉得没啥用的性质
(1) p维正态分布由其均质向量和协方差阵唯一确定(这不是废话吗)
(2) 设 XXX~Np(μ,V)N_p(\mu,V)Np(μ,V),A是m×p常数矩阵,b是m维向量,令Y=AX+b,则YA是m\times p常数矩阵,b是m维向量,令Y = AX+b,则YA是m×p常数矩阵,b是m维向量,令Y=AX+b,则Y~Nm(Aμ+b,AVAT)N_m(A\mu+b,AVA^T)Nm(Aμ+b,AVAT)
证明:
第一个没啥好证明的,第二个D(Y)=D(AX)=cov(AX,AX)=Acov(X,X)AT=Aσ2ATD(Y)=D(AX)=cov(AX,AX)=Acov(X,X)A^T=A\sigma^2A^TD(Y)=D(AX)=cov(AX,AX)=Acov(X,X)AT=Aσ2AT
(3)若XXX~Np(μ,V)N_p(\mu,V)Np(μ,V),且∣V∣≠0,则η=(X−μ)TV−1(X−μ)|V|\neq 0,则\eta = (X-\mu)^TV^{-1}(X-\mu)∣V∣=0,则η=(X−μ)TV−1(X−μ)~χ2(p)\chi^2(p)χ2(p)
证明:
Y=V−12(X−μ),则E(Y)=V−12(X−μ)=0Y=V^{\frac {-1}2}(X-\mu),则E(Y)=V^{\frac {-1}2}(X-\mu)=0Y=V2−1(X−μ),则E(Y)=V2−1(X−μ)=0
D(Y)=V12V(V12)T=ID(Y)=V^{\frac 12}V(V^{\frac 12})^T=ID(Y)=V21V(V21)T=I,说明各个分量相互独立,而且都服从标准正态分布
又因为η=YTY=Σ1pyi2又因为 \eta = Y^TY=\Sigma_1^p y_i^2又因为η=YTY=Σ1pyi2(因为各个分量相互独立),所以η\etaη~χ2(p)\chi^2(p)χ2(p)
(4) 设XXX~Np(μ,V),V>0N_p(\mu,V),V>0Np(μ,V),V>0,则存在p×p矩阵B(BBT=V)使得X=BY+μp\times p矩阵B(BB^T=V)使得X=BY+\mup×p矩阵B(BBT=V)使得X=BY+μ,其中YYY~Np(0,Ip)N_p(0,I_p)Np(0,Ip)
实际的意义就是说如果协方差矩阵是正定矩阵,用一个标准化的正态分布矩阵可以通过线性变换和平移变换成另一个正态分布矩阵