二元函数判断凹凸性

二元函数凹凸性判断

二元函数凹凸性判断
f(x,y)f(x,y)f(x,y)在区域DDD上具有二阶连续偏导数,假定(x0,y0)(x_0,y_0)(x0y0)为一个驻点,且分别记为:A=fxx′′(x0,y0),B=fxy′′(x0,y0),C=fyy′′(x0,y0)A=f_{xx}^{''}(x_0,y_0),B=f_{xy}^{''}(x_0,y_0),C=f_{yy}^{''}(x_0,y_0)A=fxx(x0,y0)B=fxy(x0,y0)C=fyy(x0,y0)则:
(1)在D上恒有A>0,且AC−B2≥0⟹凸函数\qquad{(1)在D上恒有A>0,且AC-B^2\geq0\Longrightarrow凸函数}(1)DA>0,ACB20
(2)在D上恒有A<0,且AC−B2≥0⟹凹函数\qquad{(2)在D上恒有A<0,且AC-B^2\geq0\Longrightarrow凹函数}(2)DA<0,ACB20
注:这里的凸函数是指下凸,也就是我们常见的“凹函数”,只不过在机器学习中用这种叫法,毕竟是外国人发明的东西。
二元凹凸函数求最值
f(x,y)f(x,y)f(x,y)是在开区域DDD内具有连续偏导数的凸(或者凹)函数,其中(x0,y0)∈D(x_0,y_0)\in{D}(x0,y0)D,且fx′(x0,y0)=0,fy′(x0,y0)=0f_{x}^{'}(x_0,y_0)=0,f_{y}^{'}(x_0,y_0)=0fx(x0,y0)=0,fy(x0,y0)=0,则f(x0,y0)f(x_0,y_0)f(x0,y0)必定为f(x,y)f(x,y)f(x,y)在区域DDD内的最小值(或者最大值)。

这里已知函数为:
E(w,b)=∑i=1m(yi−wxi−b)2(式1) E(w,b)=\sum_{i=1}^{m}(y_i-wx_i-b)^2\tag{式1} E(w,b)=i=1m(yiwxib)2(1)
E(w,b)E(w,b)E(w,b)分别对于w,bw,bw,b求导数(偏导数),得到:
∂E(w,b)∂w=2(w⋅∑i=1mxi2−∑i=1m(yi−b)xi)(式2) \cfrac{\partial{E(w,b)}}{\partial{w}}=2(w\cdot\sum_{i=1}^{m}x_i^2-\sum_{i=1}^{m}(y_i-b)x_i)\tag{式2} wE(w,b)=2(wi=1mxi2i=1m(yib)xi)(2)
∂E(w,b)∂b=2(mb−∑i=1m(yi−wxi))(式3) \cfrac{\partial{E(w,b)}}{\partial{b}}=2(mb-\sum_{i=1}^{m}(y_i-wx_i))\tag{式3} bE(w,b)=2(mbi=1m(yiwxi))(3)
在(式2)基础上:∂2E(w,b)∂w2=∂∂w(∂E(w,b)∂w)=∂∂w(2(w⋅∑i=1mxi2−∑i=1m(yi−b)xi)) \cfrac{\partial^{2}E(w,b)}{\partial{w^2}}=\cfrac{\partial}{\partial{w}}(\cfrac{\partial{E(w,b)}}{\partial{w}})=\cfrac{\partial}{\partial{w}}(2(w\cdot\sum_{i=1}^{m}x_i^2-\sum_{i=1}^{m}(y_i-b)x_i)) w22E(w,b)=w(wE(w,b))=w(2(wi=1mxi2i=1m(yib)xi))
=∂∂w(2w⋅∑i=1mxi2)=2∑i=1mxi2(式4) =\cfrac{\partial}{\partial{w}}(2w\cdot{\sum_{i=1}^{m}x_i^2})=2\sum_{i=1}^{m}x_i^2\tag{式4} =w(2wi=1mxi2)=2i=1mxi2(4)
⟹A=fxx′′(x,y)=2∑i=1mxi2\Longrightarrow{A=f_{xx}^{''}(x,y)}=2\sum_{i=1}^{m}x_i^2A=fxx(x,y)=2i=1mxi2
∂E2(w,b)∂w∂b=∂∂b(∂E(w,b)∂w)=∂∂b(2(w⋅∑i=1mxi2−∑i=1m(yi−b)xi)) \cfrac{\partial{E^2(w,b)}}{\partial{w}\partial{b}}=\cfrac{\partial}{\partial{b}}(\cfrac{\partial{E(w,b)}}{\partial{w}})=\cfrac{\partial}{\partial{b}}(2(w\cdot\sum_{i=1}^{m}x_i^2-\sum_{i=1}^{m}(y_i-b)x_i)) wbE2(w,b)=b(wE(w,b))=b(2(wi=1mxi2i=1m(yib)xi))
=∂∂b(−2∑i=1m(yi−b)xi)=2∑i=1mxi(式5) =\cfrac{\partial}{\partial{b}}(-2\sum_{i=1}^{m}(y_i-b)x_i)=2\sum_{i=1}^{m}x_i\tag{式5} =b(2i=1m(yib)xi)=2i=1mxi(5)
⟹B=fxy′′(x,y)=2∑i=1mxi\Longrightarrow{B=f_{xy}^{''}(x,y)}=2\sum_{i=1}^{m}x_iB=fxy(x,y)=2i=1mxi
在(式3)基础上:
∂2E(w,b)∂b2=∂∂b(∂E(w,b)∂b)=∂∂b(2(mb−∑i=1m(yi−wxi)))=2m(式6) \cfrac{\partial^2E{(w,b)}}{\partial{b^2}}=\cfrac{\partial}{\partial{b}}(\cfrac{\partial{E(w,b)}}{\partial{b}})=\cfrac{\partial}{\partial{b}}(2(mb-\sum_{i=1}^{m}(y_i-wx_i))) =2m\tag{式6}b22E(w,b)=b(bE(w,b))=b(2(mbi=1m(yiwxi)))=2m(6)
⟹C=fyy′′(x,y)=2m\Longrightarrow{C=f_{yy}^{''}(x,y)}=2mC=fyy(x,y)=2m
AC−B2=4m∑i=1mxi2−[2∑i=1mxi2]2=4m∑i=1mxi2−4m1m∑i=1mxi⋅∑i=1mxi=4m(∑i=1mxi2−∑i=1mxixˉ) AC-B^2=4m\sum_{i=1}^{m}x_i^2-[2\sum_{i=1}^{m}x_i^2]^2=4m\sum_{i=1}^{m}x_i^2-4m\cfrac{1}{m}\sum_{i=1}^{m}x_i\cdot\sum_{i=1}^{m}x_i=4m(\sum_{i=1}^{m}x_i^2-\sum_{i=1}^{m}x_i{\bar{x}}) ACB2=4mi=1mxi2[2i=1mxi2]2=4mi=1mxi24mm1i=1mxii=1mxi=4m(i=1mxi2i=1mxixˉ)
4m∑i=1m(xi2−xixˉ−xixˉ+xixˉ)=4m∑i=1m(xi2−2xixˉ+xˉ2)≥0(式7) 4m\sum_{i=1}^{m}(x_i^2-x_i\bar{x}-x_i\bar{x}+x_i\bar{x})=4m\sum_{i=1}^{m}(x_i^2-2x_i\bar{x}+\bar{x}^2)\geq0\tag{式7} 4mi=1m(xi2xixˉxixˉ+xixˉ)=4mi=1m(xi22xixˉ+xˉ2)0(7)
注:上式中进行的一个替换操作为:∑i=1mxixˉ=xˉ⋅m⋅1m∑i=1mxi=mxˉ2=∑i=1mxˉ2\sum_{i=1}^{m}x_i\bar{x}=\bar{x}\cdot{m}\cdot\cfrac{1}{m}\sum_{i=1}^{m}x_i=m\bar{x}^2=\sum_{i=1}^{m}\bar{x}^2i=1mxixˉ=xˉmm1i=1mxi=mxˉ2=i=1mxˉ2
以及:1m∑i=1mxi=xˉ\cfrac{1}{m}\sum_{i=1}^{m}x_i=\bar{x}m1i=1mxi=xˉ
到这里就证明了E(w,b)E(w,b)E(w,b)为凸函数,所以就可以进行凸优化操作了。

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值