博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
坐标下降法(Coordinate descent)
阅读量:4287 次
发布时间:2019-05-27

本文共 1150 字,大约阅读时间需要 3 分钟。

首先介绍一个算法:coordinate-wise minimization

题的描述:给定一个可微的凸函数,如果在某一点x,使得f(x)在每一个坐标轴上都是最小值,那么f(x)是不是一个全局的最小值。

形式化的描述为:是不是对于所有的d,i都有

这里的代表第i个标准基向量。

答案为成立。

这是因为:

但是问题来了,如果对于凸函数f,若不可微该会怎样呢?

答案为不成立,上面的图片就给出了一个反例。

那么同样的问题,现在,其中g是可微的凸函数,每一个hi都是凸的?

答案为成立。

证明如下,对每一个y

坐标下降(Coordinate descent):

这就意味着,对所有的,其中g是可微的凸函数,每一个hi都是凸的,我们可以使用坐标下降寻求一个最小值,我们从一个最初的猜想开始,对k进行循环:

每一次我们解决了,我们都会使用新的值。

Tseng (2001)的开创性工作证明:对这种f(f在紧集上连续,且f到达了其最小值),的极限值,k=1,2,3….是f的一个最小元(minimizer)。

在实分析领域:

随后收敛与x*( Bolzano-Weierstrass)

收敛于f*( monotoneconvergence)

其中:

坐标下降的顺序是任意的,可以是从1到n的任意排列。

可以在任何地方将单个的坐标替代成坐标块

关键在于一次一个地更新,所有的一起更新有可能会导致不收敛

我们现在讨论一下坐标下降的应用:

线性回归:

,A有p列:

最小化xi,对所有的xj,j不等于i:

解得:

坐标下降重复这个更新对所有的

对比坐标下降与梯度下降在线性回归中的表现(100个实例,n=100,p=20)

将坐标下降的一圈与梯度下降的一次迭代对比是不是公平呢?是的。

其中r=y-Ax。每一次的坐标更新需要O(n)个操作,其中O(n)去更新r,O(n)去计算,所以一圈就需要O(np),跟梯度下降是一样的。

我们用相同的例子,用梯度下降进行比较,似乎是与计算梯度下降的最优性相违背。

那么坐标下降是一个一阶的方法吗?事实上不是,它使用了比一阶更多的信息。

现在我们再关注一下支持向量机:

SVM对偶中的坐标下降策略:

SMO(Sequentialminimal optimization)是两块的坐标下降,使用贪心法选择下一块,而不是用循环。

回调互补松弛条件(complementaryslackness conditions):

v,d,s是原始的系数,截距和松弛,其中,使用任何的(1)中i使得来计算d,利用(1)(2)来计算2.

SMO重复下面两步:

选出不满足互补松弛的αi,αj

最小化i,αj使所有的变量满足条件

第一步使用启发式的方法贪心得寻找αi,αj,第二步使用等式约束。

你可能感兴趣的文章
【Win7如何一步同步文件夹的视图】
查看>>
【升级内存提升运行速度】
查看>>
金馆长qq表情包●绿色版【金馆长表情252个】
查看>>
卡巴斯基安全部队2013中文免费版【可免费使用一个月】
查看>>
【Win8网络被攻击教你手动绑定ARP技巧】
查看>>
【让U盘的使用记录在注册表中消失的方法】
查看>>
【找回Win8系统不见的附件目录&小工具】
查看>>
【教你几种禁止修改IP的方法】
查看>>
思量QQ本地会员v3.8官方2013版【免费使用部分QQ会员功能】
查看>>
【U盘修复工具的使用教程】
查看>>
【问答解题:xp无法连接wpa加密怎么办?】
查看>>
【Win7系统 沙滩啤酒桌面主题】
查看>>
【.NET支持上下左右移动操作】
查看>>
【Android 调用谷歌语音识别】
查看>>
【Win7系统保护功能可恢复误删文件】
查看>>
【利用TableView实现QQ好友列表】
查看>>
【农民要翻身电脑主题 热门主题】
查看>>
【delphi程序设计改进可读性一法】
查看>>
【详解Windows7系统审核监控功能】
查看>>
【用Win7备份与还原让系统轻松回魂】
查看>>