svm 是什么?

一、svm 是什么?

1.SVM是统计学概念上一个有监督的学习方法,用来进行分类和回归分析。

2.SVM原理

svm是一种有坚实理论的基础的、新颖的小样本学习方法。svm的理论基础式结构风险最小化原理和基础统计学习理论的VC维理论。

二、信息论与机器学习有着怎样的关系

信息论与机器学习同为涉及计算机科学和应用数学等学科的分支领域,这两门交叉学科在起源和应用上有很多相似之处。信息论的理论体系相对成熟一些。机器学习这些年比较受欢迎,理论和应用的扩充发展速度远远更快且看不到饱和的趋势。两个方向互有交叉,但主要还是机器学习中借用信息论的方法以此拓展理论研究和应用场景,比较典型的就是借鉴信息理论创造和改进学习算法

三、如何理解贝叶斯估计??

贝叶斯理论

1.贝叶斯法则

机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。

最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。

2.先验概率和后验概率

用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被称为h的先验概率。先验概率反映了关于h是一正确假设的机会的背景知识如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

3.贝叶斯公式

贝叶斯公式提供了从先验概率P(h)、P(D)和P(D|h)计算后验概率P(h|D)的方法

p(h|D)=P(D|H)*P(H)/P(D)

P(h|D)随着P(h)和P(D|h)的增长而增长,随着P(D)的增长而减少,即如果D独立于h时被观察到的可能性越大,那么D对h的支持度越小。

4.极大后验假设

学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(MAP)

确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:

h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h属于集合H)

最后一步,去掉了P(D),因为它是不依赖于h的常量。

5.极大似然假设

在某些情况下,可假定H中每个假设有相同的先验概率,这样式子可以进一步简化,只需考虑P(D|h)来寻找极大可能假设。

h_ml = argmax p(D|h) h属于集合H

P(D|h)常被称为给定h时数据D的似然度,而使P(D|h)最大的假设被称为极大似然假设。

6.举例

一个医疗诊断问题

有两个可选的假设:病人有癌症、病人无癌症

可用数据来自化验结果:正+和负-

有先验知识:在所有人口中,患病率是0.008

对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97%

总结如下

P(cancer)=0.008, P(cancer)=0.992

P(+|cancer)=0.98, P(-|cancer)=0.02

P(+|cancer)=0.03, P(-|cancer)=0.97

问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(cancer|+)

因此极大后验假设计算如下:

P(+|cancer)P(cancer)=0.0078

P(+|cancer)P(cancer)=0.0298

hMAP=cancer

确切的后验概率可将上面的结果归一化以使它们的和为1

P(canner|+)=0.0078/(0.0078+0.0298)=0.21

P(cancer|-)=0.79

贝叶斯推理的结果很大程度上依赖于先验概率,另外不是完全接受或拒绝假设,只是在观察到较多的数据后增大或减小了假设的可能性。