机器学习可以预测彩票吗

一、机器学习可以预测彩票吗

可以预测的话,人人都中奖了。只能说有可能极低预测,万一他是毫无规律的彩票你怎么预测?平时买买就行了。

二、贝叶斯组合预测方法比其他组合预测方法好在哪里?

两字 精确。!!

贝叶斯理论

1.贝叶斯法则

机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。

最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。

2.先验概率和后验概率

用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被称为h的先验概率。先验概率反映了关于h是一正确假设的机会的背景知识如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

3.贝叶斯公式

贝叶斯公式提供了从先验概率P(h)、P(D)和P(D|h)计算后验概率P(h|D)的方法

p(h|D)=P(D|H)*P(H)/P(D)

P(h|D)随着P(h)和P(D|h)的增长而增长,随着P(D)的增长而减少,即如果D独立于h时被观察到的可能性越大,那么D对h的支持度越小。

4.极大后验假设

学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(MAP)

确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:

h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h属于集合H)

最后一步,去掉了P(D),因为它是不依赖于h的常量。

5.极大似然假设

在某些情况下,可假定H中每个假设有相同的先验概率,这样式子可以进一步简化,只需考虑P(D|h)来寻找极大可能假设。

h_ml = argmax p(D|h) h属于集合H

P(D|h)常被称为给定h时数据D的似然度,而使P(D|h)最大的假设被称为极大似然假设。

6.举例

一个医疗诊断问题

有两个可选的假设:病人有癌症、病人无癌症

可用数据来自化验结果:正+和负-

有先验知识:在所有人口中,患病率是0.008

对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97%

总结如下

P(cancer)=0.008, P(cancer)=0.992

P(+|cancer)=0.98, P(-|cancer)=0.02

P(+|cancer)=0.03, P(-|cancer)=0.97

问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(cancer|+)

因此极大后验假设计算如下:

P(+|cancer)P(cancer)=0.0078

P(+|cancer)P(cancer)=0.0298

hMAP=cancer

确切的后验概率可将上面的结果归一化以使它们的和为1

P(canner|+)=0.0078/(0.0078+0.0298)=0.21

P(cancer|-)=0.79

贝叶斯推理的结果很大程度上依赖于先验概率,另外不是完全接受或拒绝假设,只是在观察到较多的数据后增大或减小了假设的可能性。

三、机器学习可以预测股票走向,靠谱么

那就要看机器里都有什么样的数据了

如果真的能够将全面的大数据进行一个预测排列 不是不可能

四、如何理解互联网成为创业的新手段

随着互联网如同空气、水、电一样无处不在地渗透入我们的工作和生活,加上移动互联网、物联网、可穿戴联网设备的普及,新的“数据”正在以指数级别的加速度产生。据说目前世界上90%的“数据”是互联网出现以后迅速产生的。

不过,抛开数据的海量化生产和存储这种表面现象,我们更加要关注的是由数据量变带来的质变,这种“质变”表现在以下3个方面:

1)数据思维

大数据时代带给我们的是一种全新的“思维方式”,思维方式的改变在下一代成为社会生产中流砥柱的时候就会带来产业的颠覆性变革!

- 分析全面的数据而非随机抽样;

- 重视数据的复杂性,弱化精确性;

- 关注数据的相关性,而非因果关系。

历来的商业变革都是由“思维方式的转变”开始的,旧的经济体制和传统的商业理念面临新的商业思维逻辑的时候,如果大脑不能与时俱进,吸收并转变为顺应潮流的新思维,通过新思维重新组织企业组织的战略、结构、文化和各种策略,那么貌似强大的体魄反而变成了企业前进的累赘。这种新思维颠覆巨头的案例最先发生在信息技术的传统领域,然后渗透到传统的商业领域:黑莓(Blackberry)、摩托罗拉、诺基亚、柯达、雅虎。。。案例比比皆是!

当然,这些企业的没落并不是因为没有“数据思维”,但他们都是被“新互联网思维”淘汰的昔日巨人。“数据思维”是最新的思想,其影响力还没有发展到导致巨头轰然倒塌。但是,如果不给予足够的重视,下一波没落王国的名单中,可能就会有你!

2)数据资产

大数据时代,我们需要更加全面的数据来提高分析(预测)的准确度,因此我们就需要更多廉价、便捷、自动的数据生产工具。除了我们在互联网虚拟世界使用浏览器、软件有意或者无意留下的各种“个人信息数据”之外,我们正在用手机、智能手表、智能手环、智能项链等各种可穿戴数码产品生产数据;我们家里的路由器、电视机、空调、冰箱、饮水机、吸尘器、智能玩具等也开始越来越智能并且具备了联网功能,这些家用电器在更好地服务我们的同时,也在生产大量的数据;甚至我们出去逛街,商户的路由器,运营商的WLAN和3G,无处不在的摄像头电子眼,百货大楼的自助屏幕,银行的ATM,加油站以及遍布各个便利店的刷卡机都在收集和生产数据。

在互联网领域,我们喜欢说“入口”这个词,“入口”对应的直接意义是“流量”,而流量在互联网领域就意味着“金钱”,这种流量变现可能是广告,可能是游戏,也可能是电商。在大数据时代,“入口”这个词还有更深刻的意义,那就是“数据生产的源头”,用户通过某个APP或者硬件产品满足某种需求的同事,也会留下一系列相关的“数据”,这些数据的合理使用可以让拥有这部分数据的企业获得更大的商业利益!所以,在“大数据”时代,意识到“数据也是资产”的公司都已经开始在各个“数据生产的源头”进行布局,可能是一个解决刚兴需求的WEB网站,也可能是一个单纯的工具APP,还可能是一个可穿戴的数码产品!

3)数据变现

有了“数据资产”,就要通过“分析”来挖掘“资产”的价值,然后“变现”为用户价值、股东价值甚至社会价值。

大数据分析的核心目的就是“预测”,在海量数据的基础上,通过“机器学习”相关的各种技术和数学建模来预测事情发生的可能性并采取相应措施。预测股价、预测机票价格、预测流感等等。

“预测事情发生的可能性”继续往下延伸,就可以通过适当的“干预”,来引导事情向着期望的方向发展。比如亚马逊和所有的电商一样,都会基于对用户的喜好及消费能力分析来推荐“商品”,引导用户提高消费金额;Google等互联网巨头也会通过各种技术手段来试图向不同的用户展现不同的广告,并称之为“精准营销”,由此来提高点击率(公司收入);网游公司也会在运营工程中通过玩家行为数据的分析来及时调整游戏关卡及计费点等设计。