1、监督学习:有数据也有标签
不断向计算机输入数据让其学习,并给予指导
eg:输入猫和狗的图片,并标记好哪张是猫哪张是狗
2、非监督学习:只有数据没有标签
不断向计算机输入数据,让其学习,但是不对数据进行标记,让计算机自己去学习识别每张图片的区别
eg:输入猫和狗的图片,但是不标记哪个是猫哪张是狗,让计算机自己去区分
3、半监督学习:监督学习和非监督学习的综合
它主要考虑如何利用少量有标签的样本和大量的没有标签的样本进行训练和分类
4、强化学习:从经验中总结并强化
将计算机丢到一个完全陌生的环境,或者让它完成一个从没有接触过得任务,它自己会去尝试各种手段,最后让自己成功适应这一个陌生的环境或者学会完成这件任务的方法和途径
eg:训练机器人投篮,我只需要给它一个球,并且告诉它投进给它加一分,让它自己去尝试各种投篮方法,开始可能命中率会比较低,但是它会自己学习和总结,最后会命中率越来越高,Google开发的阿尔法狗就是应用了这