一、如何直观的解释back propagation算法
BackPropagation算法是多层神经网络的训练中举足轻重的算法。
简单的理解,它的确就是复合函数的链式法则,但其在实际运算中的意义比链式法则要大的多。
要回答题主这个问题“如何直观的解释back propagation算法?” 需要先直观理解多层神经网络的训练。
机器学习可以看做是数理统计的一个应用,在数理统计中一个常见的任务就是拟合,也就是给定一些样本点,用合适的曲线揭示这些样本点随着自变量的变化关系。
深度学习同样也是为了这个目的,只不过此时,样本点不再限定为(x, y)点对,而可以是由向量、矩阵等等组成的广义点对(X,Y)。而此时,(X,Y)之间的关系也变得十分复杂,不太可能用一个简单函数表示。然而,人们发现可以用多层神经网络来表示这样的关系,而多层神经网络的本质就是一个多层复合的函数。借用网上找到的一幅图[1],来直观描绘一下这种复合关系。
二、学统计学应该学哪个软件?SPSS SAS Matlab 还是R
学统计学SPSS SAS Matlab R这些软件都要学。SPSS适合入门,SAS在数据处理方面更强,R跟MATLAB更灵活可以很方便的自己写算法。
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
统计学的英文statistics最早源于现代拉丁文statisticum collegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说:它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。
三、SAS、R、SPSS 学哪种统计软件???
关于他们的特点我以前转的文章中有详细比较!由于本人学的时间不长,现就自己的体会提一些看法、、、无论你学哪种软件,基础的统计学基本知识是必备的!所以说,要先把统计学学好!虽然现在,许多软件的操作都越来越“人性化”,只需点菜单对话框即可!例如SPSS!就连SAS这种靠编程运算的分析软件也可以用ANALYST直接点对话框进行统计分析!但是其缺点也是很明显的:采用对话框法只能获得一些相对简单的粗糙的结果!只有用编程法才能获得理想的统计结果!对于SAS来说,SAS语言编程才是SAS软件的精华,只有利用SAS语言编写的程序才能更有效的发挥SAS的强大功能!!!SAS编程能力很重要,但是使用SAS采集、处理、管理数据,同时知道如何进行分析获得希望的结果是更为重要的,前面是工具,后面是方法。所以必须具备扎实的专业知识! A :您是认为医学统计不用像那么sas那么专业的统计软件吧?因为用sas要写成堆的语句。但是,同样的,像soccy推荐的r,oxedit我估计也不在您的选择之列,因为这些东东同样也需要像编程那样写大堆的语句(事实上,好多这类软件的语法都比较接近c ,那就更复杂了!)我想您心目中理想的医学统计软件可能就是那种不用语法,用菜单就能完成任务的。这样的软件无疑是最适合非统计专业人士使用的。比如spss就提供了非常易用的界面。但是这样的软件至少有两点不足:一是最新的统计方法无法加入到软件中,必须等待软件升级;二是一个统计任务中总有许多重复的操作,如果光用菜单的话,无疑是累死人的 B:无论你用什么软件;我的观点是,使用偏重编程语言的软件包(比如Guass, S, Matlab, Stata...)可以帮助学生理解统计模块之后的数学计算(你可以轻易地用S或Stata内含的矩阵语言从头写出一个做OLS regression的模块,一步一步地展示如何将纸上的公式变成可运行的计算机代码,从而消除学生对这些技术的神秘感和迷信);这方面SAS /Stat是差了一些,不过还有SAS/IML and SAS/ETS吗,不过很少有人熟悉这些模块拔了。最讨厌的就是象SPSS这样的东西,把所有模块做成菜单,什么统计背景都不用有,点两下鼠标就会出来一堆似是而非的数字(而且往往是错的,SPSS统计模块bug之多可说举世无匹)。抛砖引玉,希望大家继续讨论。