一、机器学习中的目标函数,损失函数,代价函数有什么区别
y是机器学习的目标,我们用数学的方法构建了一个现实的模型f(x,w),用它来表示x与y之间的关系(当然这个关系的好坏,与模型的选择关系密切),F(x)=f(x,w)就是我们一般所说的目标函数。模型定好了,我们要做的是对w进行优化调准,使得f(x,w)对于x与y之间的关系描述更准确。当然完全一致,在现实的复杂问题中是不太可能的,所以就有了误差一说。我们将实际误差用一个函数表示就是“损失函数”L(y,f(x,w)),现实中这个损失函数也是不能完全准确表示的,然而我们又要用这个损失函数来量化误差,从而指导w的优化调准,于是就退而求其次,找到一些近似的替代方案,比如均方误差等,我们用它们来评估模型的好坏,并指导训练的迭代,这便是代价函数Cost(y,f(x,w))。损失函数与代价函数的主要区别就是一个是真实的理想,另一个是现实的缺憾。
二、cost function里的cost指的是什么cost
cost是指成本costfunction成本函数costfunction成本函数机器学习中的costfunction有哪些squareloss:平方差absoluteloss:绝对值logloss这几个常用,其他还有很多。costfunction什么意思matlab在matlab中,costfunction是成本
三、在神经网络中weight decay起到的做用是什么?momentum
在机器学习或者模式识别中,会出现overfitting,而当网络逐渐overfitting时网络权值逐渐变大,因此,为了避免出现overfitting,会给误差函数添加一个惩罚项,常用的惩罚项是所有权重的平方乘以一个衰减常量之和。其用来惩罚大的权值。
权值衰减惩罚项使得权值收敛到较小的绝对值,而惩罚大的权值。因为大的权值会使得系统出现过拟合,降低其泛化性能。
momentum是一种 参数更新方式。为了避免当某一方向梯度过大的时候,W基本就是改方向更新,从而引入了v,类似惯性的想法。当出现某方向过大的梯度时,保持一部分原来的v,再加上一个较小的梯度更新。这样的梯度下降轨迹就能抑制震荡。
四、在面试数据分析时,具体会被问到什么问题?情大神指教……
我们公司的笔试题 1. 朴素贝叶斯公式 2. python lambda,map 使用实例 3. 生日悖论题目的变换体,这题难倒了好多人 4. 举例3个损失函数,在gbdt中解释损失函数的计算过程,自创一个损失函数,和其他的相比缺点优势都是啥 5. ranfor 和svm的区别,从多个角度衡量(送分题)主要目的和前面几家不大一样,因为公司依赖机器学习,所以开放性的问题问得很少,上来就干基础知识,因为这个其实应该在学校就搞定~