正则化在最大似然参数估计中的解释

时间 2020-08-08 标签正则化在最大似然参数估计中解释

阅读【神经网络与机器学习】第二章的最大似然参数估计的感想。算法

书中具体内容请查看原文，大致内容就是讲最大似然参数估计算法，但其中有涉及到正则化。网络

其中的正则化项便是待估计参数W的先验几率，书中说W的先验几率是高斯分布，而且指望值为0。我一直在想为何指望值是0。我以为这涉及到对社会或者宇宙的理解。机器学习

好比我说人的身高和体重有某种w的关系，可是脱离了人，w没有任何意义，也便是说在宇宙中身高和体重就是没有任何关系的，只是在某一种限定下，二者才有参数w的关系，因此w的先验几率是高斯分布，指望值为0。学习

而w的方差又是什么？神经网络

文中说其方差若认为很大，则是表示彻底相信数据。方差大的话正则化的权重就很小，这个不知道怎么解释，请大神指教。数据