正则化在最大似然参数估计中的解释

阅读【神经网络与机器学习】第二章的最大似然参数估计的感想。算法

书中具体内容请查看原文,大致内容就是讲最大似然参数估计算法,但其中有涉及到正则化。网络

其中的正则化项便是待估计参数W的先验几率,书中说W的先验几率是高斯分布,而且指望值为0。我一直在想为何指望值是0。我以为这涉及到对社会或者宇宙的理解。机器学习

好比我说人的身高和体重有某种w的关系,可是脱离了人,w没有任何意义,也便是说在宇宙中身高和体重就是没有任何关系的,只是在某一种限定下,二者才有参数w的关系,因此w的先验几率是高斯分布,指望值为0。学习

而w的方差又是什么?神经网络

文中说其方差若认为很大,则是表示彻底相信数据。方差大的话正则化的权重就很小,这个不知道怎么解释,请大神指教。数据