关于L0和L1正则项的选取

看到有人在讨论正则项的时候,提到
> 从贝叶斯学派的角度看,正则项可以看作是对模型的一个先验知识。如果线性回归先验服从高斯分布,那么就是L2范式的最小二乘;如果先验是拉普拉斯先验,那么结果就是L1范式的最小二乘。
请问这样的结论是怎么得到的呢?为什么服从高斯分布就应该用L2范式,而服从拉普拉斯就应该用L1范式呢?
多谢。

Eric_Jiang - 我是小象的搬运工!!!

赞同来自: LeviH 邹博

1459476719809.png
 

Eric_Jiang - 我是小象的搬运工!!!

赞同来自:

是假设残差服从正态分布得到的,没错. 对于正则化只是添加了一个先验分布.最开始的式子不久是根据残差推导出来的么.

要回复问题请先登录注册