对称Dirichleet分布的 α 和 1的关系

老师您好:
对于对称Dirichleet分布的 α 和 1的关系有点晕,如果牵着到主体模型的话。
首先是α=1和α<1,听老师的课后我总结如下:
    如果令α=1,因为是均匀分布,所以可以先验认为一篇文档对应所有主题的概率都相同。
    如果令α<1,由主题模型PPT第20页和第21页可以清晰的看出,文档最终会“滑向”某一个主题或某一部分主题,所以可以先验认为一篇文档只聚类一部分主题的概率大。

问题1:
    上面两个总结有问题吗?
问题2:
    关于α>1(主要就是这个,这个把我彻底弄晕了)
    因为 α>1时:p 1 =p 2 =…=p k 的概率增大,所以    如果令α>1,难道是不还是和α=1的先验情况一样了(即:可以先验认为一篇文档对应所有主题的概率都相同)?
    老师可否像上面的黑体字那样给一个“如果令α>1,....”的答案。

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自: 鲲鹏 小竹风

α=1的总结不太准确,事实上,α=1意味着“没有先验信息”:所有主题分布都是以等概率被采样。 α>1意味着取主题分布相等的概率是最大的。

鲲鹏

赞同来自: 小竹风

现在α>1了解了,不过α=1和α>1的区别有点晕。 感觉α=1这个“没有先验信息”是先验的认为主题分布相等。 是我哪里理解的不对吗?  

鲲鹏

赞同来自:

哦,明白了。这还真有点绕....谢谢老师~

要回复问题请先登录注册