LDA实际应用中,有一个新的文档,怎样判断该文档的主题?

LDA实际应用中,是根据已有文档集合计算每个文档的主题分布和每个主题的词分布。假如实际中有一个新的文档,怎样判断该文档属于哪个主题?

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自: fish Cyndiwang

gibbs.png
根据gibbs采样的更新规则,可以根据已经得到的训练结果,直接把n(t),z和n(k),m赋值,然后使用更新规则迭代即可。当收敛后,使用主题的期望做估算即可。——应用条件:新文档中没有新词——如果出现新词,不妨猜一个 -:)

要回复问题请先登录注册