代码之家  ›  专栏  ›  技术社区  ›  Jane Sully

了解Gensim LDA模型中的参数

  •  4
  • Jane Sully  · 技术社区  · 6 年前

    我正在使用 gensim.models.ldamodel.LdaModel 执行LDA,但我不理解某些参数,在文档中找不到解释。如果有人有这方面的工作经验,我会喜欢这些参数意味着什么的进一步细节。 具体来说,我不明白:

    • random_state
    • update_every
    • chunksize
    • passes
    • alpha
    • per_word_topics

    我正在处理一个500个文档的文集,每个文档大约有3-5页(不幸的是,由于保密原因,我无法共享数据的快照)。目前我已设置

    • num_topics = 10
    • random_state = 100
    • update_every = 1
    • chunksize = 50
    • passes = 10
    • alpha = 'auto'
    • per_word_topics = True

    但这仅仅是基于我看到的一个例子,我不确定这对我的数据有多普遍。

    1 回复  |  直到 6 年前
        1
  •  5
  •   sophros    6 年前