![]() |
1
0
我认为最简单的解决办法是 拯救 在第一个数据集上训练后的嵌入,然后 负载 训练后的模型,并继续训练第二个数据集。这样,您就不应该期望嵌入偏离保存状态太多(除非您的数据集非常不同)。 从所有文档中创建单个词汇也是有意义的:特定文档中不存在的词汇将得到一些随机表示,但它仍然是一个有效的word2vec模型。 示例来自 documentation :
|
![]() |
John · 使用R中的单词嵌入从文本变量预测数字变量 3 年前 |
![]() |
Sab Garduño · w2v_列中出现错误(trainFile=file_列,modelFile=model,stopWordsFile=file_stopwords)(下面是完整的错误文本) 3 年前 |
![]() |
richards · 具有初始值的Gensim单词嵌入训练 7 年前 |
![]() |
bluesummers · 嵌入(word或其他)标准文件格式 7 年前 |
![]() |
jef · 嵌入层的初始值是多少? 7 年前 |