1
8
您需要将嵌入矩阵传递给
这个
创建
|
2
2
有一篇很棒的博客文章描述了如何使用预先训练好的词向量嵌入创建嵌入层: https://blog.keras.io/using-pre-trained-word-embeddings-in-a-keras-model.html 上述文章的代码可在此处找到: https://github.com/keras-team/keras/blob/master/examples/pretrained_word_embeddings.py 另一个同样目的的好博客: https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras/ |
3
0
几年前,我写了一个名为
embfile
用于“嵌入文件”(但我只是在2020年才发布)。我想介绍的用例是创建一个经过预训练的嵌入矩阵来初始化
它支持多种格式:
包裹是 extensively documented 并进行了测试。还有 examples that show how to use it with Keras .
此函数还处理文件词汇表之外的单词的初始化。默认情况下,它在找到的向量上拟合正态分布,并使用它生成新的随机向量(这就是AllenNLP所做的)。我不确定这个功能是否仍然有用:现在,您可以使用FastText或其他工具为未知单词生成嵌入。 请记住,txt和bin文件基本上是顺序文件,需要进行完全扫描(除非在结尾之前找到所有要查找的单词)。这就是为什么我使用vvm文件,它为向量提供随机访问。仅仅通过索引顺序文件就可以解决这个问题,但embfile没有这个功能。尽管如此,您可以将顺序文件转换为vvm(这类似于创建索引并将所有内容打包到单个文件中)。 |
4
0
我在寻找类似的东西。我找到了这篇回答这个问题的博文。它正确地解释了创建
|