代码之家  ›  专栏  ›  技术社区  ›  bluesummers

嵌入(word或其他)标准文件格式

  •  0
  • bluesummers  · 技术社区  · 7 年前

    我正在创建自己的文字嵌入,我有各种版本。

    什么是标准的方法(如果有)来保存嵌入到文件中,以便其他人以后可以轻松地阅读和使用它们?

    如果有几种公认的方法,我希望能给出解释每种方法的答案。

    1 回复  |  直到 7 年前
        1
  •  1
  •   bluesummers    7 年前

    我发现文字嵌入的标准文本格式是什么样子的

    <vocabulary_length> <embedding_dimensions>
    <word1> <emb1_dim1> <emb1_dim2> ...... <emb1_dim_n>
    <word2> <emb2_dim1> <emb2_dim2> ...... <emb2_dim_n>
    .
    .
    <word_m> <embm_dim1> <embm_dim2> ...... <embm_dim_n>
    

    在本例中 vocabulary_length m embedding_dimensions n