代码之家 › 专栏 › 技术社区 › under_the_sea_salad

我应该使用哪个Spark ML特征转换器将一列短语转换为固定长度的向量?

one-hot-encoding apache-spark-mllib tokenize apache-spark

under_the_sea_salad · 技术社区 · 7 年前

内容过于久远，请刷新稍后重试

1 回复 | 直到 7 年前

Alper t. Turker 7 年前

推荐文章

John Veridan · 在Python笔记本中仅选择列[无行]

6 年前

seanysull · 修改regex以包含连字符单词

6 年前

Ovaflow · 使用nltk中的标记集计算语音中的不同单词

6 年前

dustydojo · 在Java中,如何对标记中包含分隔符的字符串进行标记化?

7 年前

Laurent R · 根据空格和标点符号标记,标点符号保留

7 年前

mrfr · StreamTokenizer在遇到斜杠时停止

7 年前

Rose · Elasticsearch:术语搜索不适用于特殊字符

7 年前

Abdulrahman Bres Cristiana Chavez · 如何改进NLTK句子切分?

7 年前

vakarami · 用于提取文件名的模式标记器

7 年前

Konstantin · 用Ruby将单词分解成字母

7 年前