1
2
Regex并不是解决这个问题的最佳方案。通过创建一个解析库,您会得到更好的服务。你可以很容易地创建逻辑块来区分一件事和另一件事。你需要想出一套规则,把文本分成你想看到的块。
用简单的规则就可以说“那是一句话” |
2
1
不幸的是,由于你所说的原因,没有完美的解决办法。如果内容是您可以在每个句子后以某种方式控制或强制指定分隔符的,那么这将是理想的。除此之外,你能做的就是寻找
|
3
0
我认为最大的问题是缩略语的可能存在!所以你必须使用
|
XYZ · 如何将每行的每个字转换为数据帧的数值 2 年前 |
John · 使用R中的单词嵌入从文本变量预测数字变量 2 年前 |
Sab Garduño · w2v_列中出现错误(trainFile=file_列,modelFile=model,stopWordsFile=file_stopwords)(下面是完整的错误文本) 2 年前 |
Michael W · 从数据帧创建术语频率矩阵的有效方法 2 年前 |