![]() |
1
6
使用正则表达式可能是一个不错的选择:
正则表达式 一 并不是很复杂,比如向前看,ReXEP引擎是用C/C++编写的,所以你可以期待它相当快。尽管如此,还是要进行基准测试,看看性能是否符合您的需要。 我不认为实现您自己的解析器会更快,但我可能错了——基准测试。 将文档发送到服务器对我来说不是很好。使用100k字,您将看到一个在兆字节范围内的有效负载,并且您仍然需要在服务器上对它做些什么,然后将其推回去。 一 您可能需要调整regexp来处理空格。 |
![]() |
2
0
我的直觉告诉我,对于如此大量的关键字——排序关键字和创建每个字符的状态机将比正则表达式快得多,因为状态机是微不足道的,它可以自动生成。 |
![]() |
3
0
状态机似乎经常用于类似的任务,例如 http://www.codeproject.com/KB/string/civstringset.aspx |
![]() |
lonix · 使用sed从JSON中提取非贪婪正则表达式 1 年前 |
![]() |
Dima Malko · 如何在指定符号前添加符号? 2 年前 |
![]() |
shekharsabale · 从列表元素捕获子字符串 2 年前 |
![]() |
Katia · 根据特定规则进行多行匹配 2 年前 |
![]() |
MHA · Pandas str.extract()以字母结尾的数字 2 年前 |
![]() |
Slava Vir · 如何查找后面“/”之间的最后一组 2 年前 |