1
1
使用此伪代码
例如这一行:
|
2
1
我之所以发布此问题的答案,是因为我觉得这些答案确实不符合原始问题中发布的要求。基本上,有多个文本块具有相同的起始行,因此:
我最后做的是为这行创建一个正则表达式:
现在,我需要循环浏览每一个文本块,直到没有更多的文本。由于这些预测通常是在咨询结束时进行的,所以我这样做了:
这似乎奏效了。如果其他人对如何重构这个有任何想法,或者使用其他方法做得更好,请随意添加另一个答案或注释,我将更改答案!感谢所有张贴的人;它真的很受欢迎。 |
3
0
如果你想保持它的通用性,你可以使用stdin,例如
通过阅读每一行
|
4
0
应该很容易为此构建正确的递归语法,例如:
有了这样的语法,您可以(手工)编写递归下降解析器,这应该非常简单。这样做的好处是,您的生产规则是上下文无关的,因此您应该能够相当容易地处理较小的格式转换或新类型的数据文件。 |
5
0
快速浏览一下链接的文件,文件之间的“信息块”似乎是相同的——相同的信息类型——即使格式有很大的不同? 因此,如果我这样做,我将得到每个块的可能值列表,然后测试/分析其中的每个块。如果这是一个飓风警报,我知道没有任何重要的数字,但是热带低压可能有我感兴趣的东西。(另一方面,作为一个瑞典人,没有听说过任何被官方称为“抑郁”的天气,我觉得热带抑郁症听起来很有趣^ ^)
这似乎是一个非常一般的答案,但如果我尝试这样做,我需要知道所有可能的格式,信息可能会出现在之前,我可以想出一个好的解决方案。使用一整串串扫描调用可能是最好的。:) 祝你好运 |
batman · 如何用特定模式grep特定行及其子网行? 2 年前 |
Jensen Holm · 在非常大的字符串中查找链接时遇到问题 2 年前 |
MBF · PHP导入/解析XML文件内容保存到数据库 2 年前 |
user10717742 · 用java编写的自定义文件解析器需要改进 2 年前 |
Muhsin Muhammed · 向文件中的行添加引号和逗号 2 年前 |
Felkru · 添加字符串会在Javascript中返回空字符串 2 年前 |
Mustard Tiger · 熊猫解析文本列 2 年前 |