1
|
M. A. Kishawy Andy Guibert · 技术社区 · 14 年前 |
1
1
对我来说,似乎有3个元字段:
MF1:
MF2:
MF3:
其中mf2是可选的。我的分隔符是: MF1至[上午下午] MF2号,地下室除外-* MF3地下室-* 我不太擅长正则表达式,但我会将这三个组提取为
在哪里?表示可选组。 |
2
2
好吧,您可以按列号删除日期和basement-foo数据,因为它们总是出现在行中的同一点上。然后,可以基于逗号拆分其余部分。是否需要处理转义逗号,或引号“foo,bar”中的逗号取决于您和您的业务需求。 |
3
1
你可以做到:
|
4
0
找出每行空白字符与非空白字符相邻的列,然后对这些数字进行统计分析:每行或几乎每行出现的数字很可能是字段边界。 类似地,对于与字母相邻的标点符号,但一般来说,不可能猜测a-或a是否意味着要分隔字段。如果它出现在每一行的同一位置,它可能是一个分隔符,但在诸如d-fl r-tx d-ny之类的列表中,它可能不是。因此,对于任意数据不可能有完全自动的解决方案。 |
5
0
由于每个字段都是非常不同的(至少在上面粘贴的示例中如此),因此可以执行以下操作:
|
6
-2
你可以使用 Strtokenizer 从commons lang并指定要拆分的多个分隔符: 有许多内置类型通过 StrMatcher .
例如
将给出(从上面的示例中):
|
user5858 · Matlab-按分隔符拆分单元格数组列 7 年前 |
Zdiode · 查找开始和停止之间的所有重复字符串,并使用分隔符 7 年前 |
Matt · 显示错误结果的自定义toString(char)方法 7 年前 |
Haddock-san · 正则表达式量词-两个字符之间的数量 7 年前 |
Aman Singh Dhir · VBA文本到以括号作为拆分器的列 7 年前 |