![]() |
1
31
我不知道这些语言中的特殊字符是如何分类的,但您可以检查
这个
|
![]() |
2
6
调查
例如:
|
![]() |
3
4
字符黑名单可能非常大:-) 可以使用正则表达式
以匹配十进制数字和字母,不管脚本如何。
这个正则表达式由一个字符类组成,该类包含
对于某些regex引擎,由于您只对拉丁字母感兴趣,显然,您也可以使用
但是,.NET不支持此功能。上面提到的第一个regex实际上捕获了 任何 脚本。因此,它将尽职匹配印度或阿拉伯数字和希伯来语,西里尔文和其他非拉丁语脚本。取决于你想要什么,这可能不合适。
如果这造成了一个问题,那么我认为没有比显式列出您要允许的字符更好的选择。然而,我认为假设某种语言的文本总是局限于该语言的脚本是危险的。如果我用德语写一个捷克语或波兰语的名字,那么我可能需要的不仅仅是
|
![]() |
4
-1
匹配允许的字符捕获一个错误的返回会更简单。 |
![]() |
Dima Malko · 如何在指定符号前添加符号? 2 年前 |
![]() |
shekharsabale · 从列表元素捕获子字符串 2 年前 |
![]() |
Manny · 如何比较Perl中的字符串? 2 年前 |
![]() |
Manan Girdhar · 拆分字符串并仅在java中使用第二部分 2 年前 |
![]() |
AnxiousLuna · Python使用len()获取数组索引数 2 年前 |
![]() |
antonoyaro8 · 数据帧中每列上的Grepl 2 年前 |