![]() |
1
70
不幸的是,在Python中迭代字符串的速度相当慢。正则表达式对于这种类型的东西来说速度超过了一个数量级。你只需要自己建立角色类。这个 单播数据 模块对此非常有用,尤其是 unicodedata.category()。 功能。见 Unicode Character Database 对于类别的描述。
|
![]() |
2
60
据我所知,最有效的方法是:
|
![]() |
3
9
在Python 3中,
见 this StackOverflow post on removing punctuation 有关.translate()与regex&的比较方式,请替换()。 |
![]() |
4
8
您可以尝试使用
|
![]() |
5
5
此函数使用列表理解和str.join,因此它以线性时间而不是o(n^2)运行:
|
![]() |
6
2
我现在想到的最好的方法是(感谢上面的python-izers)
这是我发现的唯一适用于Unicode字符/字符串的方法 有更好的选择吗? |
![]() |
7
1
下面的一个比上面的其他的快。看一看
|
![]() |
8
1
使用时有
它维护良好,支持unicode regex、posix regex等等。用法(方法签名)是
非常
类似于巨蟒
从文档中:
(我没有附属关系,只是一个用户。) |
![]() |
9
0
要删除“空白”,
|
![]() |
10
0
下面将使用Unicode输入,而且速度相当快…
我自己的测试表明,这种方法比迭代字符串并使用
|
![]() |
11
-1
python 3中的另一个选项是:
|