代码之家 › 专栏 › 技术社区 › Andrey

\在PHP preg\u replace中,w只覆盖UTF-8字符的第二个字节

utf-8 unicode regex php

Andrey · 技术社区 · 15 年前

我们有以下代码:

$value = preg_replace("/[^\w]/", '', $value);

$value 在utf-8中。在这个转换之后,多字节字符的第一个字节被剥离。如何完全覆盖UTF-8字符?

5 回复 | 直到 12 年前

user35288 user35288 15 年前

Gordon Haim Evgi 15 年前

这个修饰符打开与Perl不兼容的PCRE的附加功能。模式字符串被视为UTF-8。此修饰符可从Unix上的PHP4.1.0或更高版本以及win32上的PHP4.2.3获得。从php4.3.5开始检查模式的UTF-8有效性。

如果不行,试试看

相反。

soulmerge 15 年前

u modifier to pcre patterns in PHP . 它声明regex是用UTF8编码的,但是我发现它处理输入

Anthony 10 年前

追加 u

$value = preg_replace("/[^\w]/u", '', $value);

将在最后期限前遇到问题。因此,要将任何内容转换为UTF-8(并删除任何不可转换的垃圾),我们首先使用:

$value = iconv( 'ISO-8859-1', 'UTF-8//IGNORE//TRANSLIT', $i );

因为所有的东西都可以被编码成ISO-8859-1(即使一些模糊的字符出现错误),而且由于大多数浏览器都是在8859中运行的(除非被告知使用UTF-8),我们发现这个函数是一个通用的、安全的、有效的方法,可以“接收任何东西、丢弃任何垃圾,并转换成UTF-8”。

从5.3.0开始,mbèeregè就不推荐使用了,因此使用这些函数不是正确的方法。

codaddict 15 年前

[^\w]+ [^\w]

\W [^\w]

推荐文章

M - · 为什么两个相同的表情符号不相等?

2 年前

Andrei Cleland · 在长正则表达式中包含unicode字符

2 年前

Mohsen · 将字符串从Windows 1256转换为UTF-8

7 年前

jpantina · 如何使用Python 3导入带有保存为Unicode文本的CSV扩展名的Excel文件?

7 年前

Bao Thai · 使用pandas数据帧在python中将utf转换为ascii

7 年前

AMINA ARSHAD · 从字符转换为Unicode数字时出错

7 年前

Maverick · VS2017 C++编译器错误C2664无法转换参数

7 年前

Ivan Bilan · Python 2字符串以某种方式保存为纯Unicode

7 年前

Taqwa · 在C#[已关闭]中将上标转换为Unicode

7 年前

ecjb · 无法在Jupyter的PDF输出中显示Unicode字符(如)

7 年前