![]() |
1
6
UTF-8是一种基于字节的编码,因此字节顺序无关,初始字节顺序标记(BOM)是不必要的,通常不鼓励在UTF-8数据中使用。但是它的有效性和功能取决于当前的应用程序,因此Perl不能毫无疑问地将其从数据中剥离出来
Unicode BOM表字符
在大多数文件应用程序中,UTF-8数据源被透明处理,因此仅包含7位ASCII数据的文件与相同数据的UTF-8编码相同。此类数据
不能
包含BOM表,因为它会影响透明度。例如
shebang公司
可以从BOM表字符的开始处删除BOM表字符 解码的 Unicode数据,无论来源如何
当然,这个角色可以被删除
自始至终
通过使用全局替换
使现代化字符流被读取为 字节 ,在16位或32位编码中,您需要知道首先出现的是最低有效字节(小端)还是最高有效字节(大端),以便您知道如何将这些字节组合成多字节字符
BOM表字符为
总是
但是字节顺序在基于字节的编码中是没有意义的。每个字符由一个或多个字节的序列表示,并且数据是相同的
不管其原始系统的结尾如何
.BOM字符
这个
|
![]() |
Manny · 如何比较Perl中的字符串? 2 年前 |
![]() |
BioRod · 我不能用Perl打印键和值 2 年前 |
![]() |
user17227456 · Perl CLI代码无法追加字符串行 2 年前 |
![]() |
LearnToBeBetter · 读取文件,搜索字符串,打印字符串 2 年前 |
![]() |
KJ7LNW · 一些波斯语文本的宽字符印刷,但其他文本则没有 2 年前 |
![]() |
con · 如何搜索大型数据结构并返回一系列给出特定值的键/数组? 2 年前 |
![]() |
Pranay Nanda · 使用regex解析许可证文件 6 年前 |