![]() |
1
6
UTF-8是一种基于字节的编码,因此字节顺序无关,初始字节顺序标记(BOM)是不必要的,通常不鼓励在UTF-8数据中使用。但是它的有效性和功能取决于当前的应用程序,因此Perl不能毫无疑问地将其从数据中剥离出来
Unicode BOM表字符
在大多数文件应用程序中,UTF-8数据源被透明处理,因此仅包含7位ASCII数据的文件与相同数据的UTF-8编码相同。此类数据
不能
包含BOM表,因为它会影响透明度。例如
shebang公司
可以从BOM表字符的开始处删除BOM表字符 解码的 Unicode数据,无论来源如何
当然,这个角色可以被删除
自始至终
通过使用全局替换
使现代化字符流被读取为 字节 ,在16位或32位编码中,您需要知道首先出现的是最低有效字节(小端)还是最高有效字节(大端),以便您知道如何将这些字节组合成多字节字符
BOM表字符为
总是
但是字节顺序在基于字节的编码中是没有意义的。每个字符由一个或多个字节的序列表示,并且数据是相同的
不管其原始系统的结尾如何
.BOM字符
这个
|
![]() |
donefun · 在PHP中将波兰语字符存储为变量 2 年前 |
![]() |
AFX · 这是AES密钥的有效字节字符串吗? 6 年前 |
|
jubimk4 · UTF-8中的PUPPET无效字节序列 6 年前 |
![]() |
user3286053 · utf-8在列表中搜索单词 6 年前 |