![]() |
1
1
简言之,第4章定义了一些 如何在lexer中可靠、可靠地编码这些信息取决于特定lexer的要求,还取决于在更新Unicode时是否需要更新它,或者当前Unicode标准的静态快照是否足够。 Unicode Character Database 并提取一个包含您所询问的属性的代码点枚举。
https://www.fileformat.info/search/google.htm?q=nine
显示大多数具有“十进制数字”属性的字符。当您访问单个结果时,请检查每个页面顶部附近的“类别”字段,以及
https://www.unicode.org/faq/private_use.html 包含一节,解释并枚举定义为“非字符”的66个代码点的稳定集合。任何其他人都会满足你问题中的第一个定义。 |
![]() |
2
0
根据其文件,Sedlex predefined regular expression classes
是字符的代码点chapter two of the Unicode standard ,而不是第四章。在当前版本(14.0.0)中,定义如第30页的表2.3所示(即链接PDF的第23页)。
值得注意的是,标准中的66个“非字符”有一个类别
简而言之,您可以在sedlex用于创建预定义模式的任何Unicode版本中获得映射到字符的代码点集。这就是类别
第4.5节对一般类别本身进行了解释(在一定程度上)
Chapter 4
. 没有所谓的“数字”类别;最接近的是类别
|
![]() |
M - · 为什么两个相同的表情符号不相等? 2 年前 |
![]() |
Mohsen · 将字符串从Windows 1256转换为UTF-8 6 年前 |
![]() |
AMINA ARSHAD · 从字符转换为Unicode数字时出错 6 年前 |
![]() |
Taqwa · 在C#[已关闭]中将上标转换为Unicode 6 年前 |