1
1
因此,根据您的编辑,PDF文件似乎使用了一些奇怪的(非ASCII兼容)希伯来语编码进行文本提取,将字母的最终形式放置在
如果您只想在PDF中重建文本,最简单的解决方案可能是,不要更改PDF,而是在从PDF复制文本后用正确的代码替换错误的代码。
例如,将从PDF复制的文本粘贴到
也就是说,一个
|
2
0
https://github.com/adobe-type-tools/agl-aglfn/blob/master/glyphlist.txt ). Identity-H编码意味着一种复合(双字节)字体,它可能有一个ToUnicode表。自定义编码意味着使用差异数组的编码字典。标准编码意味着未指定预定义(或自定义)编码。
|