![]() |
1
2
Word生成的HTML相对容易处理。我只需要去掉所有的标签属性(除非你关心样式)。这将使您能够使用相当简单的HTML,然后您可以对其进行样式设置。 HTML::TokeParser::Simple 有助于减轻疼痛。 至于其他的事情,那将需要一些尝试和错误。如果我能想出一些聪明的东西,我会更多地考虑这个问题,稍后再发表。 后期更新: 好吧,这有点让我有点畏缩,但它似乎起作用了:
输出:
|
![]() |
2
3
|
![]() |
3
2
正如我在另一个问题中所说,我喜欢 XML::Twig . 它可以同时处理XML和HTML。 |
![]() |
4
0
fwiw,我倾向于使用xml::libxml来满足我所有的xml和html需求。下面是一行代码,它将把一行“坏”的HTML转换成格式良好的XHTML文档:
在您的示例中,您可能希望使用DOM来发出具有正确标记的新文档。这很简单;xml::libxml使用与javascript相同的W3C DOM。 例如,此输入:
转换为:
这可能是你想要的,记住,使用dom来翻译…别担心这个印刷品。 |
![]() |
Softly · 单选按钮未按预期取值 1 年前 |
|
NovoMannen · 导航中的下拉菜单在内容后面重叠 1 年前 |
|
eXor420 · 如何在脚本标记中使用导出的函数? 1 年前 |
![]() |
IonicMan · 剑道网格在宽度过大时不显示某些列 1 年前 |
![]() |
Kernier · 如何将数学公式支持添加到StacksEditor? 1 年前 |
|
Md. Ibrahim · CSS网格项溢出小屏幕滚动 1 年前 |
|
Akshay mek · Vscode扩展建议不适用于某些文件夹 1 年前 |