代码之家  ›  专栏  ›  技术社区  ›  Ritesh M Nayak beny23

是否有任何库/项目将任何通用文档类型转换为HTML

  •  1
  • Ritesh M Nayak beny23  · 技术社区  · 14 年前

    是否有任何项目试图为不同的文件类型生成转换器->HTML或文本。文档格式是最常见的;它们包括pdf、doc(x)、xls(x)、ppt(x)、ps等。我已经知道一些unix实用程序,如pdftotext。另外,我知道apache的tika和poi项目。有没有什么通用接口?类似于 MultiMarkdown

    1 回复  |  直到 14 年前
        1
  •  0
  •   sakisk    13 年前

    如您所说,类unix系统的原理是使用小的实用程序/过滤器(latex2html、t2html、txt2html、pdftohtml等)。您可以使用shell脚本、perl、python等创建自己的接口,并将这些过滤器用作回调。