代码之家  ›  专栏  ›  技术社区  ›  Mike Vlad

Tinymce、Django和python docx

  •  0
  • Mike Vlad  · 技术社区  · 6 年前

    我正在研究使用 rich text editor 在我的Django项目中。Tinymce看起来是显而易见的解决方案,但是我看到输出格式是HTML( here )目标是存储用户输入,然后在Word文档中使用 python-docx (不是HTML)。

    你知道有什么解决办法吗?或者 特征 耳鸣或A H 保持风格,或者 另一个RTF编辑器 类似于Tinymce?

    更新:

    This 是另一个我发现工作正常的选择。仍在尝试将HTML转换为Word而不丢失样式。解决这个问题的办法可能是 pywin32 如前所述 here 但这对我没多大帮助,只是窗户而已。

    更新2

    经过一番挖掘,我发现 pandoc pypandoc 它似乎能够以任何这些输出格式进行翻译: "asciidoc, beamer, commonmark, context, docbook, docbook4, docbook5, docx, dokuwiki, dzslides, epub, epub2, epub3, fb2, gfm, haddock, html, html4, html5, icml, jats, json, latex, man, markdown, markdown_github, markdown_mmd, markdown_phpextra, markdown_strict, mediawiki, ms, muse, native, odt, opendocument, opml, org, plain, pptx, revealjs, rst, rtf, s5, slideous, slidy, tei, texinfo, textile, zimwiki"

    我还没有弄清楚如何将这样的输入集成到python docx中。

    1 回复  |  直到 6 年前
        1
  •  1
  •   Scott Stanley    6 年前

    我也有同样的挑战。您将希望使用Python漂亮的soup库迭代HTML编辑器中的内容(我使用SummerNote,但任何HTML编辑器都可以工作),然后将HTML标记解析为Python docx的可用格式。PanDoc和Pypandoc将为您转换文件(例如,您从一个乳胶文件开始,需要将其转换为Word),但不会提供需要转换为XML/HTML和从XML/HTML转换的工具。

    祝你好运!