我刚拿到一个堆垛机 data dump ,我很失望地看到帖子的Body字段是HTML格式的,而不是Markdown格式的。我怀疑原始数据库中有标记,因为这就是我试图编辑答案时看到的。
wmd Markdown editor 不合适。人们能说 有哪些工具可以帮助我从Stackoverflow数据转储中恢复降价?
Convert HTML back to Markdown within wmd .)
Markdownify 将HTML转换为标记。
另见: 梅塔索/ Can Markdown be recovered from the SO data dump?
看看潘多克: http://johnmacfarlane.net/pandoc/
这是手册页: http://johnmacfarlane.net/pandoc/html2markdown.1.html