代码之家  ›  专栏  ›  技术社区  ›  bitmask

用于Linux的CLI PDF查看器[关闭]

  •  56
  • bitmask  · 技术社区  · 14 年前

    嘿,有一段时间了,我在寻找命令行的PDF查看器。

    因为我喜欢在Linux上不使用X,并且经常在远程机器上工作,所以我想有一个工具来读取PDF。有相当多非常好的图形程序(evince,okular,acroread,…)来完成这项工作,所以我认为至少应该有一个像样的文本模式工具。但我甚至不知道有什么烂东西!

    目前,我要么只启动x来读取pdfs,要么使用pdftohtml+lynx。 然而,后者并不能产生非常好的输出,而且大多数文档都是不可读的,特别是如果它们包含数学公式的话。

    谷歌到处都有人说这是不可能的,或者建议PDFToHTML版本。

    我意识到,这不完全是一个编程问题,但我目前正在考虑启动一个项目来实现这样一个程序,除非已经有一个好的程序了。

    谢谢你的建议。

    7 回复  |  直到 7 年前
        1
  •  69
  •   Kasra    12 年前

    嗨,我认为你不需要为你的目的编写程序,我的意思是在控制台模式下阅读PDF文件,因为“更少”的命令已经为你做了。所以使用它,尽情享受吧。

    减去“PDF文件的名称”

        2
  •  16
  •   Kurt Pfeifle    14 年前

    好吧,你甚至要求知道那些“烂”的。这里有两个(自己决定他们各自的粗俗):

    第一: Ghostscript's txtwrite 输出装置

     gs \
       -dBATCH \
       -dNOPAUSE \
       -sDEVICE=txtwrite \
       -sOutputFile=- \
       /path/to/your/pdf
    

    第二: XPDF's pdftotext cli实用程序(优于ghostscript):

     pdftotext \
       -f 13 \
       -l 17 \
       -layout \
       -opw supersecret \
       -upw secret \
       -eol unix \
       -nopgbrk \
       /path/to/your/pdf
       - |less
    

    这将显示页面范围13( f 第一页)至第17页( L ast page),保留双密码保护的命名PDF文件的布局(使用用户和所有者密码 秘密 超机密 ,使用unix eol约定,但不在pdf页面之间插入分页,通过管道传输的次数更少…

    pdftotext -h 显示所有可用的命令行选项。

    当然,这两个工具都只适用于PDF的文本部分(如果有的话)。哦,数学公式也不太好用…;-)


    编辑: 我在上面输入了错误的命令(最初使用 pdftops 而不是 PDFT-TEXT )

        3
  •  5
  •   mlwn    10 年前

    顺便说一下,我总是处于同样的情况下,我使用的是mc(午夜指挥官),它可以很好地处理文本pdf… 只需在mc中查看文件(f3)

        5
  •  4
  •   user287424    11 年前

    还有 green PDF查看器。正在演示 YouTube .

        6
  •  3
  •   user3714903    10 年前

    fbpdf 是一个帧缓冲区PDF查看器。

    还有一个叉子, jfbpdf 但是现在我不能让它工作。

        7
  •  0
  •   Dirk Vollmar    14 年前

    只有当您的PDF文档是结构化的,即它是 tagged PDF 文件。

    这是获取文档中文本对象的正确读取顺序所必需的。

    带标记的PDF文档还允许您重新流动文档,尽管我不知道有任何工具可以通过命令行输出来完成这一操作。