代码之家  ›  专栏  ›  技术社区  ›  David West

Watir Webdriver如何使用Watir浏览器在Chrome中嵌入pdf文本

  •  2
  • David West  · 技术社区  · 9 年前

    由于某些原因,我无法在Chrome内置的PDF查看器中访问PDF文本。

    @browser.text
    => ""
    

    PDF是嵌入的,我无法轻松获取 Net/HTTP 获取或 curb httparty 。但它在浏览器中显示得一清二楚。。。

    我必须做点什么吗 @browser.driver#some_method ? 或者更改之前的功能哈希 Watir::Browser.new :chrome ?

    随着Chrome和Chromedriver最近的变化,人们现在在做什么来检查web应用程序中的PDF文本?

    1 回复  |  直到 9 年前
        1
  •  2
  •   titusfortner    9 年前

    Watir非常适合处理html,但它不适合处理pdf等格式。如果您想解析pdf文件,可以尝试以下操作 pdf-reader :

    require 'pdf-reader'
    require 'open-uri'
    
    io = open(@browser.url)
    reader = PDF::Reader.new(io)
    reader.pages.first.text