|
|
1
4
从html到pdf的web工具包非常完美,甚至可以生成jpg |
|
|
3
2
嗯,这是 DumpRenderTree 作为WebKit测试套件的一部分使用的工具。我不确定它是否适合变成一个独立的工具,但它会按照您的要求(呈现html、运行javascript并将其呈现树转储到磁盘)。 |
|
|
4
2
由于javascript可以对web页面的文档对象模型(document object model,dom)进行很多操作,因此似乎要准确地抓取任意页面的内容,您不仅需要运行javascript引擎,还需要页面的完整而准确的dom表示。只有当你有一个真正的浏览器引擎实例时,你才能得到这样的东西。可以使用嵌入式的、不显示的webkit或gecko引擎来实现这一点,然后在适当的加载延迟以允许脚本执行之后,只需以html格式转储dom内容。 |
|
|
6
1
我认为qt有一个示例代码,它使用包含的webkit将页面呈现为pixmap。从那里到一个完整的cli实用程序只是定义您的需要。 当然,对于大多数屏幕抓取需要你想要的文字,而不是一个像素…如果那是你想要的,最好去看看犀牛 |
|
|
7
0
有JAVA的眼镜蛇引擎( http://lobobrowser.org/cobra.jsp ,它处理javascript(它也有一个渲染器,但这是可选的)。我从来没用过,但听说过很多好话。 |
|
|
8
0
让webview呈现一个页面而不显示任何内容是非常少的代码,但它必须是一个gui应用程序。它们也可以使用命令行参数,并隐藏窗口。直接使用webkit在工具中是可能的。 除了objective-c webkit中复杂的dom访问之外,它还可以注入javascript,并与jquery一起创建一个很好的抓取解决方案。不过,我不知道有什么通用应用程序会这么做。 |
|
|
pcsksa5 · 从AnyLogic内部调用命令行 1 年前 |
|
|
w113msh · 提取未设置脚本的变量名 1 年前 |
|
|
FangQ · 如何使用jq打印由制表符“\t”分隔的JSON数组元素 1 年前 |
|
|
js0110 · 这个问题的输出和推理是否正确? 2 年前 |