1
5
似乎某个网站正在使用JavaScript呈现其电影数据。
BeautifulSoup不是浏览器,因此没有DOM,因此无法运行JavaScript代码。它所做的只是获取页面内容并对其进行解析。如果您查看相关页面的源代码并查看源代码(在大多数浏览器中,右键单击“查看源代码”)并搜索
在这种情况下,您必须找到一种替代方法来清除数据,尝试研究它使用的JavaScript代码的功能并从中着手。或者,您可能想看看如何使用Selenium和PhantomJS。 |
2
4
正如一些人所指出的,它是通过javascript加载的,而BS4实际上并不适用于此。当您看到通过javascript加载的数据时,可以肯定在某个地方有一个API调用。您可以查看它是否在调用JSON对象,以及是否可以不使用任何apikey访问JSON对象,而不是尝试刮取数据。 如果您需要一些不同的东西,您可能需要调整一些URL模式。
脚本的输出如下:
如果你想知道我是如何发现这个URL的,我使用了chrome开发者控制台重新加载了这个页面。在XHR(XMLHttpRequest)上过滤,您将看到包含数据的url。 |