那个网站的内容是动态的。所以,你有两个选择:要么使用任何浏览器模拟器
selenium
或者使用包含json数据的正确url。后者无疑是最好的方法。
这就是你如何抓住它们(简单的方法):
import requests
url = "https://www.morganlewis.com/biosearchnew/execute?pagenum=1&isInternalBioRequest=false&SortingField=Last%20name¤tGroup=36ef4ad43dea406895fa2d41af32fada&loadCategories=true¶m_sitecontentcategory=OUR%20PEOPLE&pagesize=500&schoolsearchstring=villanova&personofficeitem_sm=36ef4ad43dea406895fa2d41af32fada"
res = requests.get(url)
for items in res.json()['SearchResults']:
print(items['Title'])
部分响应:
Lindsay Ann Barci
Michael N. Baxter
Jeannine T. Bishop
Jeffrey P. Bodle
Sarah E. Bouchard
Brandon J. Brigham
Amanda M. Bruno
Evan W. Busteed