from selenium import webdriver
from bs4 import BeautifulSoup
driver = webdriver.Chrome(executable_path =
r'C:\chromedriver_win32\chromedriver.exe')
driver.get('https://www.imdb.com/')
html_doc = driver.page_source
soup = BeautifulSoup(html_doc, 'lxml')
print(soup.prettify())
driver.quit()
我尝试了这个代码,它给出了这个错误。
回溯(最近一次呼叫最后一次):
文件“E:\Practice\WebScraping\webscrape.py”,第11行,in
打印(soup.prettify())
文件“C:\Users\vmbck\AppData\Local\Programs\Python\Python36\lib\encodings\cp1252.py”,第19行,编码
返回编解码器。charmap\u encode(输入,自身错误,编码表)[0]
UnicodeEncodeError:“charmap”编解码器无法对位置241524中的字符“\u25ec”进行编码:字符映射到
然后我尝试了编码(“utf-8”)
html_doc = driver.page_source.encode("utf-8")
它再次给出了错误
如何在不获取UnicodeEncodeError的情况下获取page\u源