代码之家 › 专栏 › 技术社区 › M.Mark

Scrapy:使用代理中间件设置错误

scrapy python

M.Mark · 技术社区 · 7 年前

我是个新手,我想使用代理中间件,但我的调试消息显示

2018-09-10 21:15:57 [scrapy.core.engine] INFO: Spider opened
2018-09-10 21:15:57 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2018-09-10 21:15:57 [scrapy.extensions.telnet] DEBUG: Telnet console listening on 127.0.0.1:6023
2018-09-10 21:16:57 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2018-09-10 21:17:57 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2018-09-10 21:18:05 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.zhipin.com/robots.txt> (failed 1 times): TCP connection timed out: 110: Connection timed out.
2018-09-10 21:18:57 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)

它总是抓取0页并重试。我的代理是免费的,不需要授权。但是我尝试删除代理中间件并使用

yield scrapy.Request(url='https://www.example.com/', callback=self.parse_first, meta=my_proxy)

没关系。我的设置好像有问题。

设置

DOWNLOADER_MIDDLEWARES = {
'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware':135,
'ip_proxy.middlewares.CustomProxyMiddleware':125
}

自定义代理IDdleware

class CustomProxyMiddleware(object):
def process_request(self, request, spider):
    request.meta['proxy'] = my_proxy

蜘蛛

class ipSpider(scrapy.Spider):
  name = "test"

  def start_requests(self):
      yield scrapy.Request(url="https://www.example.com",callback=self.parse_first)

1 回复 | 直到 7 年前

Yash Pokar 7 年前

听起来你没有更改默认值 机器人大战 设置集合 robotxt_obey=错误 然后试试看。我会工作的。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

6 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

6 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

7 月前

user29715306 · from_users=和chats=电视节目中的差异

7 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

7 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

7 月前

prayner · 更新嵌套字典包含列表中的项

7 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

7 月前

Dave · 如何在for循环中修改列表值

7 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

7 月前