Scrapy设置下载延时和自动限速
-
DOWNLOAD_DELAY 在settings.py文件中设置
#延时2秒,不能动态改变,时间间隔固定,容易被发现,导致ip被封 DOWNLOAD_DELAY=2
-
RANDOMIZE_DOWNLOAD_DELAY 在settings.py文件中设置
# 启用后,当从相同的网站获取数据时,Scrapy将会等待一个随机的值,延迟时间为0.5到1.5之间的一个随机值乘以DOWNLOAD_DELAY RANDOMIZE_DOWNLOAD_DELAY=True
-
自动限速扩展 在settings.py中配置
AUTOTHROTTLE_ENABLED #默认为False,设置为True可以启用该扩展 AUTOTHROTTLE_START_DELAY #初始下载延迟,单位为秒,默认为5.0 AUTOTHROTTLE_MAX_DELAY #设置在高延迟情况下的下载延迟,单位为秒,默认为60 AUTOTHROTTLE_DEBUG #用于启动Debug模式,默认为False CONCURRENT_REQUESTS_PER_DOMAIN #对单个网站进行并发请求的最大值,默认为8 CONCURENT_REQUESTS_PER_IP #对单个IP进行并发请求的最大值,如果非0,则忽略CONCURRENT_REQUESTS_PER_DOMAIN设定,使用该IP限制设定。