📂 所属阶段:第三阶段 — 攻防演练(中间件与反爬篇)
# settings.py AUTOTHROTTLE_ENABLED = True AUTOTHROTTLE_START_DELAY = 5 AUTOTHROTTLE_MAX_DELAY = 60 AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0 AUTOTHROTTLE_DEBUG = True
class ThrottleMiddleware: def process_request(self, request, spider): # 随机延迟 import time import random time.sleep(random.uniform(1, 3))
限速的好处: 1. 避免被封 2. 模拟人类 3. 减少服务器压力 AutoThrottle: - 自动调节并发 - 自动调节延迟 - 智能适应网站
💡 记住:限速不是浪费时间,而是保护你的爬虫。没有限速,你的爬虫会被秒杀。
🔗 扩展阅读