📂 所属阶段:第六阶段 — 运维与监控(工程化篇)
pip install scrapyd scrapydweb # 启动 Scrapyd scrapyd # 启动 ScrapydWeb scrapydweb
# 打包项目 cd myproject scrapyd-deploy -p myproject # 查看已部署的爬虫 curl http://localhost:6023/listspiders.json?project=myproject # 启动爬虫 curl http://localhost:6023/schedule.json -d project=myproject -d spider=example
访问 http://localhost:5000 - 查看爬虫状态 - 查看日志 - 启动/停止爬虫 - 查看统计数据
Scrapyd 优势: 1. 一键部署:简化部署流程 2. 远程控制:HTTP API 3. 日志管理:集中查看日志 4. 监控面板:实时监控 工作流: 1. 开发爬虫 2. 打包项目 3. 部署到 Scrapyd 4. 通过 ScrapydWeb 监控
💡 记住:Scrapyd 是爬虫运维的标准工具。掌握它,你就掌握了爬虫的生命周期管理。
🔗 扩展阅读