scrapy 一个开放源代码和协作框架,用于从网站提取所需的数据。以一种快速,简单但可扩展的方式。

在本教程将会描述如何使用vscode调试scrapy爬虫项目。

软件环境

  • ubuntu 16.04
  • scrapy 1.7.4
  • virtualenv
  • python 3.5

安装python扩展


启动 VS Code按Ctrl+P 输入以下命令

ext install ms-python.python

创建scrapy爬虫项目

mkdir spiders && cd spiders
virtualenv  --python=python3.5  .venv
pip install scrapy
scrapy startproject tutorial
scrapy genspider quotes quotes.org

配置Vscode调试scrapy爬虫

点击vscode调试图标或者按下 Ctrl+shift+D ,添加以下配置文件args中的quotes是你创建的spider蜘蛛名称

{
    // Use IntelliSense to learn about possible attributes.
    // Hover to view descriptions of existing attributes.
    // For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: Module",
            "type": "python",
            "request": "launch",
            "module": "scrapy",
            "cwd": "${workspaceRoot}/tutorial",
            "args": [
                "crawl",
                "quotes"
            ]
        }
    ]
}

结论

至此,你已经完成scrapy爬虫项目调试方式的配置