前言
当你学了一段时间爬虫后,就会知道各种功能太多而且麻烦。还不如自己整理个框架方便的多。因此,从开始写爬虫程序开始,就会慢慢的接触到一些有关爬虫的框架、效率提升而且扩展也很方便。接下来我将会以Scrapy爬虫框架将我的学习过程记录下供大家参考指正。
一、安装
$ pip install scrapy
二、创建爬虫工程
$ scrapy startproject wikiSpider
三、爬虫工程目录结构
wikiSpider项目文件夹的目录结构如下所示:
scrapy.cfg
- wikiSpider
- __init__.py