Pythonspider
一个简单的python爬虫,原生python+BeautifulSoup
Install / Use
/learn @StephinChou/PythonspiderREADME
Pythonspider,一个简单的python爬虫
- 娱乐随手写的,代码不太严谨,仅仅实现功能
- 原生python+BeautifulSoup4
- python3.4版本
- 所有脚本要和spider.py放到同一目录下
- 自行下载BeautifulSoup4 的类库 window下
pip install bs4即可
爬取知乎的爬虫 zhihu.py
- 主要实现 爬取一个收藏夹 里 所有问题答案下的 图片
- 文字信息暂未收录,可自行实现,比图片更简单
- 具体代码里有详细注释,请自行阅读
子文件夹文件说明:
|文件名|说明| |:-:|:-:| |*.py文件|爬虫程序| |*.sql文件|数据表结构| |*.html文件|数据展示| |*.php文件|数据展示界面数据接口|
