SkillAgentSearch skills...

PythonSpider

爬虫笔记

Install / Use

/learn @LiuShiYa-github/PythonSpider
About this skill

Quality Score

0/100

Supported Platforms

Universal

README

PythonSpider

Python Version <a href="https://github.com/LiuShiYa-github/PythonSpider/blob/master/Image/wx.jpg" target="_blank"><img src="https://img.shields.io/badge/weChat-微信-blue.svg" alt="微信"></a> <a href="https://blog.csdn.net/weixin_42506599?spm=1000.2115.3001.5343" target="_blank"><img src="https://img.shields.io/badge/csdn-CSDN-red.svg" alt="CSDN"></a> CI status img.png

声明

  • 此repo是纪录学习Python爬虫阶段的代码与笔记,学习视频来源于网络
  • 代码、教程仅限于学习交流,请勿用于任何商业用途!

知识点

<details> <summary>👉查看涉及的知识点</summary>

第一章

01 网络爬虫概述
02 urllib.request原理以及使用
03 正则表达式re使用

第二章

01 数据持久化存储-csv
02 数据持久化存储-MySQL
03 数据持久化存储-MongoDB
04 requests模块
05 增量爬虫-基于MySQL及Redis实现

第三章

01 爬虫-图片抓取
02 xpath语法解析
03 lxml+xpath解析提取数据

第四章

01 requests模块高级使用
02 代理ip使用
03 POST请求数据抓取

第五章

01 动态加载数据爬取
02 JSON解析模块及全站抓取
03 多线程爬虫
04 多级页面多线程爬取
05 Cookie模拟登录

第六章

01 Selenium+PhantomJS Chrome Firefox
02 Selenium常用方法
03 Selenium高级操作

第七章

01 Scrapy框架原理
02 Scrapy配置文件解析
03 中间件
04 Scrapy处理POST请求
05 Scrapy之图片管道
06 Scrapy之文件管道

第八章

01 Scrapy之分布式爬虫原理
02 Scrapy之分布式爬虫实现
03 机器视觉与tesseract
04 移动端数据抓取
</details>

实例

<details> <summary>👉查看实例</summary> </details>

Related Skills

View on GitHub
GitHub Stars17
CategoryDevelopment
Updated6mo ago
Forks4

Languages

Python

Security Score

62/100

Audited on Sep 29, 2025

No findings