SkillAgentSearch skills...

Spider

使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。

Install / Use

/learn @JFanZhao/Spider
About this skill

Quality Score

0/100

Supported Platforms

Universal

README

spider

使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。

View on GitHub
GitHub Stars234
CategoryDevelopment
Updated4d ago
Forks151

Languages

Java

Security Score

80/100

Audited on Apr 2, 2026

No findings