node脚本爬虫,爬取美之图网站的所有图片 node版本: 16.20.2
因该网站有反爬虫手段,同一IP频繁访问会导致IP被封,故采用了ProxyPool作为IP池,该池子抓去的IP部分质量还挺好的,做好异常判断就能用,打开ProxyPool按照流程部署好服务。
- 项目修改配置
- setting.py
HTTPS_URL = "https://kkmzt.com/beauty/"
POOL_SIZE_MIN = 50
- git clone
git clone https://github.com/huangyizhou0710/meizhitu.git
- 安装依赖(若安装报错,请使用node v16)
npm install
- 启动
node index.js