Skip to content

huangyizhou0710/meizhitu

Repository files navigation

项目介绍

node脚本爬虫,爬取美之图网站的所有图片 node版本: 16.20.2

项目启动

一、启动代理池

因该网站有反爬虫手段,同一IP频繁访问会导致IP被封,故采用了ProxyPool作为IP池,该池子抓去的IP部分质量还挺好的,做好异常判断就能用,打开ProxyPool按照流程部署好服务。

  1. 项目修改配置
  • setting.py
HTTPS_URL = "https://kkmzt.com/beauty/"
POOL_SIZE_MIN = 50

二、启动本脚本

  1. git clone
git clone https://github.com/huangyizhou0710/meizhitu.git
  1. 安装依赖(若安装报错,请使用node v16)
npm install
  1. 启动
node index.js

About

美之图web端爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published