Skip to content

Latest commit

 

History

History
20 lines (16 loc) · 609 Bytes

File metadata and controls

20 lines (16 loc) · 609 Bytes

知乎用户和关系

项目说明

本项目为个人学习使用, 计划使用tornado做数据可视化后端, 采集了一部分知乎用户信息和关注/粉丝关系数据, 采集用户200w及关系4000w后停掉了爬虫

使用scrapy和scrapy-redis, mysql做存储

用户 关注关系

运行流程

  • 搭建环境
conda create --name=zhihu python=3.5
source activate zhihu
pip install -r requirements.txt
  • 修改settings.py中的mysqlredis连接
  • 如果有代理修改proxyMiddleware.py或降低抓取频率
  • python run.py