Skip to content

分布式爬虫管理后台、实现爬虫分发启动,以及分布式机器管理

Notifications You must be signed in to change notification settings

hearecho/CrawlerMW

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目介绍

本项目是和MagicSpider配套使用的管理分布式爬虫的管理系统 主要目标功能实现:

  • 主机管理
  • 项目管理
  • 控制爬虫任务运行,即开始运行、停止运行。
  • 查看爬虫任务状态
  • 查看爬虫任务运行结果:以csv的形式在网页端显示。
  • 查看爬虫任务日志:以文本格式在网页端显示。
  • 下载爬虫任务结果:下载csv文件。
  1. 主机管理功能主要是管理实现目标主机是否可用,以及增删可用主机的信息。
  2. 项目管理准确来说是爬虫管理,即可以发布到主机上进行运行的爬虫信息,也即项目部署。
  3. 爬虫任务是每一个任务的运行,该任务可以是分布式任务,也可以是单机任务。分布式任务默认会被分发到 所有可以使用的主机上运行。单机任务随机发送到一个可用主机上运行。

About

分布式爬虫管理后台、实现爬虫分发启动,以及分布式机器管理

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages