Skip to content
/ ILP Public

一个模块化,支持多网站的小说下载器。

License

Notifications You must be signed in to change notification settings

bkctwy/ILP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

61 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ILP

关于ILP

本项目名称来源于动漫作品「魔法禁书目录」中的「禁书目录」(Index-Librorum-Prohibitorum)的缩写。意指本程序的功能是获取「禁书」。

「ILP」可以有多个含义,包括:

(ILP无确切的含义,选择一个你喜欢的就好)

  • Internet Literature Puller(互联网文学抓取器)
  • Ingenious Literature Picker(巧妙文学选择器)
  • Internet Literature Profiler(互联网文学剖析器)

介绍

此项目支持多个小说网站内容爬取,包括:

特性

  • 使用协程
  • 断点续传
  • 进度显示
  • 缓存目录到数据库
  • 保存为多章节文件

TODO

  • 支持选择爬取范围
  • 支持单文件输出
  • 支持缓存目录到Excel文件
  • 支持缓存目录到Redis
  • 支持跨平台(当前未测试在Mac OS系统上是否可运行)

使用

从源代码运行

运行

  1. 克隆本项目git clone https://github.com/ZeroMapleQvQ/ILP
  2. 切换到项目目录cd ILP
  3. 安装依赖pip install -r requirements.txt
  4. 运行python novel_scraper.py --help获取帮助信息

使用二进制文件(Windows And Linux)

暂不提供二进制文件,请从源代码运行。

Windows

  1. 从Github Actions页面下载压缩包(ILP-windows-latest-{commit-id})
  2. 解压
  3. 运行ILP-windows-latest-{commit-id}.exe --help获取帮助

Linux

  1. 从Github Actions页面下载压缩包(ILP-ubuntu-latest-{commit-id})
  2. 解压
  3. 运行ILP-ubuntu-latest-{commit-id} --help获取帮助

配置

{
    "PATHS": {                             // 路径配置
        "DATA_PATH": "./data",             // 总数据目录
        "NOVELS_PATH": "novels",           // 小说数据目录
        "LOGS_PATH": "logs",               // 日志目录
        "POSTERS_PATH": "posters",         // 封面图片目录
        "DB_PATH": "cache.db"              // 数据库文件路径
    },
    "MAX_WORKERS": 7,                      // 最大协程数(最好不要大于10)
    "SLEEP_TIME": 5,                       // 请求间隔(最好不要小于3)
}

注意事项

  • 请不要滥用本程序,且用且珍惜
  • 用户使用本程序造成的一切后果请自行承担
  • 通过本程序爬取的小说需遵守相应网站的版权声明
  • 本程序仅供学习交流使用,请勿用于商业用途
  • 本项目是本人第一个真正意义上的Python项目,可能存在许多问题,还请批评指正

About

一个模块化,支持多网站的小说下载器。

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages