自动爬取所有PlayStationStore中的所有游戏封面,支持按月分类
在线预览:https://ravelloh.github.io/PSGameSpider
English version:https://ravelloh.github.io/PSGameSpider/en/
基于Github Actions的自动Python爬虫,支持自动分析最新游戏链接、自动翻页、正则自适应图片名、自动选择下载高清图片、自动删除重复文件、自动更新新文件等
以下以中文版举例,英文版请见文件名带有en的对应文件
此仓库内共有两个爬虫程序:main.py
、update.py
以及一个页面生成程序webpage.py
、一个略缩图生成程序thumbs.py
,其中main.py
用于初次运行,运行此文件可爬取并下载PlayStationStore内的全部游戏,update.py
用于每日运行,以更新最新游戏。
中文版所有游戏的封面将会存储在./img/
内,最新的游戏将被存储在./recent/
内
英文版所有游戏的封面将会存储在./img-en/
内,最新的游戏将被存储在./recent-en/
内
另外,也有带有min前缀的文件夹,其中为相应的略缩图(256*256)
Table of Contents
若要查找某游戏的封面,可直接访问 https://github.com/RavelloH/PSGameSpider/find/main 并搜索。
也可前往https://ravelloh.github.io/PSGameSpider 中搜索
若需下载所有文件,可直接下载仓库压缩包或clone。
此程序基于Python3。
pip install bs4
pip install wget
pip install lxml
pip install Pillow
以下皆以中文版举例,英文版请运行对应含有en的文件
初次使用,需运行main.py。
注:爬取需要一定时间,具体按网络状况决定
之后更新文件只需运行update.py即可。 注:此程序只会更新当月最新游戏到总表中,要想保持列表完整性,请至少一个月运行一次。
webpage.py与thumbs.py用于生成静态页 需按时运行 样式可在webpage.py中自行调整
此仓库可直接fork并运行actions。
直接fork将会保留之前更新的文件,所以无需运行main.py
流程:
1.Fork此仓库
2.前往你的仓库,在Settings>Actions>General>Workflow permissions
中,将权限设为读写(Read and write permissions)
3.前往你的仓库,在Actions中选择允许Actions运行
4.前往你的仓库,在.github/workflows/main.yml中,修改commit模块中的信息为你自己的邮箱及用户名
5.保存,自动触发Workflow
此项目源码使用MIT Licence。
爬取内容归索尼及相关工作室所有。
发现BUG&有修改建议,欢迎用ISSUES反馈
此项目文档需更多语言支持