Skip to content

自动爬取所有PlayStationStore中的所有游戏封面,自动生成网页并索引

License

Notifications You must be signed in to change notification settings

Ravello-H/PSGameSpider

 
 

Repository files navigation

PSGameSpider

自动爬取所有PlayStationStore中的所有游戏封面,支持按月分类

GitHub Workflow Status GitHub Workflow Status GitHub Workflow Status GitHub Workflow Status

GitHub repo size GitHub language count GitHub stars GitHub forks GitHub speed GitHub tag (latest by date)

在线预览:https://ravelloh.github.io/PSGameSpider
English version:https://ravelloh.github.io/PSGameSpider/en/

介绍

基于Github Actions的自动Python爬虫,支持自动分析最新游戏链接、自动翻页、正则自适应图片名、自动选择下载高清图片、自动删除重复文件、自动更新新文件等

数据总数

ChineseGitHub file count
EnglishGitHub file count

结构

以下以中文版举例,英文版请见文件名带有en的对应文件

此仓库内共有两个爬虫程序:main.pyupdate.py以及一个页面生成程序webpage.py、一个略缩图生成程序thumbs.py,其中main.py用于初次运行,运行此文件可爬取并下载PlayStationStore内的全部游戏,update.py用于每日运行,以更新最新游戏。
中文版所有游戏的封面将会存储在./img/内,最新的游戏将被存储在./recent/
英文版所有游戏的封面将会存储在./img-en/内,最新的游戏将被存储在./recent-en/
另外,也有带有min前缀的文件夹,其中为相应的略缩图(256*256)

目录

Table of Contents


使用

获取封面

若要查找某游戏的封面,可直接访问 https://github.com/RavelloH/PSGameSpider/find/main 并搜索。 也可前往https://ravelloh.github.io/PSGameSpider 中搜索
若需下载所有文件,可直接下载仓库压缩包或clone。

运行爬虫

此程序基于Python3。

安装依赖

pip install bs4
pip install wget
pip install lxml
pip install Pillow

运行文件

以下皆以中文版举例,英文版请运行对应含有en的文件

初次使用,需运行main.py
注:爬取需要一定时间,具体按网络状况决定

之后更新文件只需运行update.py即可。 注:此程序只会更新当月最新游戏到总表中,要想保持列表完整性,请至少一个月运行一次。

webpage.py与thumbs.py用于生成静态页 需按时运行 样式可在webpage.py中自行调整

使用GithubActions

此仓库可直接fork并运行actions。
直接fork将会保留之前更新的文件,所以无需运行main.py

流程:
1.Fork此仓库
2.前往你的仓库,在Settings>Actions>General>Workflow permissions 中,将权限设为读写(Read and write permissions)
3.前往你的仓库,在Actions中选择允许Actions运行
4.前往你的仓库,在.github/workflows/main.yml中,修改commit模块中的信息为你自己的邮箱及用户名
5.保存,自动触发Workflow


关于

此项目源码使用MIT Licence。
爬取内容归索尼及相关工作室所有。

反馈

发现BUG&有修改建议,欢迎用ISSUES反馈

此项目文档需更多语言支持

About

自动爬取所有PlayStationStore中的所有游戏封面,自动生成网页并索引

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 83.2%
  • JavaScript 16.8%