Этот проект представляет собой скрапер (веб-скрапер), который собирает данные из GitHub о репозиториях и сохраняет их в базу данных PostgreSQL для последующего использования в качестве материала для обучения нейронных сетей рекомендательных систем.
Скрапер написан на Python и использует библиотеки psycopg2 для работы с базой данных и requests для выполнения HTTP-запросов. Он выполняет следующие задачи:
- Получает метаданные репозиториев GitHub, включая названия, описания, темы, количество звезд, вилок, наблюдателей.
- Извлекает содержимое файлов README из репозиториев.
- Сохраняет собранные данные в базу данных PostgreSQL.
- Клонируйте этот репозиторий:
git clone https://github.com/kikimora12304855/sckreb
- Перейдите в директорию проекта:
cd sckreb
Его можно создать по ссылке https://github.com/settings/tokens?type=beta
- Поменяйте
API_GITHUB
,DBUSER
,DBPASS
,DBNAME
,DBHOST
на свои - Запустите контейнеры Docker:
docker-compose up -d
- Скрапер начнет собирать данные из GitHub и сохранять их в базу данных.
Этот проект распространяется по лицензии MIT License. См. файл LICENSE для более подробной информации.