Skip to content

Парсинг и создание оффлайн-библиотеки

Notifications You must be signed in to change notification settings

dmitry-zharinov/books-library

Repository files navigation

Библиотека научно-фантастических книг

Скрипт позволяет скачивать книги с сайта tululu.org в формате .txt с обложками и комментариями, а также формирует сайт для навигации по библиотеке.

Как установить

  1. Предварительно должен быть установлен Python3.
  2. Для установки зависимостей:
$ pip install -r requirements.txt

Скачивание книг жанра научной фантастики

Для запуска скрипта:

$ parse_tululu_category.py --start_page START_PAGE --end_page END_PAGE --dest_folder DEST_FOLDER --skip_imgs --skip_txt --json_path JSON_PATH

Аргументы

  • --start_page START_PAGE - с какого номера страницы начинать скачивание (по умолчанию - 1);
  • --end_page END_PAGE - по какую страницу скачивать (по умолчанию - 10);
  • --dest_folder DEST_FOLDER — путь к каталогу с результатами парсинга: картинкам, книгам (по умолчанию - папка media в каталоге скрипта);
  • --skip_imgs — не скачивать картинки;
  • --skip_txt — не скачивать книги;
  • --json_path JSON_PATH — путь к каталогу с *.json файлом с результатами работы скрипта (по умолчанию - папка media в каталоге скрипта);

Создание сайта оффлайн-библиотеки

Предварительно необходимо скачать данные для библиотеки (см. предыдущий пункт).

$ parse_tululu_category.py --start_page START_PAGE --end_page END_PAGE

В папке pages будут созданы страницы библиотеки. Открыв любую из страниц, вы сможете перемещаться по библиотеке и читать книги.

Пример работы сайта

Ссылка на страницу библиотеки пример

Цели проекта

Код написан в образовательных целях для курса dvmn.org.

About

Парсинг и создание оффлайн-библиотеки

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published