Os dados são salvos em formato json que é o formato que é mandado para o mongodb. Veja os exemplos dos dados na pasta docs
Todos os dados que estão sendo pegos pelo bot vem do MyAnimeList.
-
Primeiro instale as dependências:
pip3 install -r requirements.txt
-
Baixe o chromedriver compatível com a versão do seu navegador Chrome.
-
Crie dois arquivos um chamado
db_user.txt
e outro chamadodb_password.txt
, e crie um nome de usuario e uma senha, isso será usado para o mongo, postgres e o metabase. -
Suba o mongo, metabase e o postgres com o:
docker-compose -f docker-compose.yml up
. -
Configure o
.env
com o caminho completo do chromedriver e informações dos bancos de dados Mongo e Postgres. -
Rode o crawler com o usuário desejado
python3 ./src/crawler.py -n MarcosInja
-
Rode o Higienizador de dados para salva-los no Postgres
python3 ./src/saned_data.py