Skip to content

marcos-inja/data-visualization-crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

41 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Visualização de dados MyAnimeList

Metabase

Organização dos dados

Os dados são salvos em formato json que é o formato que é mandado para o mongodb. Veja os exemplos dos dados na pasta docs Todos os dados que estão sendo pegos pelo bot vem do MyAnimeList.

Como rodar

  • Primeiro instale as dependências:

    pip3 install -r requirements.txt
  • Baixe o chromedriver compatível com a versão do seu navegador Chrome.

  • Crie dois arquivos um chamado db_user.txt e outro chamado db_password.txt, e crie um nome de usuario e uma senha, isso será usado para o mongo, postgres e o metabase.

  • Suba o mongo, metabase e o postgres com o: docker-compose -f docker-compose.yml up.

  • Configure o .env com o caminho completo do chromedriver e informações dos bancos de dados Mongo e Postgres.

  • Rode o crawler com o usuário desejado

    python3 ./src/crawler.py -n MarcosInja 
  • Rode o Higienizador de dados para salva-los no Postgres

    python3 ./src/saned_data.py
    

About

MyAnimeList data collector, to be used in Metabase to generate graphs.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published