Skip to content

T-DAT-901 project from MSC Pro Epitech's course. This project made us learn how to retrieve data (Scrapper / API), stream it (Kafka), analyse and process it (Spark), and display and monitor it (Grafana). We also had to take into account the problematic resources and look for the best configuration to work with.

Notifications You must be signed in to change notification settings

EliottClavier/T-DAT-901

Repository files navigation

Projet d'Analyse de Cryptomonnaie

Ce projet utilise Apache Spark pour analyser les données de cryptomonnaie en temps réel. Il traite les données streamées depuis Kafka, les analyse, puis stocke les résultats dans InfluxDB pour la visualisation avec Grafana.

Sommaire

  1. Prérequis
  2. Architecture du Projet
  3. Fonctionnement
  4. Exécution
  5. URL des services

Prérequis

  • Docker et Docker Compose

Architecture du Projet

  • Application Producer : Lire les données de cryptomonnaie à partir de différentes sources et les publier dans un topic Kafka.
  • Spark Master : Coordonne la distribution des tâches et la gestion des workers Spark.
  • Spark Workers : Exécutent les tâches de traitement des données assignées par le Spark Master.
  • InfluxDB : Base de données de séries temporelles utilisée pour le stockage des résultats d'analyse.
  • Grafana : Outil de visualisation connecté à InfluxDB pour afficher les résultats des analyses.

Fonctionnement

Le producteur de données extrait les données de cryptomonnaie à partir de différentes sources et les publie dans un topic Kafka. L'application Spark lit en continu les données de Kafka, effectue des analyses et des agrégations, puis écrit les résultats dans InfluxDB. Ces données peuvent ensuite être visualisées et explorées à l'aide de tableaux de bord dans Grafana.

Exécution

Variables d'environnement

Nommez le fichier .env.example en .env et remplissez les informations demandées.

Lancement des services

Pour lancer l'ensemble des services, exécutez le script start_app.sh à la racine du projet.

sh ./start_app.sh

URL des services

About

T-DAT-901 project from MSC Pro Epitech's course. This project made us learn how to retrieve data (Scrapper / API), stream it (Kafka), analyse and process it (Spark), and display and monitor it (Grafana). We also had to take into account the problematic resources and look for the best configuration to work with.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •