IMDb Top 250 Movies Analysis

Scraping data from IMDb Top 250 Movies and getting some insights about them

Description

This Poject had 3 phases :

Scraping data from IMDB
Creating DataBase using MySQL and mysql.connector
Analyzing gathered data and get some insights

Data Scraping

I used both Selenium and bs4(BeautifulSoup) to scrape data such as :

title
year
parental guide
runtime(in minutes)
genre
director
writer
star
gross us canada

DataBase Design

First I cleaned data and then used MySQL and mysql.connector to create following DataBase :

Analyzing

This Phase has 3 parts :

Based on users input ->

Filtering by movies release year
Filtering by movies runtime
Filtering by movies stars
Filtering by movies genre

Static Plots ->

10 most selling Movie
5 most prolific actors
Number of Genres
Number of Parental Guide
Number of each Genre for each Parental Guide

User Required Graph (Dynamic Plots) ->

Top 10 Selling based on input Genre
Word Cloud of Movies based on input Genre

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Analysis.ipynb		Analysis.ipynb
Crawl_Data.ipynb		Crawl_Data.ipynb
Create_DataBase.ipynb		Create_DataBase.ipynb
IMDB_Movies.csv		IMDB_Movies.csv
IMDB_Names.csv		IMDB_Names.csv
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IMDb Top 250 Movies Analysis

Description

Data Scraping

DataBase Design

Analyzing

About

Releases

Packages

Languages

MiladNooraei/IMDb-Top-250-Movies-Analysis

Folders and files

Latest commit

History

Repository files navigation

IMDb Top 250 Movies Analysis

Description

Data Scraping

DataBase Design

Analyzing

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages