Northwind database + S3 + Redshift + IAM.
- Create a cluster on Amazon Redshift.
- Create the Northwind database.
- Create the database structure by running northwinddl.sql using the Redshift query editor.
- Create credentials for Copy in IAM.
- Upload the 8 CSV files to an Amazon S3 bucket.
- Execute Copy to load data (copy.sql can be used as a template).
The numbers in red may have different values
- Explore the data
- Queries to analyze if there were many sales with values below the price. Also analyze the quantity of sales ordered by the difference.
- Query to analyze the quantity of sales by the seller "Robert" in relation to the other sellers in the year 2022.
- Query to analyze the top 10 most expensive products.
- Query to analyze the sales progress of the year 2021 in relation to 2020. Analyze the difference in sales by supplier for these last 2 years.
- Query to analyze the top selling categories per year (2020, 2021, and 2022), but only listing the top 5 for each year.
The solutions are in the "atividade[n].txt" files.
Banco de dados northwind + S3 + Redshift + IAM.
- Criar cluster no Amazon Redshift.
- Criar banco de dados Northwind.
- Criar estrutura do banco de dados rodando northwinddl.sql utilizando o editor de consultas do Redshift.
- Criar credencias para Copy no IAM.
- Fazer upload dos 8 arquivos CSV para um bucket o Amazon S3.
- Executar Copy para carregar dados (copy.sql pode ser usado como modelo).
Os números em vermelho podem possuir valores diferentes
- Explorar os dados
- Consultas para analisar se houve muitas vendas com valores abaixo do preço. Também analisar a quantidade de vendas ordenadas pela diferença.
- Consulta para analisar a quantidade de vendas do vendedor "Robert" em relação aos outros vendedores no ano de 2022.
- Consulta para analisar quais os 10 produtos mais caros.
- Consulta para analisar o progresso das vendas do ano de 2021 em relação a 2020. Analisar a diferença de vendas por fornecedor, das vendas desses últimos 2 anos.
- Consulta para analisar as categorias mais vendidas por ano (2020, 2021 e 2022), porém só listando as 5 maiores de cada ano.
As soluçôes se encontram nos arquivos "atividade[n].txt".