해당 자료는 한진정보통신에서 데이터 엔지니어링 역량강화 과정 중 실시간 스트리밍 데이터 파이프라인 구축에서 사용하는 자료입니다.
데이터 수집 -> 저장 -> 분석/처리 -> 시각화(선택)를 각 단계를 AWS의 서비스를 이용하여 구축할 예정입니다.
- 총 데이터 : 5,446 건
- 대,중,소 분류, 제품명, PB 상품 여부
- 총 데이터 : 94,498
- 크기 : 5.7MB
- 기간 : 2015-01-01~2015-06-30
- VPC
- Public Subnet
- Public RouteTable
- IGW(Internet Gateway)
- Cloud9(IDE)
Cloudformation 출력 내 Cloud9 URL 클릭
wget https://github.com/byungjun0689/aws-streaming-sample-hist/archive/refs/heads/main.zip
unzip main.zip
cd aws-streaming-sample-hist
chmod +x setup/set-up-streaming-hands-on-cloud9.sh
# ec2에서 실행하려면 set-up-streaming-hands-on-ec2.sh
ls -lat setup/set-up-streaming-hands-on-cloud9.sh
-rwxrwxr-x 1 ec2-user ec2-user 970 Aug 9 04:12 set-up-streaming-hands-on-cloud9.sh
./setup/set-up-streaming-hands-on.sh