Data Science ๋ถ์ผ ๊ด๋ จ, ์ฌํ๊น์ง ์ํํ ํ๋ก์ ํธ๋ฅผ ์ ๋ฆฌํ ํฌํธํด๋ฆฌ์ค์ ๋๋ค.
์ ๋ Data Science๊ฐ ์งํฅํด์ผํ ๋ฐฉํฅ์ MLOps์ด๊ณ ์ธ๋ถ ๊ณผ์ ์ ์๋์ ๊ฐ๋ค๊ณ ์๊ฐํฉ๋๋ค.
- Data Lake์์ ๋ฐ์ดํฐ ์ถ์ถ
- ์ถ์ถ๋ ๋ฐ์ดํฐ๋ฅผ ์ ์๋ฏธํ ํํ๋ก ๊ฐ๊ณต
- ์ ์๋ฏธํ ์งํ/scoring ์์ฑ
- ์๊ณ ๋ฆฌ์ฆ ์ ์ฉ
- ๊ฒฐ๊ณผ๋ฅผ ์ 3์์๊ฒ ํจ๊ณผ์ ์ผ๋ก ์ ๋ฌ
- UI/์๊ฐํ ๊ตฌ์ถ
- ๊ฒฐ๊ณผ monitoring์ ํตํ ์ฑ๋ฅ ๊ฐ์
- ์ ๊ณผ์ ์ pipeline์ผ๋ก ๋ง๋ค์ด ์๋ํ ์์คํ ๊ตฌ์ถ
์ด๋ฌํ ์๊ฐ ๋๋ฌธ์, ์ ๋ ํฌ๊ฒ ์ธ ๊ฐ์ ๋ถ์ผ์ ์ญ๋์ ํค์ฐ๊ณ ์ ํ์์ต๋๋ค.
- Engineering / Development: ์์ 1๋ฒ, 5๋ฒ ๊ด๋ จ ๋ถ์ผ
- ๋น ๋ฐ์ดํฐ ํ๋ ์์ํฌ
- pipeline ๊ตฌ์ถ
- ์๋ํ ํ๋ก๊ทธ๋๋ฐ ์์คํ ๊ตฌ์ถ
- Analysis: ์์ 2๋ฒ ๊ด๋ จ ๋ถ์ผ
- Statistical / ML Modeling
- Algorithm ์ดํด,์ต๋,๊ตฌํ
- EDA
- Raw ๋ฐ์ดํฐ๋ฅผ ์ ์๋ฏธํ ํํ๋ก ๊ฐ๊ณตํ๋ Insight
- Reporting: ์์ 3๋ฒ ๊ด๋ จ ๋ถ์ผ
- ์๊ฐํ
- ๋์๋ณด๋
์ด ํฌํธํด๋ฆฌ์ค๋ฅผ ๋ณด์๋ ๋ถ๋ค์ ์๊ฐ์ ๋๋ํ์ง ์์ผ๋ฆฌ๋ผ ์๊ฐํ์ต๋๋ค. ๋ง์ ์ง์์๋ค์ ์๋ฅ ๋ฐ ํฌํธํด๋ฆฌ์ค๋ฅผ ๊ฒํ ํ์๊ณ , ๊ทธ ์ง์์๋ค ์ค ํ๋ช ์ด ์ ๋ผ๊ณ ์๊ฐํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฐ๋ผ์ ์ ๋ ์ด๋ป๊ฒ ํ๋ฉด ์๋ฅ๋ฅผ ๊ฒํ ํ์๋ ๋ถ๋ค์ ์๊ฐ์ ์ ์ฝํ๋ฉด์, ๋์์ ํจ์จ์ ์ผ๋ก ์ ๊ฐ ์ฌํ๊น์ง ์ํํ Data Science ํฌํธํด๋ฆฌ์ค๋ฅผ ์ ๋ฌํ ์ง ๊ณ ๋ฏผํ์ต๋๋ค.
๊ณ ๋ฏผ ๋์ ํฌ๊ฒ ๋ ๊ฐ์ง ํํ๋ก ํฌํธํด๋ฆฌ์ค๋ฅผ ๊ตฌ์ฑํ์ต๋๋ค.
์ฒซ ๋ฒ์งธ๋ ํฌํธํด๋ฆฌ์ค์ ์ ์ฒด์ ์ธ ํ๋ฆ์ ์๊ฐํ๋ฅผ ํตํด ๋ณด์ฌ๋๋ฆฌ๋ ๊ฒ์ ๋๋ค.
์๊ฐํ(Visualization)๋ ๋ง์ ์ ๋ณด๋ฅผ ํ๋์ ๋ณด๊ธฐ ์ฝ๊ฒ, ์ดํดํ๊ธฐ ์ฝ๊ฒ ์ ๋ฌํ๋ ๊ฒ์ ์๋ฏธํ๊ณ Data Science์ ํฐ ๋ถ๋ถ์ ์ฐจ์งํ๊ธฐ๋ ํฉ๋๋ค. ์ด๋ป๊ฒ ๋ณด๋ฉด, ํ์ฌ ์ ๊ฐ ๊ณ ๋ฏผํ๊ณ ์๋ ๋ถ๋ถ์ด ์๊ฐํ์์ ํด๊ฒฐํ๊ณ ์ํ๋ ๋ฌธ์ ์ ์ ์ฌํ๋ค๊ณ ์๊ฐํ์ต๋๋ค. ๋ฐ๋ผ์ ์๊ฐํ๋ฅผ ํตํด ์ด๋ ํ ๊ณผ์ ์ ๊ฑฐ์น๋ฉฐ Data Science ๋ถ์ผ์์ ๊ด๋ จ ์ญ๋์ ์๊ณ ์ ๋ ธ๋ ฅํ๋์ง, ์ผ์ข ์ ์คํ ๋ฆฌ๋ฅผ ์ ๋ฌํ๊ณ ์ ํ์ต๋๋ค. ํฌํธํด๋ฆฌ์ค ์๊ฐํ๋ ์ฌ๊ธฐ๋ฅผ ํตํด ํ์ธํ์ค ์ ์์ต๋๋ค.
์ด๋ ์ผ๋ฐ์ ์ธ ํํ์ ํฌํธํด๋ฆฌ์ค๋ก์จ, ์ ๊ฐ ์๊ฐํ๋ Data Science์ ์ด์ํฅ์ ๊ฐ๊น์์ง๊ธฐ ์ํด ์ํํ, ๊ฐ์ฅ ์ฐ๊ด๋ ๊ฒฝํ์ ์ ๋ณํ์ฌ ์ด๋ฅผ ์์ฝํ์์ต๋๋ค. ํด๋น ๋ด์ฉ์ ์ฌ๊ธฐ๋ฅผ ํตํด ํ์ธํ์ค ์ ์์ต๋๋ค.
๊ฐ ํฌํธํด๋ฆฌ์ค์์ ๊ด๋ จ ๊ฒฝํ์ ๋ํ ์์ธ ๋ด์ฉ์ ํธ๋ฆฌํ๊ฒ ํ์ธํ์ค ์ ์๋๋ก ๋งํฌ๋ฅผ ๊ฑธ์ด๋์์ต๋๋ค.