В данном репозитории представлены проекты, выполненные в ходе обучения по программе профессиональной переподготовки Специалист по Data Science в Яндекс Практикуме. Язык программирования - python
. Все проекты выполнены в срок и приняты ревьюерами. Перед размещением на репозитории в проекты внесены небольшие корректировки.
Проект | Описание | Навыки и инструменты | Направление деятельности |
---|---|---|---|
00 Исследование данных сервиса Яндекс.Музыка | Проверка гипотез о музыкальных предпочтениях пользователей двух городов | pandas |
Data Analyst |
01 Исследование надёжности заёмщиков | Исследование влияния характеристик клиентов на погашение кредита в срок | pandas , предобработка данных |
Data Analyst , Финансовый аналитик |
02 Исследование о продаже квартир | Обнаружение и исследование параметров, влияющих на цену объектов | pandas , numpy , matplotlib , seaborn , исследовательский анализ данных , визуализация данных , предобработка данных |
Маркетинг-аналатик , Data Analyst |
03 Исследование тарифов оператора сотовой связи | Анализ тарифов для приоритезации в рекламе | pandas , numpy , matplotlib , seaborn , scipy , исследовательский анализ данных , визуализация данных , предобработка данных |
Маркетинг-аналатик , Продуктовый аналитик , Data Analyst |
04 Исследование игровых платформ Сборный проект 1 |
Определение параметров, определяющих успешность игр в разных регионах мира | pandas , numpy , matplotlib , seaborn , scipy , исследовательский анализ данных , визуализация данных , предобработка данных |
Маркетинг-аналитик , Data Analyst |
05 Рекомендация тарифов оператора мобильной связи | Исследование влияния гиперпараметров классификаторов на метрику | pandas , matplotlib , seaborn , sklearn , LogisticRegression , RandomForestClassifier |
Машинное обучение , Классификация |
06 Прогнозирование оттока клиентов | Исследование метрик классификации | pandas , matplotlib , seaborn , sklearn , LogisticRegression , DecisionTreeClassifier , RandomForestClassifier |
Машинное обучение , Классификация |
07 Определение стоимости автомобилей | Построение модели определения стоимости автомобиля на основе исторических данных | pandas , matplotlib , seaborn , sklearn , PipeLine , LinearRegression , RandomForestRegressor , LGBM , CatBoost |
Машинное обучение , Регрессия |