Skip to content

Latest commit

 

History

History
41 lines (28 loc) · 3.37 KB

File metadata and controls

41 lines (28 loc) · 3.37 KB

Выпускной проект

Краткое описание

Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали.

Окончательно задача формулируется следующим образом: необходимо прогнозировать температуру стали в ковше перед разливкой, то есть на самом последнем этапе.

Целевой признак - температура ковша с металлом перед разливкой.

Целевая метрика - MAE

Целевое значение: MAE должно быть не выше 6.8

Подробное описание проекта и решение задачи в тетрадке.

Приёмы, которые демонстрирует проект

  1. Исследование данных
  2. Обработка аномальных значений, в т.ч. с sklearn.ensemble.IsolationForest
  3. Оценка информативности признаков с помощью взаимной информации (sklearn.feature_selection.mutual_info_classif), удаление неинформативных
  4. Заполнение пропусков
  5. Разработка новых признаков
  6. Использование моделей градиентрого бустинга: Catboost и LightGBM
  7. Оценка качества предсказаний моделей и анализ остатков
  8. Настройка гиперпараметров моделей с optuna
  9. Оформление графиков с seaborn и matplotlib
  10. Оценка значимости признаков для лучшей модели с shap

Иллюстрации к исследованию данных

Исследование распределения значений целевого признака:
Исследование распределения значений целевого признака

Сравнение качества предсказаний моделей до настройки гиперпараметров:
Сравнение качества предсказаний моделей до настройки гиперпараметров

Распределение остатков Catboost после настройки гиперпараметров:
Распределение остатков **Catboost** после настройки гиперпараметров

Оценка значимости признаков для лучшей модели с shap:
ООценка значимости признаков для лучшей модели