Skip to content

Latest commit

 

History

History

09 СБОРНЫЙ ПРОЕКТ - 2

Восстановление золота из руды

Краткое описание

Задача подготовить модель, которая должна предсказать коэффициент восстановления золота из золотосодержащей руды, используя данные с параметрами добычи и очистки.

Модель поможет оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками.

Подробное описание проекта и решение задачи в тетрадке.

Приёмы, которые демонстрирует проект

  1. Заполнение пропусков
  2. Очистка данных от аномалий
  3. Манипуляции с данными средствами pandas
  4. Исследовательский анализ данных
  5. Тестирование статистических гипотез: проверка гипотезы о равенстве средних с помощью scipy.stats.ttest_ind и проверка гипотезы о принадлежности двух независимых выборок одному закону распределения с помощью критерия Колмагорова-Смирнова и scipy.stats.ks_2samp
  6. Использование конвейеров из sklearn.pipeline.Pipeline
  7. Создание собственной метрики качества модели с sklearn.metrics.make_scorer
  8. Оценка моделей производительности моделей и вывода результатов
  9. Настройка гиперпараметров моделей с sklearn.model_selection.GridSearchCV
  10. Оформление графиков с seaborn и matplotlib

Иллюстрации к исследованию данных

Ниже приведены некоторые графики из разделов с исследованием данных.

Исследование распределений признаков
Распределения признаков

Исследование корцентрации золота на разных этапах очистки
Корцентрации золота на разных этапах очистки

Матрица корреляции из исследовательского анализа
Матрица корреляции