Компания «Чётенькое такси» собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час.
Цель: Построить модель, предсказывающую количество заказов такси на следующий час.
Целевая метрика: RMSE на тестовой выборке должно быть не больше 48.
Подробное описание проекта и решение задачи в тетрадке.
- Анализ временных рядов
- Разработка новых признаков
- Кодирование категориальных переменных с помощью category_encoders.target_encoder.TargetEncoder
- Использование модели градиентрого бустинг (LightGBM)
- Кросс-валидация для временных рядов
- Оценка качества предсказаний моделей и анализ остатков
- Настройка гиперпараметров моделей с sklearn.model_selection.GridSearchCV
Результат разделения времнного ряда на тренд, сезонность и остатки:
Оценка результатов лучшей модели на тестовой выборке - сравнение фактических и спрогнозированный значений: