2023-11-14 01:27:22 +04:00
|
|
|
|
# Лабораторная работа 5. Регрессия
|
|
|
|
|
## Задание
|
|
|
|
|
Использовать метод регрессии по варианту (24 == 4) для данных из таблицы, самостоятельно сформулировав задачу.
|
|
|
|
|
Оценить, насколько хорошо она подходит для решения сформулированной мной задачи.
|
2023-11-13 23:50:04 +04:00
|
|
|
|
|
2023-11-14 01:27:22 +04:00
|
|
|
|
Ссылка на мой датасет: https://www.kaggle.com/datasets/mlardi/hotel-booking-demand-with-economic-indicators
|
|
|
|
|
## Задача
|
|
|
|
|
Прогнозировать значение целевой переменной (доход) на основе набора экономических показателей,
|
|
|
|
|
используя гребневую регрессию.
|
|
|
|
|
### Запуск программы
|
|
|
|
|
Файл lab5.py содержит и запускает программу.
|
2023-11-13 23:50:04 +04:00
|
|
|
|
|
2023-11-14 01:27:22 +04:00
|
|
|
|
### Описание программы
|
|
|
|
|
Программа состоит из двух частей:
|
|
|
|
|
1. Она считывает файл с данными о двух отелях: City Hotel и Resort Hotel. Содержит множество различных метрик
|
|
|
|
|
2. Далее определяет необходимые признаки для характеристики дохода
|
|
|
|
|
3. Обучает модель и выводит результат по различным метрикам
|
|
|
|
|
### Результаты тестирования
|
|
|
|
|
По результатам тестирования, можно сказать следующее:
|
2023-11-13 23:50:04 +04:00
|
|
|
|
|
2023-11-14 01:27:22 +04:00
|
|
|
|
Вывод:
|
|
|
|
|
* Среднеквадратичная ошибка (MSE) - 39% - показывает самое большое отклонение
|
|
|
|
|
* Среднеабсолютное отклонение (MAE) - 29% - показывает средний уровень отклонения
|
|
|
|
|
* Коэффициент детерминации (R^2) - 32% - показывает уровень изменчивости целевой переменной
|
2023-11-13 23:50:04 +04:00
|
|
|
|
|
2023-11-14 01:27:22 +04:00
|
|
|
|
Результаты показывают, что модель может быть улучшена,
|
|
|
|
|
так как имеется значительный уровень ошибки и только небольшая доля изменчивости данных объяснена моделью
|