IIS_2023_1/kurmyza_pavel_lab_4/README.md

2.9 KiB
Raw Blame History

Лабораторная работа №4

ПИбд-41, Курмыза Павел

Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand.

Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество свободных парковочных мест и т.д.

Как запустить ЛР

  • Запустить файл main.py

Используемые технологии

  • Язык программирования Python
  • Библиотеки: sklearn, numpy, pandas

Что делает программа

Программа решает задачу регрессии на выбранном датасете: предсказание возможности бронирования номера в отеле определенного типа (курортный отель или гостиничный). Решение достигается в несколько этапов:

  • Предобработка данных
  • Стандартизация данных и приведение их к виду, удобном для работы с моделями ML
  • Использование модели логистической регрессии
  • Оценка точности модели для решения данной задачи

Тестирование

Для решения задачи регрессии была выбрана модель LogisticRegression.

LogisticRegression - это статистическая модель, которая в своей базовой форме использует логистическую функцию для моделирования двоичной зависимой переменной. В анализе регрессии, логистическая регрессия оценивает параметры логистической модели (вид бинарной регрессии).

Оценка точности модели:

Отчет

Вывод

По итогу тестирования было выявлено, что данная модель может быть использована для решения задачи предсказания возможности бронирования номера в отеле определенного типа. Однако, оценка точности модели и матрица неточностей указывают на то, что в 20-30% случаев модель будет ошибаться.