# Лабораторная работа №6

## ПИбд-41, Курмыза Павел

Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand.

Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие
сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество
свободных парковочных мест и т.д.

## Как запустить ЛР

- Запустить файл main.py

## Используемые технологии

- Язык программирования Python
- Библиотеки: sklearn, numpy, pandas, xgboost, matplotlib, seaborn

## Что делает программа

Программа решает задачу классификации на выбранном датасете: определение гостиничного класса отеля (городской отель или
курортный отель). Решение достигается в несколько этапов:

- Предобработка данных
- Балансировка данных
- Стандартизация данных и приведение их к виду, удобном для работы с моделью ML
- Использование модели классификации MLPClassifier
- Оценка точности и специфичности данной модели классификации

## Тестирование

Для решения задачи классификации были выбрана модель MLPClassifier.

Оценка точности модели: 0.9778297119757453

![Отчет классификации](classification_report.jpg)

Оценка способности модели MLPClassifier предсказывать истинные положительные результаты (TP / (TP + FN)), также
известные как коэффициент чувствительности, и истинные отрицательные результаты (TN / (TN + FP)), также известный как
коэффициент специфичности через матрицу неточностей:

![Матрица неточностей](confusion_matrix.jpg)

Матрица неточностей подтверждает приведенную ранее оценку модели MLPClassifier. Кроме того, она указывает на
то, что помимо высокой точности, модель также имеет высокую специфичность.

## Вывод

По итогу тестирования было выявлено, что модель MLPClassifier подходит для решения поставленной задачи, на что указывают
высокая оценка точности (97%) и специфичности данной модели.