IIS_2023_1/kurmyza_pavel_lab_6/README.md

51 lines
3.1 KiB
Markdown
Raw Normal View History

2023-11-06 17:45:17 +04:00
# Лабораторная работа №6
## ПИбд-41, Курмыза Павел
Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand.
Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие
сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество
свободных парковочных мест и т.д.
## Как запустить ЛР
- Запустить файл main.py
## Используемые технологии
- Язык программирования Python
- Библиотеки: sklearn, numpy, pandas, xgboost, matplotlib, seaborn
## Что делает программа
Программа решает задачу классификации на выбранном датасете: определение гостиничного класса отеля (городской отель или
курортный отель). Решение достигается в несколько этапов:
- Предобработка данных
- Балансировка данных
- Стандартизация данных и приведение их к виду, удобном для работы с моделью ML
- Использование модели классификации MLPClassifier
- Оценка точности и специфичности данной модели классификации
## Тестирование
Для решения задачи классификации были выбрана модель MLPClassifier.
Оценка точности модели: 0.9778297119757453
![Отчет классификации](classification_report.jpg)
Оценка способности модели MLPClassifier предсказывать истинные положительные результаты (TP / (TP + FN)), также
известные как коэффициент чувствительности, и истинные отрицательные результаты (TN / (TN + FP)), также известный как
коэффициент специфичности через матрицу неточностей:
![Матрица неточностей](confusion_matrix.jpg)
Матрица неточностей подтверждает приведенную ранее оценку модели MLPClassifier. Кроме того, она указывает на
то, что помимо высокой точности, модель также имеет высокую специфичность.
## Вывод
По итогу тестирования было выявлено, что модель MLPClassifier подходит для решения поставленной задачи, на что указывают
высокая оценка точности (97%) и специфичности данной модели.