.. | ||
classification_report.jpg | ||
confusion_matrix.jpg | ||
hotel_bookings.csv | ||
main.py | ||
README.md |
Лабораторная работа №6
ПИбд-41, Курмыза Павел
Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand.
Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество свободных парковочных мест и т.д.
Как запустить ЛР
- Запустить файл main.py
Используемые технологии
- Язык программирования Python
- Библиотеки: sklearn, numpy, pandas, xgboost, matplotlib, seaborn
Что делает программа
Программа решает задачу классификации на выбранном датасете: определение гостиничного класса отеля (городской отель или курортный отель). Решение достигается в несколько этапов:
- Предобработка данных
- Балансировка данных
- Стандартизация данных и приведение их к виду, удобном для работы с моделью ML
- Использование модели классификации MLPClassifier
- Оценка точности и специфичности данной модели классификации
Тестирование
Для решения задачи классификации были выбрана модель MLPClassifier.
Оценка точности модели: 0.9778297119757453
Оценка способности модели MLPClassifier предсказывать истинные положительные результаты (TP / (TP + FN)), также известные как коэффициент чувствительности, и истинные отрицательные результаты (TN / (TN + FP)), также известный как коэффициент специфичности через матрицу неточностей:
Матрица неточностей подтверждает приведенную ранее оценку модели MLPClassifier. Кроме того, она указывает на то, что помимо высокой точности, модель также имеет высокую специфичность.
Вывод
По итогу тестирования было выявлено, что модель MLPClassifier подходит для решения поставленной задачи, на что указывают высокая оценка точности (97%) и специфичности данной модели.