51 lines
3.1 KiB
Markdown
51 lines
3.1 KiB
Markdown
|
# Лабораторная работа №6
|
|||
|
|
|||
|
## ПИбд-41, Курмыза Павел
|
|||
|
|
|||
|
Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand.
|
|||
|
|
|||
|
Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие
|
|||
|
сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество
|
|||
|
свободных парковочных мест и т.д.
|
|||
|
|
|||
|
## Как запустить ЛР
|
|||
|
|
|||
|
- Запустить файл main.py
|
|||
|
|
|||
|
## Используемые технологии
|
|||
|
|
|||
|
- Язык программирования Python
|
|||
|
- Библиотеки: sklearn, numpy, pandas, xgboost, matplotlib, seaborn
|
|||
|
|
|||
|
## Что делает программа
|
|||
|
|
|||
|
Программа решает задачу классификации на выбранном датасете: определение гостиничного класса отеля (городской отель или
|
|||
|
курортный отель). Решение достигается в несколько этапов:
|
|||
|
|
|||
|
- Предобработка данных
|
|||
|
- Балансировка данных
|
|||
|
- Стандартизация данных и приведение их к виду, удобном для работы с моделью ML
|
|||
|
- Использование модели классификации MLPClassifier
|
|||
|
- Оценка точности и специфичности данной модели классификации
|
|||
|
|
|||
|
## Тестирование
|
|||
|
|
|||
|
Для решения задачи классификации были выбрана модель MLPClassifier.
|
|||
|
|
|||
|
Оценка точности модели: 0.9778297119757453
|
|||
|
|
|||
|
![Отчет классификации](classification_report.jpg)
|
|||
|
|
|||
|
Оценка способности модели MLPClassifier предсказывать истинные положительные результаты (TP / (TP + FN)), также
|
|||
|
известные как коэффициент чувствительности, и истинные отрицательные результаты (TN / (TN + FP)), также известный как
|
|||
|
коэффициент специфичности через матрицу неточностей:
|
|||
|
|
|||
|
![Матрица неточностей](confusion_matrix.jpg)
|
|||
|
|
|||
|
Матрица неточностей подтверждает приведенную ранее оценку модели MLPClassifier. Кроме того, она указывает на
|
|||
|
то, что помимо высокой точности, модель также имеет высокую специфичность.
|
|||
|
|
|||
|
## Вывод
|
|||
|
|
|||
|
По итогу тестирования было выявлено, что модель MLPClassifier подходит для решения поставленной задачи, на что указывают
|
|||
|
высокая оценка точности (97%) и специфичности данной модели.
|