# Лабораторная работа №6 ## ПИбд-41, Курмыза Павел Датасет по варианту: https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand. Данный набор данных содержит информацию о бронировании городской и курортной гостиниц и включает в себя такие сведения, как время бронирования, продолжительность пребывания, количество взрослых, детей и/или младенцев, количество свободных парковочных мест и т.д. ## Как запустить ЛР - Запустить файл main.py ## Используемые технологии - Язык программирования Python - Библиотеки: sklearn, numpy, pandas, xgboost, matplotlib, seaborn ## Что делает программа Программа решает задачу классификации на выбранном датасете: определение гостиничного класса отеля (городской отель или курортный отель). Решение достигается в несколько этапов: - Предобработка данных - Балансировка данных - Стандартизация данных и приведение их к виду, удобном для работы с моделью ML - Использование модели классификации MLPClassifier - Оценка точности и специфичности данной модели классификации ## Тестирование Для решения задачи классификации были выбрана модель MLPClassifier. Оценка точности модели: 0.9778297119757453 ![Отчет классификации](classification_report.jpg) Оценка способности модели MLPClassifier предсказывать истинные положительные результаты (TP / (TP + FN)), также известные как коэффициент чувствительности, и истинные отрицательные результаты (TN / (TN + FP)), также известный как коэффициент специфичности через матрицу неточностей: ![Матрица неточностей](confusion_matrix.jpg) Матрица неточностей подтверждает приведенную ранее оценку модели MLPClassifier. Кроме того, она указывает на то, что помимо высокой точности, модель также имеет высокую специфичность. ## Вывод По итогу тестирования было выявлено, что модель MLPClassifier подходит для решения поставленной задачи, на что указывают высокая оценка точности (97%) и специфичности данной модели.