IIS_2023_1/tsyppo_anton_lab_5/README.md
2023-12-06 15:11:10 +04:00

3.0 KiB
Raw Blame History

Лабораторная работа №5: Регрессия

Задание. Вариант 3

Мой вариант 28, поэтому взял 3 вариант

Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав
задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.

Вариант 3 - Лассо-регрессия

Задача: Предсказание рейтинга хостела (summary.score) на основе ключевых признаков цены (price.from), атмосферы (atmosphere), расстоянии от центра города (Distance), чистоте (cleanliness), удобства(facilities).

Описание программы

Этот код решает задачу предсказания рейтинга хостелов на основе цены, атмосферы, чистоты, удобств и расстояния. Он использует модель Лассо-регрессии для этой задачи и оценивает ее точность на тестовом наборе данных.

Как запустить лабораторную работу

  1. Установите необходимые библиотеки:

    pip install pandas scikit-learn
    
  2. Запустите скрипт:

    python main.py
    

Использованные технологии

  • Python
  • Pandas
  • scikit-learn

Что программа делает

Загружает данные из файла 'Hostel.csv'. Выбирает признаки, описанные в задании. Очищает и разделяет данные на обучающие и тестовые перед использованием. Применяет модель Лассо-регрессии для обучения на обучающем наборе данных. Делает предсказание рейтинга хостелей на тестовом наборе данных. Оценивает точность модели рассчитывая среднеквадратичную ошибку (Mean Squared Error) и коэффициент детерминации (R-squared). Выводит в консоль точность модели, MSE и R-squared.

Тесты

Графики моделей

Вывод

Точность модели составляет 90.46%, что подтверждается низким значением Mean Squared Error (0.0790) и высоким коэффициентом детерминации (R-squared: 0.9032). Такие результаты свидетельствуют об отличной эффективности модели и хорошей предсказательной способности.