IIS_2023_1/tsyppo_anton_lab_5/README.md

58 lines
3.0 KiB
Markdown
Raw Normal View History

2023-12-06 15:11:10 +04:00
# Лабораторная работа №5: Регрессия
## Задание. Вариант 3
Мой вариант 28, поэтому взял 3 вариант
Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав
задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
Вариант 3 - Лассо-регрессия
Задача:
Предсказание рейтинга хостела (summary.score) на основе ключевых признаков цены (price.from), атмосферы (atmosphere),
расстоянии от центра города (Distance), чистоте (cleanliness), удобства(facilities).
## Описание программы
Этот код решает задачу предсказания рейтинга хостелов на основе цены, атмосферы, чистоты, удобств и расстояния.
Он использует модель Лассо-регрессии для этой задачи и оценивает ее точность на тестовом наборе данных.
## Как запустить лабораторную работу
1. Установите необходимые библиотеки:
```bash
pip install pandas scikit-learn
```
2. Запустите скрипт:
```bash
python main.py
```
## Использованные технологии
- Python
- Pandas
- scikit-learn
## Что программа делает
Загружает данные из файла 'Hostel.csv'. Выбирает признаки, описанные в задании. Очищает и разделяет данные на обучающие
и тестовые перед использованием. Применяет модель Лассо-регрессии для обучения на обучающем наборе данных. Делает
предсказание рейтинга хостелей на тестовом наборе данных. Оценивает точность модели рассчитывая среднеквадратичную
ошибку (Mean Squared Error) и коэффициент детерминации (R-squared). Выводит в консоль точность модели, MSE и R-squared.
## Тесты
![Графики моделей](img.png)
## Вывод
_Точность модели составляет 90.46%, что подтверждается низким значением Mean Squared Error (0.0790) и высоким
коэффициентом детерминации (R-squared: 0.9032). Такие результаты свидетельствуют об отличной эффективности модели и
хорошей предсказательной способности._
---