58 lines
3.0 KiB
Markdown
58 lines
3.0 KiB
Markdown
|
# Лабораторная работа №5: Регрессия
|
|||
|
## Задание. Вариант 3
|
|||
|
Мой вариант 28, поэтому взял 3 вариант
|
|||
|
|
|||
|
Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав
|
|||
|
задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
|
|||
|
|
|||
|
Вариант 3 - Лассо-регрессия
|
|||
|
|
|||
|
Задача:
|
|||
|
Предсказание рейтинга хостела (summary.score) на основе ключевых признаков цены (price.from), атмосферы (atmosphere),
|
|||
|
расстоянии от центра города (Distance), чистоте (cleanliness), удобства(facilities).
|
|||
|
|
|||
|
## Описание программы
|
|||
|
|
|||
|
Этот код решает задачу предсказания рейтинга хостелов на основе цены, атмосферы, чистоты, удобств и расстояния.
|
|||
|
Он использует модель Лассо-регрессии для этой задачи и оценивает ее точность на тестовом наборе данных.
|
|||
|
|
|||
|
## Как запустить лабораторную работу
|
|||
|
|
|||
|
1. Установите необходимые библиотеки:
|
|||
|
|
|||
|
```bash
|
|||
|
pip install pandas scikit-learn
|
|||
|
```
|
|||
|
|
|||
|
2. Запустите скрипт:
|
|||
|
|
|||
|
```bash
|
|||
|
python main.py
|
|||
|
```
|
|||
|
|
|||
|
## Использованные технологии
|
|||
|
|
|||
|
- Python
|
|||
|
- Pandas
|
|||
|
- scikit-learn
|
|||
|
|
|||
|
## Что программа делает
|
|||
|
|
|||
|
Загружает данные из файла 'Hostel.csv'. Выбирает признаки, описанные в задании. Очищает и разделяет данные на обучающие
|
|||
|
и тестовые перед использованием. Применяет модель Лассо-регрессии для обучения на обучающем наборе данных. Делает
|
|||
|
предсказание рейтинга хостелей на тестовом наборе данных. Оценивает точность модели рассчитывая среднеквадратичную
|
|||
|
ошибку (Mean Squared Error) и коэффициент детерминации (R-squared). Выводит в консоль точность модели, MSE и R-squared.
|
|||
|
|
|||
|
## Тесты
|
|||
|
|
|||
|
![Графики моделей](img.png)
|
|||
|
|
|||
|
## Вывод
|
|||
|
|
|||
|
_Точность модели составляет 90.46%, что подтверждается низким значением Mean Squared Error (0.0790) и высоким
|
|||
|
коэффициентом детерминации (R-squared: 0.9032). Такие результаты свидетельствуют об отличной эффективности модели и
|
|||
|
хорошей предсказательной способности._
|
|||
|
|
|||
|
---
|
|||
|
|