IIS_2023_1/tsyppo_anton_lab_5/README.md
2023-12-06 15:11:10 +04:00

58 lines
3.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа №5: Регрессия
## Задание. Вариант 3
Мой вариант 28, поэтому взял 3 вариант
Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав
задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
Вариант 3 - Лассо-регрессия
Задача:
Предсказание рейтинга хостела (summary.score) на основе ключевых признаков цены (price.from), атмосферы (atmosphere),
расстоянии от центра города (Distance), чистоте (cleanliness), удобства(facilities).
## Описание программы
Этот код решает задачу предсказания рейтинга хостелов на основе цены, атмосферы, чистоты, удобств и расстояния.
Он использует модель Лассо-регрессии для этой задачи и оценивает ее точность на тестовом наборе данных.
## Как запустить лабораторную работу
1. Установите необходимые библиотеки:
```bash
pip install pandas scikit-learn
```
2. Запустите скрипт:
```bash
python main.py
```
## Использованные технологии
- Python
- Pandas
- scikit-learn
## Что программа делает
Загружает данные из файла 'Hostel.csv'. Выбирает признаки, описанные в задании. Очищает и разделяет данные на обучающие
и тестовые перед использованием. Применяет модель Лассо-регрессии для обучения на обучающем наборе данных. Делает
предсказание рейтинга хостелей на тестовом наборе данных. Оценивает точность модели рассчитывая среднеквадратичную
ошибку (Mean Squared Error) и коэффициент детерминации (R-squared). Выводит в консоль точность модели, MSE и R-squared.
## Тесты
![Графики моделей](img.png)
## Вывод
_Точность модели составляет 90.46%, что подтверждается низким значением Mean Squared Error (0.0790) и высоким
коэффициентом детерминации (R-squared: 0.9032). Такие результаты свидетельствуют об отличной эффективности модели и
хорошей предсказательной способности._
---