45 lines
3.8 KiB
Markdown
45 lines
3.8 KiB
Markdown
# Лабораторная работа 5. Регрессия
|
||
### Вариант № 18(3)
|
||
Использовать регрессию для данных по варианту из таблицы,самостоятельно сформулировав задачу.
|
||
Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
|
||
|
||
***
|
||
## *Как запустить лабораторную работу:*
|
||
Чтобы запустить программу, открываем файл lab5 в PyCharm и нажимаем на зеленый треугольник в правом верхнем углу.
|
||
***
|
||
## *Использованные технологии:*
|
||
**Scikit-learn** - один из наиболее широко используемых пакетов Python для Data Science и Machine Learning. Он позволяет выполнять множество операций и предоставляет множество алгоритмов.
|
||
|
||
**Pandas** — это библиотека с открытым исходным кодом, предоставляющая высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python.
|
||
|
||
**Matplotlib** — это комплексная библиотека для создания статических, анимированных и интерактивных визуализаций на Python.
|
||
***
|
||
## *Что делает ЛР:*
|
||
В данной работе анализируется работа модели Lasso и решается задача предсказания уровня здоровья по ключевым характеристикам.
|
||
|
||
Имеется набор данных (clean_data), содержащий результаты опроса добровольцев на тему их состояния здоровья. Были выбраны 5 признаков для задачи регрессии:
|
||
* age - возраст респондента;
|
||
* weight - вес респондента;
|
||
* work - уровень физ. активности на работе;
|
||
* phy_ex - оценка важности физических упражнений;
|
||
* gymtime - время, проведенное в тренажерном зале.
|
||
|
||
Целевой переменной является phy_health - оценка состояния здоровья.
|
||
|
||
**Результатом работы программы** являются: вывод оценки качества модели (в консоли) и график фактических и предсказанных значений уровня здоровья респондента (lasso.png).
|
||
***
|
||
## *Пример выходных данных:*
|
||
>Вывод в консоли:
|
||
|
||

|
||
|
||
>График:
|
||
|
||

|
||
***
|
||
**Вывод**:
|
||
Оценка качества модели довольно низкая (~0,35), что говорит о том, что модель не совсем подходит для решения поставленной задачи. Судя по графику фактических и предсказанных
|
||
значений уровня здоровья иногда модель выдавала весьма точные предсказания, а в некоторых случаях совершенно далекие от истины.
|
||
|
||
|