IIS_2023_1/kondrashin_mikhail_lab_2/README.md

37 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

#### Кондрашин Михаил ПИбд-41
## Лабораторная работа 2. Ранжирование признаков
### Задание:
* Линейная регрессия (LinearRegression)
* Сокращение признаков случайными деревьями (Random Forest Regressor)
* Линейная корреляция (f_regression)
### Запуск лабораторной работы:
* установить `python`, `numpy`, `matplotlib`, `sklearn`
* запустить проект (стартовая точка класс `main.py`)
### Используемые технологии:
* Язык программирования `Python`,
* Библиотеки `numpy`, `matplotlib`, `sklearn`
* Среда разработки `IntelliJ IDEA` (В версии "Ultimate edition" можно писать на python)
### Описание решения:
Программа выполняет ранжирование признаков для регрессионной модели:
* Линейная регрессия (LinearRegression)
* Сокращение признаков Случайными деревьями (Random Forest Regressor)
* Линейная корреляция (f_regression)
*14 признаков
*750 наблюдений
### Результат:
![Result](images/result.png)
* Лучше всего показал себя метод линейной корреляции (x4, x14, x2, x12). Хотя признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры x12 и x14.
* Самые важные признаки по среднему значению: x1, x4, x2, x11