37 lines
1.7 KiB
Markdown
37 lines
1.7 KiB
Markdown
|
#### Кондрашин Михаил ПИбд-41
|
|||
|
|
|||
|
## Лабораторная работа 2. Ранжирование признаков
|
|||
|
|
|||
|
### Задание:
|
|||
|
|
|||
|
* Линейная регрессия (LinearRegression)
|
|||
|
* Сокращение признаков случайными деревьями (Random Forest Regressor)
|
|||
|
* Линейная корреляция (f_regression)
|
|||
|
|
|||
|
### Запуск лабораторной работы:
|
|||
|
|
|||
|
* установить `python`, `numpy`, `matplotlib`, `sklearn`
|
|||
|
* запустить проект (стартовая точка класс `main.py`)
|
|||
|
|
|||
|
### Используемые технологии:
|
|||
|
|
|||
|
* Язык программирования `Python`,
|
|||
|
* Библиотеки `numpy`, `matplotlib`, `sklearn`
|
|||
|
* Среда разработки `IntelliJ IDEA` (В версии "Ultimate edition" можно писать на python)
|
|||
|
|
|||
|
### Описание решения:
|
|||
|
|
|||
|
Программа выполняет ранжирование признаков для регрессионной модели:
|
|||
|
* Линейная регрессия (LinearRegression)
|
|||
|
* Сокращение признаков Случайными деревьями (Random Forest Regressor)
|
|||
|
* Линейная корреляция (f_regression)
|
|||
|
|
|||
|
*14 признаков
|
|||
|
*750 наблюдений
|
|||
|
|
|||
|
### Результат:
|
|||
|
![Result](images/result.png)
|
|||
|
* Лучше всего показал себя метод линейной корреляции (x4, x14, x2, x12). Хотя признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры x12 и x14.
|
|||
|
* Самые важные признаки по среднему значению: x1, x4, x2, x11
|
|||
|
|