50 lines
2.4 KiB
Markdown
50 lines
2.4 KiB
Markdown
## Лабораторная работа №2
|
||
|
||
### Ранжирование признаков
|
||
|
||
Вариант №2
|
||
|
||
## Задание:
|
||
|
||
Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205),
|
||
выполните ранжирование признаков с помощью указанных по варианту моделей.
|
||
Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
|
||
Проведите анализ получившихся результатов.
|
||
Какие четыре признака оказались самыми важными по среднему значению?
|
||
(Названия\индексы признаков и будут ответом на задание).
|
||
|
||
Модели:
|
||
+ Линейная регрессия (LinearRegression)
|
||
+ Рекурсивное сокращение признаков (Recursive Feature Elimination –RFE),
|
||
+ Сокращение признаков Случайными деревьями (Random Forest Regressor)
|
||
|
||
### Какие технологии использовались:
|
||
|
||
Используемые библиотеки:
|
||
* numpy
|
||
* pandas
|
||
* sklearn
|
||
|
||
### Как запустить:
|
||
|
||
* установить python, numpy, pandas, sklearn
|
||
* запустить проект (стартовая точка - main.py)
|
||
|
||
### Что делает программа:
|
||
|
||
* Генерирует данные и обучает модели: LinearRegression, Recursive Feature Elimination (RFE), Random Forest Regressor
|
||
* Производится ранжирование признаков с помощью моделей
|
||
* Отображение получившихся результатов: значения признаков для каждой модели и 4 самых важных признака по среднему значению
|
||
|
||
### 4 самых важных признака по среднему значению
|
||
* Признак №1 : 0.887
|
||
* Признак №4 : 0.821
|
||
* Признак №2 : 0.741
|
||
* Признак №11 : 0.600
|
||
|
||
#### Результаты работы программы:
|
||
|
||
![Result1](img_result_1.png)
|
||
![Result2](img_result_2.png)
|
||
![Result3](img_result_3.png)
|
||
![Result4](img_result_4.png) |