50 lines
2.4 KiB
Markdown
50 lines
2.4 KiB
Markdown
|
## Лабораторная работа №2
|
|||
|
|
|||
|
### Ранжирование признаков
|
|||
|
|
|||
|
Вариант №2
|
|||
|
|
|||
|
## Задание:
|
|||
|
|
|||
|
Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205),
|
|||
|
выполните ранжирование признаков с помощью указанных по варианту моделей.
|
|||
|
Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
|
|||
|
Проведите анализ получившихся результатов.
|
|||
|
Какие четыре признака оказались самыми важными по среднему значению?
|
|||
|
(Названия\индексы признаков и будут ответом на задание).
|
|||
|
|
|||
|
Модели:
|
|||
|
+ Линейная регрессия (LinearRegression)
|
|||
|
+ Рекурсивное сокращение признаков (Recursive Feature Elimination –RFE),
|
|||
|
+ Сокращение признаков Случайными деревьями (Random Forest Regressor)
|
|||
|
|
|||
|
### Какие технологии использовались:
|
|||
|
|
|||
|
Используемые библиотеки:
|
|||
|
* numpy
|
|||
|
* pandas
|
|||
|
* sklearn
|
|||
|
|
|||
|
### Как запустить:
|
|||
|
|
|||
|
* установить python, numpy, pandas, sklearn
|
|||
|
* запустить проект (стартовая точка - main.py)
|
|||
|
|
|||
|
### Что делает программа:
|
|||
|
|
|||
|
* Генерирует данные и обучает модели: LinearRegression, Recursive Feature Elimination (RFE), Random Forest Regressor
|
|||
|
* Производится ранжирование признаков с помощью моделей
|
|||
|
* Отображение получившихся результатов: значения признаков для каждой модели и 4 самых важных признака по среднему значению
|
|||
|
|
|||
|
### 4 самых важных признака по среднему значению
|
|||
|
* Признак №1 : 0.887
|
|||
|
* Признак №4 : 0.821
|
|||
|
* Признак №2 : 0.741
|
|||
|
* Признак №11 : 0.600
|
|||
|
|
|||
|
#### Результаты работы программы:
|
|||
|
|
|||
|
![Result1](img_result_1.png)
|
|||
|
![Result2](img_result_2.png)
|
|||
|
![Result3](img_result_3.png)
|
|||
|
![Result4](img_result_4.png)
|