IIS_2023_1/arzamaskina_milana_lab_2/README.md

50 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## Лабораторная работа №2
### Ранжирование признаков
Вариант №2
## Задание:
Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205),
выполните ранжирование признаков с помощью указанных по варианту моделей.
Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
Проведите анализ получившихся результатов.
Какие четыре признака оказались самыми важными по среднему значению?
(Названия\индексы признаков и будут ответом на задание).
Модели:
+ Линейная регрессия (LinearRegression)
+ Рекурсивное сокращение признаков (Recursive Feature Elimination RFE),
+ Сокращение признаков Случайными деревьями (Random Forest Regressor)
### Какие технологии использовались:
Используемые библиотеки:
* numpy
* pandas
* sklearn
### Как запустить:
* установить python, numpy, pandas, sklearn
* запустить проект (стартовая точка - main.py)
### Что делает программа:
* Генерирует данные и обучает модели: LinearRegression, Recursive Feature Elimination (RFE), Random Forest Regressor
* Производится ранжирование признаков с помощью моделей
* Отображение получившихся результатов: значения признаков для каждой модели и 4 самых важных признака по среднему значению
### 4 самых важных признака по среднему значению
* Признак №1 : 0.887
* Признак №4 : 0.821
* Признак №2 : 0.741
* Признак №11 : 0.600
#### Результаты работы программы:
![Result1](img_result_1.png)
![Result2](img_result_2.png)
![Result3](img_result_3.png)
![Result4](img_result_4.png)