.. | ||
img_result_1.png | ||
img_result_2.png | ||
img_result_3.png | ||
img_result_4.png | ||
main.py | ||
README.md |
Лабораторная работа №2
Ранжирование признаков
Вариант №2
Задание:
Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).
Модели:
- Линейная регрессия (LinearRegression)
- Рекурсивное сокращение признаков (Recursive Feature Elimination –RFE),
- Сокращение признаков Случайными деревьями (Random Forest Regressor)
Какие технологии использовались:
Используемые библиотеки:
- numpy
- pandas
- sklearn
Как запустить:
- установить python, numpy, pandas, sklearn
- запустить проект (стартовая точка - main.py)
Что делает программа:
- Генерирует данные и обучает модели: LinearRegression, Recursive Feature Elimination (RFE), Random Forest Regressor
- Производится ранжирование признаков с помощью моделей
- Отображение получившихся результатов: значения признаков для каждой модели и 4 самых важных признака по среднему значению
4 самых важных признака по среднему значению
- Признак №1 : 0.887
- Признак №4 : 0.821
- Признак №2 : 0.741
- Признак №11 : 0.600