IIS_2023_1/arzamaskina_milana_lab_2/README.md

2.4 KiB
Raw Blame History

Лабораторная работа №2

Ранжирование признаков

Вариант №2

Задание:

Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).

Модели:

  • Линейная регрессия (LinearRegression)
  • Рекурсивное сокращение признаков (Recursive Feature Elimination RFE),
  • Сокращение признаков Случайными деревьями (Random Forest Regressor)

Какие технологии использовались:

Используемые библиотеки:

  • numpy
  • pandas
  • sklearn

Как запустить:

  • установить python, numpy, pandas, sklearn
  • запустить проект (стартовая точка - main.py)

Что делает программа:

  • Генерирует данные и обучает модели: LinearRegression, Recursive Feature Elimination (RFE), Random Forest Regressor
  • Производится ранжирование признаков с помощью моделей
  • Отображение получившихся результатов: значения признаков для каждой модели и 4 самых важных признака по среднему значению

4 самых важных признака по среднему значению

  • Признак №1 : 0.887
  • Признак №4 : 0.821
  • Признак №2 : 0.741
  • Признак №11 : 0.600

Результаты работы программы:

Result1 Result2 Result3 Result4