IIS_2023_1/kondrashin_mikhail_lab_2/README.md

1.7 KiB
Raw Blame History

Кондрашин Михаил ПИбд-41

Лабораторная работа 2. Ранжирование признаков

Задание:

  • Линейная регрессия (LinearRegression)
  • Сокращение признаков случайными деревьями (Random Forest Regressor)
  • Линейная корреляция (f_regression)

Запуск лабораторной работы:

  • установить python, numpy, matplotlib, sklearn
  • запустить проект (стартовая точка класс main.py)

Используемые технологии:

  • Язык программирования Python,
  • Библиотеки numpy, matplotlib, sklearn
  • Среда разработки IntelliJ IDEA (В версии "Ultimate edition" можно писать на python)

Описание решения:

Программа выполняет ранжирование признаков для регрессионной модели:

  • Линейная регрессия (LinearRegression)
  • Сокращение признаков Случайными деревьями (Random Forest Regressor)
  • Линейная корреляция (f_regression)

*14 признаков *750 наблюдений

Результат:

Result

  • Лучше всего показал себя метод линейной корреляции (x4, x14, x2, x12). Хотя признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры x12 и x14.
  • Самые важные признаки по среднему значению: x1, x4, x2, x11