.. | ||
images | ||
data.py | ||
main.py | ||
ranks.py | ||
README.md |
Кондрашин Михаил ПИбд-41
Лабораторная работа 2. Ранжирование признаков
Задание:
- Линейная регрессия (LinearRegression)
- Сокращение признаков случайными деревьями (Random Forest Regressor)
- Линейная корреляция (f_regression)
Запуск лабораторной работы:
- установить
python
,numpy
,matplotlib
,sklearn
- запустить проект (стартовая точка класс
main.py
)
Используемые технологии:
- Язык программирования
Python
, - Библиотеки
numpy
,matplotlib
,sklearn
- Среда разработки
IntelliJ IDEA
(В версии "Ultimate edition" можно писать на python)
Описание решения:
Программа выполняет ранжирование признаков для регрессионной модели:
- Линейная регрессия (LinearRegression)
- Сокращение признаков Случайными деревьями (Random Forest Regressor)
- Линейная корреляция (f_regression)
*14 признаков *750 наблюдений
Результат:
- Лучше всего показал себя метод линейной корреляции (x4, x14, x2, x12). Хотя признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры x12 и x14.
- Самые важные признаки по среднему значению: x1, x4, x2, x11