#### Кондрашин Михаил ПИбд-41 ## Лабораторная работа 2. Ранжирование признаков ### Задание: * Линейная регрессия (LinearRegression) * Сокращение признаков случайными деревьями (Random Forest Regressor) * Линейная корреляция (f_regression) ### Запуск лабораторной работы: * установить `python`, `numpy`, `matplotlib`, `sklearn` * запустить проект (стартовая точка класс `main.py`) ### Используемые технологии: * Язык программирования `Python`, * Библиотеки `numpy`, `matplotlib`, `sklearn` * Среда разработки `IntelliJ IDEA` (В версии "Ultimate edition" можно писать на python) ### Описание решения: Программа выполняет ранжирование признаков для регрессионной модели: * Линейная регрессия (LinearRegression) * Сокращение признаков Случайными деревьями (Random Forest Regressor) * Линейная корреляция (f_regression) *14 признаков *750 наблюдений ### Результат: ![Result](images/result.png) * Лучше всего показал себя метод линейной корреляции (x4, x14, x2, x12). Хотя признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры x12 и x14. * Самые важные признаки по среднему значению: x1, x4, x2, x11