1.7 KiB
1.7 KiB
Задание:
Лассо (Lasso), Сокращение признаков Случайными деревьями (Random Forest Regressor), Линейная корреляция (f_regression)
Технологии:
Библиотека numpy, sklearn
Что делает лабораторная работа:
Лабораторная работа примененяет регрессионне модели для определения важности признаков. Программа ранжирует признаки по их значимости для задачи, сортирует средние ранги признаков в порядке убывания. Чем больше значение ранга, тем более значим признак.
Как запустить:
Лабораторная работа запускается в файле shestakova_maria_lab_2.py через Run: результат выводится в консоль
Примеры выходных значений
Вывод: 4 наиболее значимых признака - 'x4', 'x14', 'x2', 'x12'
Более подробный разбор:
- Признаки 'x4', 'x14' имеют наивысшие ранги, они наиболее значимы в решении задачи
- Признаки 'x2', 'x12', 'x11', 'x1' имеют средние ранги, они средне значимы
- Признаки 'x5', 'x7' и 'x8' имеют низкие ранги, они относительно значимы
- Признаки 'x9', 'x3', 'x10', 'x13' и 'x6' имеют крайне низкие ранги, они практически не значимы