31 lines
1.7 KiB
Markdown
31 lines
1.7 KiB
Markdown
|
### Задание:
|
||
|
|
||
|
Лассо (Lasso), Сокращение признаков Случайными деревьями (Random Forest Regressor), Линейная корреляция (f_regression)
|
||
|
|
||
|
### Технологии:
|
||
|
|
||
|
Библиотека numpy, sklearn
|
||
|
|
||
|
### Что делает лабораторная работа:
|
||
|
|
||
|
Лабораторная работа примененяет регрессионне модели для определения важности признаков.
|
||
|
Программа ранжирует признаки по их значимости для задачи, сортирует средние ранги признаков в порядке убывания. Чем больше значение ранга, тем более значим признак.
|
||
|
|
||
|
### Как запустить:
|
||
|
|
||
|
Лабораторная работа запускается в файле shestakova_maria_lab_2.py через Run: результат выводится в консоль
|
||
|
|
||
|
### Примеры выходных значений
|
||
|
|
||
|
![result](result.png)
|
||
|
|
||
|
Вывод:
|
||
|
4 наиболее значимых признака - 'x4', 'x14', 'x2', 'x12'
|
||
|
|
||
|
Более подробный разбор:
|
||
|
|
||
|
1. Признаки 'x4', 'x14' имеют наивысшие ранги, они наиболее значимы в решении задачи
|
||
|
2. Признаки 'x2', 'x12', 'x11', 'x1' имеют средние ранги, они средне значимы
|
||
|
3. Признаки 'x5', 'x7' и 'x8' имеют низкие ранги, они относительно значимы
|
||
|
4. Признаки 'x9', 'x3', 'x10', 'x13' и 'x6' имеют крайне низкие ранги, они практически не значимы
|