47 lines
3.6 KiB
Markdown
47 lines
3.6 KiB
Markdown
# Лабораторная работа 2. Ранжирование признаков
|
||
## Задание
|
||
Выполнить ранжирование признаков с помощью указанных по варианту моделей.
|
||
Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
|
||
Провести анализ получившихся результатов. Определить, какие четыре признака оказались самыми важными по среднему значению.
|
||
|
||
Вариант 4 (24).
|
||
Модели:
|
||
* Гребневая регрессия (Ridge)
|
||
* Случайное Лассо (RandomizedLasso)
|
||
* Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)
|
||
|
||
### Запуск программы
|
||
Файл lab2.py содержит и запускает программу
|
||
|
||
### Описание программы
|
||
Программа создаёт набор данных с 10 (n_features) признаками для последующего их ранжирования и обрабатывает тремя моделями по варианту.
|
||
Программа строит столбчатые диаграммы, которые показывают как распределились оценки важности признаков и выводит в консоль отсортированные по убыванию важности признаки.
|
||
Таким образом можно легко определить наиважнейшие признаки.
|
||
|
||
### Результаты тестирования
|
||
По результатам тестирования, можно сказать следующее:
|
||
* Гребневая регрессия показывает хорошие результаты, выделяет все 8 значимых признаков.
|
||
* Случайное лассо справляется хуже других моделей, выделяет только 4 значимых признака.
|
||
* Рекурсивное сокращение признаков показывает хорошие результаты, правильно выделяя 9 значимых признаков.
|
||
* Среднее значение позволяет c хорошей уверенностью определять истинные значимые признаки. (x4, x2, x1, x5)
|
||
|
||
Вывод:
|
||
Если вы хотите уменьшить размерность данных и выбрать определенное количество признаков, рассмотрите модель RFE.
|
||
Если вам важно сохранить все признаки, но учитывать их важность, модель Ridge может быть подходящей.
|
||
Если вам нужно сильно ужать данные и выбрать только наиболее важные признаки, рассмотрите модель Lasso.
|
||
|
||
Пример консольных результатов:
|
||
|
||
Ridge Lasso RFE Mean
|
||
x4 1.00 1.00 1.00 0.33
|
||
x2 0.73 0.68 1.00 0.24
|
||
x1 0.65 0.66 1.00 0.22
|
||
x5 0.40 0.26 0.50 0.13
|
||
x10 0.32 0.00 0.83 0.11
|
||
x7 0.24 0.00 0.67 0.08
|
||
x8 0.19 0.00 1.00 0.06
|
||
x9 0.03 0.00 0.33 0.01
|
||
x3 0.00 0.00 0.17 0.00
|
||
x6 0.00 0.00 0.00 0.00
|
||
|
||
По данным результатам можно заключить, что наиболее влиятельные признаки по убыванию: x4, x2, x1, x5. |