59 lines
3.0 KiB
Markdown
59 lines
3.0 KiB
Markdown
|
# Лабораторная работа №2
|
|||
|
|
|||
|
## ПИбд-41, Курмыза Павел, Вариант 13
|
|||
|
|
|||
|
## Как запустить ЛР
|
|||
|
|
|||
|
- Запустить файл main.py
|
|||
|
|
|||
|
## Используемые технологии
|
|||
|
|
|||
|
- Язык программирования Python
|
|||
|
- Библиотеки: sklearn, numpy
|
|||
|
|
|||
|
## Что делает программа
|
|||
|
|
|||
|
Выполняет ранжирование 14 признаков для регрессионной проблемы Фридмана с помощью моделей:
|
|||
|
|
|||
|
- Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)
|
|||
|
- Сокращение признаков Случайными деревьями (Random Forest Regressor)
|
|||
|
- Линейная корреляция (f_regression)
|
|||
|
|
|||
|
Отображение получившихся результатов: 4 самых важных признака по среднему значению, значения признаков для каждой
|
|||
|
модели.
|
|||
|
|
|||
|
## Результаты
|
|||
|
|
|||
|
### RFE
|
|||
|
|
|||
|
{'x1': 1.0, 'x2': 1.0, 'x3': 1.0, 'x4': 1.0, 'x5': 1.0, 'x11': 1.0, 'x13': 1.0, 'x12': 0.86, 'x14': 0.71, 'x8': 0.57, '
|
|||
|
x6': 0.43, 'x10': 0.29, 'x7': 0.14, 'x9': 0.0}
|
|||
|
|
|||
|
### RFR
|
|||
|
|
|||
|
{'x14': 1.0, 'x2': 0.84, 'x4': 0.77, 'x1': 0.74, 'x11': 0.36, 'x12': 0.35, 'x5': 0.28, 'x3': 0.12, 'x13': 0.12, 'x6':
|
|||
|
0.01, 'x7': 0.01, 'x8': 0.01, 'x9': 0.01, 'x10': 0.0}
|
|||
|
|
|||
|
### f_regression
|
|||
|
|
|||
|
{'x4': 1.0, 'x14': 0.97, 'x2': 0.57, 'x12': 0.56, 'x1': 0.44, 'x11': 0.43, 'x5': 0.17, 'x8': 0.13, 'x7': 0.1, 'x9':
|
|||
|
0.08, 'x10': 0.05, 'x6': 0.04, 'x3': 0.01, 'x13': 0.0}
|
|||
|
|
|||
|
### Средние значения
|
|||
|
|
|||
|
{'x1': 0.33, 'x2': 0.33, 'x3': 0.33, 'x4': 0.33, 'x5': 0.33, 'x11': 0.33, 'x13': 0.33, 'x12': 0.29, 'x14': 0.24, 'x8':
|
|||
|
0.19, 'x6': 0.14, 'x10': 0.1, 'x7': 0.05, 'x9': 0.0}
|
|||
|
|
|||
|
## Вывод
|
|||
|
|
|||
|
По итогу тестирования было выявлено:
|
|||
|
|
|||
|
1. Модель рекурсивного сокращения признаков отдала предпочтение многим важным параметрам таким как x1, x2, x3, x4, x5,
|
|||
|
x11, x13, x12, x14.
|
|||
|
2. Модель сокращения признаков случайными деревьями выявила в качестве важных признаков x14, x2, x4, x1. Несмотря на то,
|
|||
|
что признак x3 не был выявлен, его влияние может быть учтено через скоррелированный параметр x14.
|
|||
|
3. Метод линейной корреляции (f_regression) сделал наилучшее взвешивание, отдав предпочтение прзинакам x4, x14, x2, x12.
|
|||
|
Несмотря на то, что признаки x1 и x3 не были выявлены, их влияние может быть учтено через скоррелированные параметры
|
|||
|
x12 и x14.
|
|||
|
|
|||
|
Согласно среднему значению, важными признаками являются: x1, x2, x3, x4, x5.
|