42 lines
3.8 KiB
Markdown
42 lines
3.8 KiB
Markdown
|
## Лабораторная работа 2. Вариант 5.
|
|||
|
### Задание
|
|||
|
Выполнить ранжирование признаков. Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Провести анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению?
|
|||
|
|
|||
|
Модели:
|
|||
|
|
|||
|
- Гребневая регрессия `Ridge`,
|
|||
|
- Рекурсивное сокращение признаков `Recursive Feature Elimination – RFE`,
|
|||
|
- Сокращение признаков Случайными деревьями `Random Forest Regressor`
|
|||
|
|
|||
|
### Как запустить
|
|||
|
Для запуска программы необходимо с помощью командной строки в корневой директории файлов прокета прописать:
|
|||
|
```
|
|||
|
python main.py
|
|||
|
```
|
|||
|
|
|||
|
### Используемые технологии
|
|||
|
- `numpy` (псевдоним `np`): NumPy - это библиотека для научных вычислений в Python.
|
|||
|
- `sklearn` (scikit-learn): Scikit-learn - это библиотека для машинного обучения и анализа данных в Python. Из данной библиотеки были использованы следующие модули:
|
|||
|
- `LinearRegression` - линейная регрессия - это алгоритм машинного обучения, используемый для задач бинарной классификации.
|
|||
|
- `Ridge` - инструмент работы с моделью "Гребневая регрессия"
|
|||
|
- `RFE` - инструмент оценки важности признаков "Рекурсивное сокращение признаков"
|
|||
|
- `RandomForestRegressor` - инструмент работы с моделью "Регрессор случайного леса"
|
|||
|
|
|||
|
### Описание работы
|
|||
|
1. Программа генерирует данные для обучения моделей, содержащие матрицу признаков X и вектор целевой переменной y.
|
|||
|
1. Создает DataFrame data, в котором столбцы представляют признаки, а последний столбец - целевую переменную.
|
|||
|
1. Разделяет данные на матрицу признаков X и вектор целевой переменной y
|
|||
|
1. Создает список обученных моделей для ранжирования признаков: гребневой регрессии, рекурсивного сокращения признаков и сокращения признаков случайными деревьями.
|
|||
|
1. Создает словарь model_scores для хранения оценок каждой модели.
|
|||
|
1. Выводит оценки признаков каждой модели и их средние оценки.
|
|||
|
1. Находит четыре наиболее важных признака по средней оценке и выводит их индексы и значения.
|
|||
|
|
|||
|
### Результат работы
|
|||
|

|
|||
|

|
|||
|

|
|||
|

|
|||
|
|
|||
|
### Вывод
|
|||
|
Четыре наиболее важных признака, определенных на основе средних оценок, включают
|
|||
|
Признак 1, Признак 3, Признак 12 и Признак 6.
|