49 lines
3.6 KiB
Markdown
49 lines
3.6 KiB
Markdown
|
Лабораторная №2
|
|||
|
|
|||
|
Вариант №2
|
|||
|
|
|||
|
Задание на лабораторную:
|
|||
|
|
|||
|
выполните ранжирование признаков с помощью указанных по
|
|||
|
варианту моделей. Отобразите получившиеся значения\оценки каждого
|
|||
|
признака каждым методом\моделью и среднюю оценку. Проведите анализ
|
|||
|
получившихся результатов. Какие четыре признака оказались самыми
|
|||
|
важными по среднему значению? (Названия\индексы признаков и будут
|
|||
|
ответом на задание).
|
|||
|
|
|||
|
Модели:
|
|||
|
|
|||
|
- Линейная регрессия (LinearRegression)
|
|||
|
- Рекурсивное сокращение
|
|||
|
признаков (Recursive Feature Elimination – RFE)
|
|||
|
- Сокращение признаков
|
|||
|
Случайными деревьями (Random Forest Regressor)
|
|||
|
|
|||
|
Как запустить лабораторную работу:
|
|||
|
|
|||
|
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_2.py, после чего в консоли будут выведены все признаки, их ранжирование и топ 4 признака по среднему значению значимости.
|
|||
|
|
|||
|
Библиотеки
|
|||
|
|
|||
|
Numpy. иблиотека для работы с массивами и матрицами чисел. Она используется для создания и манипуляции данными.
|
|||
|
|
|||
|
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
|
|||
|
|
|||
|
Описание программы:
|
|||
|
|
|||
|
- Генерируем набор данных из 100 точек данных используя функцию make_circles
|
|||
|
- С помощью функции train_test_split разделяем данные на тестовые и обучающие в соотношении 20 к 80
|
|||
|
- Добавляем дополнительные признаки, чтобы в сумме было 20 признаков
|
|||
|
- Создаем 3 модели:
|
|||
|
- Линейную регрессию (LinearRegression)
|
|||
|
- Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)
|
|||
|
- Сокращение признаков Случайными деревьями (Random Forest Regressor)
|
|||
|
- Обучаем модели и производим ранжирование
|
|||
|
- Линейная регрессия дает ранжирование признаков на основе абсолютных коэффициентов.
|
|||
|
- RFE (Рекурсивное сокращение признаков) ранжирует признаки на основе их значимости для модели.
|
|||
|
- Random Forest Regressor оценивает важность признаков на основе их вклада в прогнозы модели.
|
|||
|
- Посредством вычисления среднего ранжирования по всем трем методам мы определяем, какие признаки являются самыми важными с учетом всех трех методов.
|
|||
|
|
|||
|
![img.png](img.png)
|
|||
|
|
|||
|
Делаем вывод, что по среднему значению самыми важными признаками являются 3, 17, 19 и 20 признаки
|