IIS_2023_1/almukhammetov_bulat_lab_2/README.md

41 lines
3.1 KiB
Markdown
Raw Normal View History

2023-10-08 18:37:01 +04:00
Вариант 2
Задание:
Используя код из [1](пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).
Данные:
Линейная регрессия (LinearRegression)
Рекурсивное сокращение признаков (Recursive Feature Elimination RFE)
Сокращение признаков Случайными деревьями (Random Forest Regressor)
Запуск:
Запустите файл lab2.py
Описание программы:
1. Генерирует случайные данные для задачи регрессии с помощью функции make_regression, создавая матрицу признаков X и вектор целевой переменной y.
2. Создает DataFrame data, в котором столбцы представляют признаки, а последний столбец - целевую переменную.
3. Разделяет данные на матрицу признаков X и вектор целевой переменной y.
4. Создает список моделей для ранжирования признаков: линейной регрессии, рекурсивного сокращения признаков и сокращения признаков случайными деревьями.
5. Создает словарь model_scores для хранения оценок каждой модели.
6. Обучает и оценивает каждую модель на данных:
7. Вычисляет ранги признаков и нормализует их в диапазоне от 0 до 1.
8. Выводит оценки признаков каждой модели и их средние оценки.
9. Находит четыре наиболее важных признака по средней оценке и выводит их индексы и значения.
Результаты:
![Alt text](image.png)
![Alt text](image-1.png)
![Alt text](image-2.png)
![Alt text](image-3.png)
![Alt text](image-4.png)
Выводы:
Четыре наиболее важных признака, определенных на основе средних оценок, включают Признак 6, Признак 1, Признак 2 и Признак 5. Эти признаки имеют наибольшую среднюю важность среди всех признаков.