IIS_2023_1/almukhammetov_bulat_lab_2/README.md
2023-10-08 18:37:01 +04:00

41 lines
3.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

Вариант 2
Задание:
Используя код из [1](пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).
Данные:
Линейная регрессия (LinearRegression)
Рекурсивное сокращение признаков (Recursive Feature Elimination RFE)
Сокращение признаков Случайными деревьями (Random Forest Regressor)
Запуск:
Запустите файл lab2.py
Описание программы:
1. Генерирует случайные данные для задачи регрессии с помощью функции make_regression, создавая матрицу признаков X и вектор целевой переменной y.
2. Создает DataFrame data, в котором столбцы представляют признаки, а последний столбец - целевую переменную.
3. Разделяет данные на матрицу признаков X и вектор целевой переменной y.
4. Создает список моделей для ранжирования признаков: линейной регрессии, рекурсивного сокращения признаков и сокращения признаков случайными деревьями.
5. Создает словарь model_scores для хранения оценок каждой модели.
6. Обучает и оценивает каждую модель на данных:
7. Вычисляет ранги признаков и нормализует их в диапазоне от 0 до 1.
8. Выводит оценки признаков каждой модели и их средние оценки.
9. Находит четыре наиболее важных признака по средней оценке и выводит их индексы и значения.
Результаты:
![Alt text](image.png)
![Alt text](image-1.png)
![Alt text](image-2.png)
![Alt text](image-3.png)
![Alt text](image-4.png)
Выводы:
Четыре наиболее важных признака, определенных на основе средних оценок, включают Признак 6, Признак 1, Признак 2 и Признак 5. Эти признаки имеют наибольшую среднюю важность среди всех признаков.