2.6 KiB
Общее задание:Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).
13 вариант: Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE), Сокращение признаков Случайными деревьями (Random Forest Regressor), Линейная корреляция (f_regression)
Чтобы Запустить приложение нужно запустить файл app.py
Технологии:
Flask: Фреймворк для создания веб-приложений на языке Python. scikit-learn: Библиотека для машинного обучения в Python. NumPy: Библиотека для работы с массивами и матрицами в Python. pandas: Библиотека для обработки и анализа данных в Python. Описание работы программы: Программа создает веб-приложение для ранжирования признаков в сгенерированных данных. Используются три метода: линейная регрессия, рекурсивное сокращение признаков (RFE), и случайные деревья. Данные генерируются, модели обучаются, и затем вычисляются оценки важности признаков. Результаты отображаются на веб-странице.
Входные данные:
Сгенерированные данные X (матрица признаков) и Y (вектор целевых значений). Выходные данные:
Результаты ранжирования признаков для линейной регрессии, RFE, случайных деревьев и среднее значение. Самые важные признаки.