IIS_2023_1/orlov_artem_lab_2/readme.md

30 lines
3.0 KiB
Markdown
Raw Normal View History

Общее задание:
Используя код из [1] (пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по
варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ
получившихся результатов. Какие четыре признака оказались самыми 45 важными по среднему значению? (Названия\индексы признаков и будут
ответом на задание).
Вариант 19:
Линейная регрессия (LinearRegression), Гребневая регрессия (Ridge), Лассо (Lasso), Случайное Лассо (RandomizedLasso)
Запуск приложения: запуск файла app.py
Использованные технологии:
Flask: Веб-фреймворк для Python, используемый для создания веб-приложения.
scikit-learn (sklearn): Библиотека машинного обучения для Python. В коде используются модели линейной регрессии (LinearRegression), гребневой регрессии (Ridge), лассо (Lasso), а также Случайное Лассо (RandomizedLasso).
NumPy: Библиотека для работы с многомерными массивами и математическими функциями в Python.
Pandas: Библиотека для обработки и анализа данных в Python.
MinMaxScaler: Инструмент из scikit-learn для масштабирования данных в интервал [0, 1].
Краткое описание работы программы:
Генерируются случайные данные X и Y.
Создаются и обучаются модели линейной регрессии, гребневой регрессии и случайного Лассо.
Реализованы функции для ранжирования признаков с использованием различных моделей.
Веб-приложение на Flask отображает результаты ранжирования признаков, средние оценки и важные признаки.
Пример входных данных:
Генерированные случайные данные X (матрица признаков) и Y (вектор целевой переменной).
Пример выходных данных:
Веб-страница с результатами ранжирования признаков, средними оценками и списком самых важных признаков.