IIS_2023_1/zhukova_alina_lab_2/readme.md

2.9 KiB
Raw Blame History

Задание

Выполнить ранжирование признаков с помощью указанных по варианту моделей. Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Провести анализ получившихся результатов. Указать самые значимые четыре признака по среднему значению

Вариант №10

Методы:

  • Линейная регрессия
  • Лассо
  • Рекурсивное сокращение признаков

Используемые технологии

В лабораторной были использованы библиотеки:

  • numpy - позволяет работать с массивами и матрицами
  • pandas - позволяет работать с наборами данных
  • sklearn - используется для работы с моделями и методами машинного обучения
  • Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения

Используемые компоненты

  • LinearRegression - библиотечная реализация модели линейной регрессии
  • Lasso - модификация линейной регрессии
  • RFE - модель рекурсивноего исключения признаков

Как запустить

Запустить файл flask-server, который поднимет локальный сервер и позволит обратиться к программе через браузер по ссылке http://127.0.0.1:5000/

Что делает программа

Генерирует набор данных с 14 признаками размером 750, делит его на обучающую и тестовую выборки. По очереди обучает на данных обучающей выборки 3 модели: модель линейной регрессии, модель лассо и модель рекурсивного сокращения признаков.

После обучения из каждой модели берутся оценки значимостей признаков. Исходя из полученных оценок высчитываются средние оценки для признаков, полученные данные отражаеются в виде таблицы. Указываются самые значимые 4 признака

Скриншоты работы программы

Полученные оценки значимости признаков img.png