IIS_2023_1/zhukova_alina_lab_2/readme.md

43 lines
2.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## Задание
Выполнить ранжирование признаков с помощью указанных по варианту моделей.
Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
Провести анализ получившихся результатов.
Указать самые значимые четыре признака по среднему значению
Вариант №10
Методы:
+ Линейная регрессия
+ Лассо
+ Рекурсивное сокращение признаков
## Используемые технологии
В лабораторной были использованы библиотеки:
+ numpy - позволяет работать с массивами и матрицами
+ pandas - позволяет работать с наборами данных
+ sklearn - используется для работы с моделями и методами машинного обучения
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
## Используемые компоненты
+ LinearRegression - библиотечная реализация модели линейной регрессии
+ Lasso - модификация линейной регрессии
+ RFE - модель рекурсивноего исключения признаков
## Как запустить
Запустить файл flask-server, который поднимет локальный сервер
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
## Что делает программа
Генерирует набор данных с 14 признаками размером 750, делит его на обучающую и тестовую выборки.
По очереди обучает на данных обучающей выборки 3 модели:
модель линейной регрессии, модель лассо и модель рекурсивного сокращения признаков.
После обучения из каждой модели берутся оценки значимостей признаков.
Исходя из полученных оценок высчитываются средние оценки для признаков,
полученные данные отражаеются в виде таблицы. Указываются самые значимые 4 признака
## Скриншоты работы программы
Полученные оценки значимости признаков
![img.png](img_screen_1.png)