IIS_2023_1/zhukova_alina_lab_2/readme.md

43 lines
2.9 KiB
Markdown
Raw Normal View History

2023-11-15 16:54:40 +04:00
## Задание
Выполнить ранжирование признаков с помощью указанных по варианту моделей.
Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку.
Провести анализ получившихся результатов.
Указать самые значимые четыре признака по среднему значению
Вариант №10
Методы:
+ Линейная регрессия
+ Лассо
+ Рекурсивное сокращение признаков
## Используемые технологии
В лабораторной были использованы библиотеки:
+ numpy - позволяет работать с массивами и матрицами
+ pandas - позволяет работать с наборами данных
+ sklearn - используется для работы с моделями и методами машинного обучения
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
## Используемые компоненты
+ LinearRegression - библиотечная реализация модели линейной регрессии
+ Lasso - модификация линейной регрессии
+ RFE - модель рекурсивноего исключения признаков
## Как запустить
Запустить файл flask-server, который поднимет локальный сервер
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
## Что делает программа
Генерирует набор данных с 14 признаками размером 750, делит его на обучающую и тестовую выборки.
По очереди обучает на данных обучающей выборки 3 модели:
модель линейной регрессии, модель лассо и модель рекурсивного сокращения признаков.
После обучения из каждой модели берутся оценки значимостей признаков.
Исходя из полученных оценок высчитываются средние оценки для признаков,
полученные данные отражаеются в виде таблицы. Указываются самые значимые 4 признака
## Скриншоты работы программы
Полученные оценки значимости признаков
![img.png](img_screen_1.png)