2.9 KiB
Задание
Выполнить ранжирование признаков с помощью указанных по варианту моделей. Отобразить получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Провести анализ получившихся результатов. Указать самые значимые четыре признака по среднему значению
Вариант №10
Методы:
- Линейная регрессия
- Лассо
- Рекурсивное сокращение признаков
Используемые технологии
В лабораторной были использованы библиотеки:
- numpy - позволяет работать с массивами и матрицами
- pandas - позволяет работать с наборами данных
- sklearn - используется для работы с моделями и методами машинного обучения
- Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
Используемые компоненты
- LinearRegression - библиотечная реализация модели линейной регрессии
- Lasso - модификация линейной регрессии
- RFE - модель рекурсивноего исключения признаков
Как запустить
Запустить файл flask-server, который поднимет локальный сервер и позволит обратиться к программе через браузер по ссылке http://127.0.0.1:5000/
Что делает программа
Генерирует набор данных с 14 признаками размером 750, делит его на обучающую и тестовую выборки. По очереди обучает на данных обучающей выборки 3 модели: модель линейной регрессии, модель лассо и модель рекурсивного сокращения признаков.
После обучения из каждой модели берутся оценки значимостей признаков. Исходя из полученных оценок высчитываются средние оценки для признаков, полученные данные отражаеются в виде таблицы. Указываются самые значимые 4 признака