IIS_2023_1

Alexey/IIS_2023_1

Fork 1

History

Gordeeva 5eb35fe26d itog

2023-10-14 14:26:32 +04:00

lab2.py

itog

2023-10-14 14:26:32 +04:00

Lasso_screen.png

itog

2023-10-14 14:26:32 +04:00

RandLasso_screen.png

itog

2023-10-14 14:26:32 +04:00

readme.md

itog

2023-10-14 14:26:32 +04:00

RFE_screen.png

itog

2023-10-14 14:26:32 +04:00

readme.md

Задание

Модели:

Лассо (Lasso)
Случайное лассо (RandomizedLasso)
Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)

В чем различие каждой модели

Лассо (Lasso) автоматически отбирает наиболее важные признаки и уменьшает влияние менее важных.

Случайное лассо (RandomizedLasso) случайным образом выбирает подмножества признаков из исходных данных и применяет Лассо к каждому из них. Затем он объединяет результаты и определяет, какие признаки были выбраны чаще всего.

Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE) оценивает важность каждого признака. Затем он удаляет наименее важный признак и повторяет процесс, пока не останется желаемое количество признаков.

Библиотеки

Streamlit. Предоставляет простой способ создания веб-приложений для визуализации данных.

Numpy. Предоставляет возможность работать с массивами и матрицами.

Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.

Функционал

Генерация исходных данных из 750 строк-наблюдений и 14 столбцов-признаков
Создание и обучение таких моделей, как лассо, случайное лассо и рекурсивное сокращение признаков.
Вывод получившихся оценок для признаков и средней оценки.

Запуск

Перед запуском необходимо запустить виртуальную среду venv. Так как я использую streamlit, то для запуска необходимо в терминал прописать следующую строку:

streamlit run lab1.py

Приложение развернется на локальном сервере и автоматически откроется в браузере.

Скриншоты работы программы

Лассо (Lasso)

Случайное лассо (RandomizedLasso)

Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)

Вывод

Модель лассо выводит все 14 признаков, наиболее важными признаками оказались под индексом 1, 2, 4 и 5. Самый важный признак под номером 4. Средняя оценка по всем признакам 0.19.

Модель случайное лассо выводит наиболее важные признаки, такими признаками являются 1, 2, 4 и 5. Средняя оценка же по этим признакам равна 0.53. Она выше, так как мы исключаем маловажные признаки.

Модель рекурсивного сокращения признаков выводит 4 признака, так как я указала именно вывод 4 признаков в коде программы. Таким образом, модель отсекает маловажные признаки. Самым важным признаком оказался под номером 4. Средняя оценка: 0.25.

Как итог, можно сказать, что наиболее важными признаками являются 1, 2, 4 и 5. А самым важным из них является признак под номером 4.

readme.md Unescape Escape

Задание

В чем различие каждой модели

Библиотеки

Функционал

Запуск

Скриншоты работы программы

Вывод

readme.md