IIS_2023_1/gordeeva_anna_lab_2
2023-10-14 14:26:32 +04:00
..
lab2.py itog 2023-10-14 14:26:32 +04:00
Lasso_screen.png itog 2023-10-14 14:26:32 +04:00
RandLasso_screen.png itog 2023-10-14 14:26:32 +04:00
readme.md itog 2023-10-14 14:26:32 +04:00
RFE_screen.png itog 2023-10-14 14:26:32 +04:00

Задание

Модели:

  • Лассо (Lasso)
  • Случайное лассо (RandomizedLasso)
  • Рекурсивное сокращение признаков (Recursive Feature Elimination RFE)

В чем различие каждой модели

Лассо (Lasso) автоматически отбирает наиболее важные признаки и уменьшает влияние менее важных.

Случайное лассо (RandomizedLasso) случайным образом выбирает подмножества признаков из исходных данных и применяет Лассо к каждому из них. Затем он объединяет результаты и определяет, какие признаки были выбраны чаще всего.

Рекурсивное сокращение признаков (Recursive Feature Elimination RFE) оценивает важность каждого признака. Затем он удаляет наименее важный признак и повторяет процесс, пока не останется желаемое количество признаков.

Библиотеки

Streamlit. Предоставляет простой способ создания веб-приложений для визуализации данных.

Numpy. Предоставляет возможность работать с массивами и матрицами.

Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.

Функционал

  • Генерация исходных данных из 750 строк-наблюдений и 14 столбцов-признаков
  • Создание и обучение таких моделей, как лассо, случайное лассо и рекурсивное сокращение признаков.
  • Вывод получившихся оценок для признаков и средней оценки.

Запуск

Перед запуском необходимо запустить виртуальную среду venv. Так как я использую streamlit, то для запуска необходимо в терминал прописать следующую строку:

streamlit run lab1.py

Приложение развернется на локальном сервере и автоматически откроется в браузере.

Скриншоты работы программы

Лассо (Lasso)

Alt text

Случайное лассо (RandomizedLasso)

Alt text

Рекурсивное сокращение признаков (Recursive Feature Elimination RFE)

Alt text

Вывод

Модель лассо выводит все 14 признаков, наиболее важными признаками оказались под индексом 1, 2, 4 и 5. Самый важный признак под номером 4. Средняя оценка по всем признакам 0.19.

Модель случайное лассо выводит наиболее важные признаки, такими признаками являются 1, 2, 4 и 5. Средняя оценка же по этим признакам равна 0.53. Она выше, так как мы исключаем маловажные признаки.

Модель рекурсивного сокращения признаков выводит 4 признака, так как я указала именно вывод 4 признаков в коде программы. Таким образом, модель отсекает маловажные признаки. Самым важным признаком оказался под номером 4. Средняя оценка: 0.25.

Как итог, можно сказать, что наиболее важными признаками являются 1, 2, 4 и 5. А самым важным из них является признак под номером 4.