56 lines
4.2 KiB
Markdown
56 lines
4.2 KiB
Markdown
|
## Задание
|
|||
|
Модели:
|
|||
|
* Лассо (Lasso)
|
|||
|
* Случайное лассо (RandomizedLasso)
|
|||
|
* Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)
|
|||
|
|
|||
|
## В чем различие каждой модели
|
|||
|
|
|||
|
Лассо (Lasso) автоматически отбирает наиболее важные признаки и уменьшает влияние менее важных.
|
|||
|
|
|||
|
Случайное лассо (RandomizedLasso) случайным образом выбирает подмножества признаков из исходных данных и применяет Лассо к каждому из них. Затем он объединяет результаты и определяет, какие признаки были выбраны чаще всего.
|
|||
|
|
|||
|
Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE) оценивает важность каждого признака. Затем он удаляет наименее важный признак и повторяет процесс, пока не останется желаемое количество признаков.
|
|||
|
|
|||
|
|
|||
|
## Библиотеки
|
|||
|
Streamlit. Предоставляет простой способ создания веб-приложений для визуализации данных.
|
|||
|
|
|||
|
Numpy. Предоставляет возможность работать с массивами и матрицами.
|
|||
|
|
|||
|
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
|
|||
|
|
|||
|
## Функционал
|
|||
|
* Генерация исходных данных из 750 строк-наблюдений и 14 столбцов-признаков
|
|||
|
* Создание и обучение таких моделей, как лассо, случайное лассо и рекурсивное сокращение признаков.
|
|||
|
* Вывод получившихся оценок для признаков и средней оценки.
|
|||
|
|
|||
|
## Запуск
|
|||
|
Перед запуском необходимо запустить виртуальную среду venv. Так как я использую streamlit, то для запуска необходимо в терминал прописать следующую строку:
|
|||
|
```
|
|||
|
streamlit run lab1.py
|
|||
|
```
|
|||
|
Приложение развернется на локальном сервере и автоматически откроется в браузере.
|
|||
|
|
|||
|
## Скриншоты работы программы
|
|||
|
Лассо (Lasso)
|
|||
|
|
|||
|
![Alt text](Lasso_screen.png "Optional Title")
|
|||
|
|
|||
|
Случайное лассо (RandomizedLasso)
|
|||
|
|
|||
|
![Alt text](RandLasso_screen.png "Optional Title")
|
|||
|
|
|||
|
Рекурсивное сокращение признаков (Recursive Feature Elimination – RFE)
|
|||
|
|
|||
|
![Alt text](RFE_screen.png "Optional Title")
|
|||
|
|
|||
|
## Вывод
|
|||
|
Модель лассо выводит все 14 признаков, наиболее важными признаками оказались под индексом
|
|||
|
1, 2, 4 и 5. Самый важный признак под номером 4. Средняя оценка по всем признакам 0.19.
|
|||
|
|
|||
|
Модель случайное лассо выводит наиболее важные признаки, такими признаками являются 1, 2, 4 и 5. Средняя оценка же по этим признакам равна 0.53. Она выше, так как мы исключаем маловажные признаки.
|
|||
|
|
|||
|
Модель рекурсивного сокращения признаков выводит 4 признака, так как я указала именно вывод 4 признаков в коде программы. Таким образом, модель отсекает маловажные признаки. Самым важным признаком оказался под номером 4. Средняя оценка: 0.25.
|
|||
|
|
|||
|
Как итог, можно сказать, что наиболее важными признаками являются 1, 2, 4 и 5. А самым важным из них является признак под номером 4.
|