41 lines
2.7 KiB
Markdown
41 lines
2.7 KiB
Markdown
|
## Задание
|
|||
|
Решите с помощью библиотечной реализации дерева решений
|
|||
|
задачу классификации на 99% данных.
|
|||
|
Проверить работу модели на оставшемся проценте, сделать вывод
|
|||
|
|
|||
|
Вариант №10
|
|||
|
|
|||
|
## Используемые технологии
|
|||
|
В лабораторной были использованы библиотеки:
|
|||
|
+ pandas - позволяет работать с наборами данных
|
|||
|
+ sklearn - используется для работы с моделями и методами машинного обучения
|
|||
|
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
|
|||
|
|
|||
|
## Используемые компоненты
|
|||
|
+ DecisionTreeClassifier - библиотечная реализация дерева решений
|
|||
|
|
|||
|
## Как запустить
|
|||
|
Запустить файл flask-server, который поднимет локальный сервер
|
|||
|
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
|
|||
|
|
|||
|
## Что делает программа
|
|||
|
Берет 5000 записей из датасета (датасет Chess Game Dataset
|
|||
|
[https://www.kaggle.com/datasets/datasnaek/chess](https://www.kaggle.com/datasets/datasnaek/chess)),
|
|||
|
обучает модель DecisionTreeClassifier на 99% данных.
|
|||
|
После этого модель проверяется на тестовой выборке данных.
|
|||
|
Программа выводит важности признаков в виде таблицы, а также итоговую точность модели
|
|||
|
|
|||
|
## Скриншоты работы программы
|
|||
|
|
|||
|
Полученные оценки значимости признаков и точность модели
|
|||
|
![img.png](img_screen_1.png)
|
|||
|
|
|||
|
Был проведен анализ, и на изначально выбранных признаках максимальная точность
|
|||
|
модели составила 0.56, что означает, что выбранные признаки слабо коррелируют
|
|||
|
с исходом игры
|
|||
|
|
|||
|
В связи с этим к модели были добавлены ники игроков (id) и убраны
|
|||
|
некоторые другие признаки, для того чтобы повысить качество работы модели
|
|||
|
|
|||
|
Итоговые оценки значимости и точность модели
|
|||
|
![img.png](img_screen_2.png)
|