41 lines
2.7 KiB
Markdown
41 lines
2.7 KiB
Markdown
## Задание
|
||
Решите с помощью библиотечной реализации дерева решений
|
||
задачу классификации на 99% данных.
|
||
Проверить работу модели на оставшемся проценте, сделать вывод
|
||
|
||
Вариант №10
|
||
|
||
## Используемые технологии
|
||
В лабораторной были использованы библиотеки:
|
||
+ pandas - позволяет работать с наборами данных
|
||
+ sklearn - используется для работы с моделями и методами машинного обучения
|
||
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
|
||
|
||
## Используемые компоненты
|
||
+ DecisionTreeClassifier - библиотечная реализация дерева решений
|
||
|
||
## Как запустить
|
||
Запустить файл flask-server, который поднимет локальный сервер
|
||
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
|
||
|
||
## Что делает программа
|
||
Берет 5000 записей из датасета (датасет Chess Game Dataset
|
||
[https://www.kaggle.com/datasets/datasnaek/chess](https://www.kaggle.com/datasets/datasnaek/chess)),
|
||
обучает модель DecisionTreeClassifier на 99% данных.
|
||
После этого модель проверяется на тестовой выборке данных.
|
||
Программа выводит важности признаков в виде таблицы, а также итоговую точность модели
|
||
|
||
## Скриншоты работы программы
|
||
|
||
Полученные оценки значимости признаков и точность модели
|
||
![img.png](img_screen_1.png)
|
||
|
||
Был проведен анализ, и на изначально выбранных признаках максимальная точность
|
||
модели составила 0.56, что означает, что выбранные признаки слабо коррелируют
|
||
с исходом игры
|
||
|
||
В связи с этим к модели были добавлены ники игроков (id) и убраны
|
||
некоторые другие признаки, для того чтобы повысить качество работы модели
|
||
|
||
Итоговые оценки значимости и точность модели
|
||
![img.png](img_screen_2.png) |