IIS_2023_1/zhukova_alina_lab_3/readme.md

41 lines
2.7 KiB
Markdown
Raw Normal View History

2023-11-15 17:00:31 +04:00
## Задание
Решите с помощью библиотечной реализации дерева решений
задачу классификации на 99% данных.
Проверить работу модели на оставшемся проценте, сделать вывод
Вариант №10
## Используемые технологии
В лабораторной были использованы библиотеки:
+ pandas - позволяет работать с наборами данных
+ sklearn - используется для работы с моделями и методами машинного обучения
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
## Используемые компоненты
+ DecisionTreeClassifier - библиотечная реализация дерева решений
## Как запустить
Запустить файл flask-server, который поднимет локальный сервер
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
## Что делает программа
Берет 5000 записей из датасета (датасет Chess Game Dataset
[https://www.kaggle.com/datasets/datasnaek/chess](https://www.kaggle.com/datasets/datasnaek/chess)),
обучает модель DecisionTreeClassifier на 99% данных.
После этого модель проверяется на тестовой выборке данных.
Программа выводит важности признаков в виде таблицы, а также итоговую точность модели
## Скриншоты работы программы
Полученные оценки значимости признаков и точность модели
![img.png](img_screen_1.png)
Был проведен анализ, и на изначально выбранных признаках максимальная точность
модели составила 0.56, что означает, что выбранные признаки слабо коррелируют
с исходом игры
В связи с этим к модели были добавлены ники игроков (id) и убраны
некоторые другие признаки, для того чтобы повысить качество работы модели
Итоговые оценки значимости и точность модели
![img.png](img_screen_2.png)