IIS_2023_1/zhukova_alina_lab_3/readme.md

41 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## Задание
Решите с помощью библиотечной реализации дерева решений
задачу классификации на 99% данных.
Проверить работу модели на оставшемся проценте, сделать вывод
Вариант №10
## Используемые технологии
В лабораторной были использованы библиотеки:
+ pandas - позволяет работать с наборами данных
+ sklearn - используется для работы с моделями и методами машинного обучения
+ Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
## Используемые компоненты
+ DecisionTreeClassifier - библиотечная реализация дерева решений
## Как запустить
Запустить файл flask-server, который поднимет локальный сервер
и позволит обратиться к программе через браузер по ссылке [http://127.0.0.1:5000/](http://127.0.0.1:5000/)
## Что делает программа
Берет 5000 записей из датасета (датасет Chess Game Dataset
[https://www.kaggle.com/datasets/datasnaek/chess](https://www.kaggle.com/datasets/datasnaek/chess)),
обучает модель DecisionTreeClassifier на 99% данных.
После этого модель проверяется на тестовой выборке данных.
Программа выводит важности признаков в виде таблицы, а также итоговую точность модели
## Скриншоты работы программы
Полученные оценки значимости признаков и точность модели
![img.png](img_screen_1.png)
Был проведен анализ, и на изначально выбранных признаках максимальная точность
модели составила 0.56, что означает, что выбранные признаки слабо коррелируют
с исходом игры
В связи с этим к модели были добавлены ники игроков (id) и убраны
некоторые другие признаки, для того чтобы повысить качество работы модели
Итоговые оценки значимости и точность модели
![img.png](img_screen_2.png)