2.7 KiB
Задание
Решите с помощью библиотечной реализации дерева решений задачу классификации на 99% данных. Проверить работу модели на оставшемся проценте, сделать вывод
Вариант №10
Используемые технологии
В лабораторной были использованы библиотеки:
- pandas - позволяет работать с наборами данных
- sklearn - используется для работы с моделями и методами машинного обучения
- Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения
Используемые компоненты
- DecisionTreeClassifier - библиотечная реализация дерева решений
Как запустить
Запустить файл flask-server, который поднимет локальный сервер и позволит обратиться к программе через браузер по ссылке http://127.0.0.1:5000/
Что делает программа
Берет 5000 записей из датасета (датасет Chess Game Dataset https://www.kaggle.com/datasets/datasnaek/chess), обучает модель DecisionTreeClassifier на 99% данных. После этого модель проверяется на тестовой выборке данных. Программа выводит важности признаков в виде таблицы, а также итоговую точность модели
Скриншоты работы программы
Полученные оценки значимости признаков и точность модели
Был проведен анализ, и на изначально выбранных признаках максимальная точность модели составила 0.56, что означает, что выбранные признаки слабо коррелируют с исходом игры
В связи с этим к модели были добавлены ники игроков (id) и убраны некоторые другие признаки, для того чтобы повысить качество работы модели