IIS_2023_1/zhukova_alina_lab_3/readme.md

2.7 KiB
Raw Blame History

Задание

Решите с помощью библиотечной реализации дерева решений задачу классификации на 99% данных. Проверить работу модели на оставшемся проценте, сделать вывод

Вариант №10

Используемые технологии

В лабораторной были использованы библиотеки:

  • pandas - позволяет работать с наборами данных
  • sklearn - используется для работы с моделями и методами машинного обучения
  • Flask - предоставляет способ быстрого создания веб-страниц для визуализации работы приложения

Используемые компоненты

  • DecisionTreeClassifier - библиотечная реализация дерева решений

Как запустить

Запустить файл flask-server, который поднимет локальный сервер и позволит обратиться к программе через браузер по ссылке http://127.0.0.1:5000/

Что делает программа

Берет 5000 записей из датасета (датасет Chess Game Dataset https://www.kaggle.com/datasets/datasnaek/chess), обучает модель DecisionTreeClassifier на 99% данных. После этого модель проверяется на тестовой выборке данных. Программа выводит важности признаков в виде таблицы, а также итоговую точность модели

Скриншоты работы программы

Полученные оценки значимости признаков и точность модели img.png

Был проведен анализ, и на изначально выбранных признаках максимальная точность модели составила 0.56, что означает, что выбранные признаки слабо коррелируют с исходом игры

В связи с этим к модели были добавлены ники игроков (id) и убраны некоторые другие признаки, для того чтобы повысить качество работы модели

Итоговые оценки значимости и точность модели img.png