.. | ||
3.1.png | ||
3.2.png | ||
README.md | ||
shestakova_maria_lab_3.1.py | ||
shestakova_maria_lab_3.2.py | ||
sleep.csv | ||
titanic.csv |
Задание:
Часть 1. По данным о пассажирах Титаника решите задачу классификации (с помощью дерева решений), в которой по различным характеристикам пассажиров требуется найти у выживших пассажиров два наиболее важных признака из трех рассматриваемых: Pclass, Parch, Fare
Часть 2. Решите с помощью библиотечной реализации дерева решений задачу из лабораторной работы «Веб-сервис «Дерево решений» по предмету «Методы искусственного интеллекта»на 99% ваших данных: зависимость качества сна (Quality of Sleep) от возраста (Age) и пола (Gender). Проверьте работу модели на оставшемся проценте, сделайте вывод
Технологии:
Библиотека Scikit-learn, библиотека numpy, библиотека pandas
Что делает лабораторная:
Часть 1. Из выборки отбирается 3 необходимых по заданию признака, определяется целевая переменная по заданию, обучается дерево, выводятся важности признаков по каждому классу
Часть 2. Из выборки отбирается 2 необходимых по заданию признака, определяется целевая переменная по заданию, данные разделяются на обущающую и тестовую выборку, дерево обучается классификацией и регрессией, выводятся важности признаков, предсказания значений на тестовой выборке и оценка качества
Как запустить:
Первая часть лабораторной работы запускается в файле shestakova_maria_lab_3.1.py
через Run: появляется вывод в консоли
Вторая часть лабораторной работы запускается в файле shestakova_maria_lab_3.2.py
через Run: появляется вывод в консоли
Вывод:
Часть 1.
Часть 2.
По выводу можно заметить, что модель дерева классификации подходит больше для решения данной задачи