11 KiB
Задание
Решите с помощью библиотечной реализации дерева решений задачу из лабораторной работы «Веб-сервис «Дерево решений» по предмету «Методы искусственного интеллекта»на 99% ваших данных. Проверьте работу модели на оставшемся проценте, сделайте вывод
Как запустить лабораторную
Запустить файл main.py
Используемые технологии
Библиотеки pandas, scikit-learn, matplotlib, их компоненты
Описание лабораторной (программы)
В данном коде мы создаем и обучаем модель дерева решений для прогнозирования инцидентов с НЛО на основе набора данных.
- В первой строке кода мы загружаем данные из CSV-файла 'ufo_data_nuforc.csv' с помощью функции pd.read_csv(). Эти данные содержат информацию о различных инцидентах с НЛО.
- Далее мы выбираем набор признаков, в данном случае, эти признаки - населенность и время, которые будут использоваться для обучения модели, и сохраняем их в переменную features.
- Затем преобразуем категориальные признаки в числовой вид при помощи функции pd.get_dummies(). Это необходимо, так как модель дерева решений работает только с числовыми данными.
- После этого мы разделяем данные на обучающую и тестовую выборки с помощью функции train_test_split(). Обучающая выборка будет использоваться для обучения модели, а тестовая - для проверки ее точности.
- Создаем модель дерева решений с помощью класса DecisionTreeClassifier() из библиотеки sklearn.tree.
- Обучаем модель на обучающей выборке с помощью метода fit(). В процессе обучения модель настраивает параметры дерева решений, чтобы лучше предсказывать целевой признак.
- После обучения модели, мы производим прогнозы на тестовых данных с помощью метода predict().
- Оцениваем точность модели на тестовой выборке с помощью метода accuracy_score() из библиотеки sklearn.metrics. Этот метод сравнивает фактические значения целевого признака с предсказанными и возвращает точность модели.
- Наконец, выводим точность модели на тестовой выборке, чтобы оценить, насколько хорошо модель предсказывает инциденты с НЛО.
- Также, код визуализирует данные в виде графика с помощью библиотеки matplotlib.pyplot, отображая фактические значения целевого признака и предсказания модели. Это помогает наглядно оценить, насколько близки предсказания модели к реальным значениям. Результат
Точность модели на тестовой выборке: 0.1377245508982036 Прогнозы по оставшемуся проценту данных: 'cylinder' 'circle' 'sphere' 'disk' 'disk' 'fireball' 'disk' 'oval' 'circle' 'disk' 'disk' 'other' 'light' 'light' 'oval' 'fireball' 'light' 'rectangle' 'chevron' 'unknown' 'sphere' 'oval' 'light' 'circle' 'unknown' 'unknown' 'disk' 'triangle' 'triangle' 'unknown' 'formation' 'unknown' 'cigar' 'unknown' 'light' 'other' 'rectangle' 'light' 'other' 'light' 'cylinder' 'delta' 'sphere' 'other' 'changing' 'fireball' 'cylinder' 'cigar' 'circle' 'triangle' 'light' 'fireball' 'fireball' 'sphere' 'circle' 'light' 'chevron' 'oval' 'oval' 'light' 'unknown' 'triangle' 'other' 'rectangle' 'triangle' 'triangle' 'flash' 'unknown' 'sphere' 'unknown' 'other' 'circle' 'oval' 'light' 'oval' 'formation' 'sphere' 'triangle' 'changing' 'sphere' 'oval' 'unknown' 'circle' 'circle' 'flash' 'light' 'light' 'sphere' 'other' 'other' 'egg' 'unknown' 'other' 'light' 'light' 'disk' 'diamond' 'oval' 'unknown' 'light' 'triangle' 'other' 'light' 'disk' 'unknown' 'light' 'changing' 'sphere' 'triangle' 'circle' 'flash' 'sphere' 'light' 'unknown' 'oval' 'formation' 'light' 'circle' 'unknown' 'other' 'triangle' 'other' 'light' 'disk' 'formation' 'oval' 'triangle' 'triangle' 'light' 'formation' 'oval' 'light' 'light' 'oval' 'disk' 'sphere' 'egg' 'unknown' 'unknown' 'unknown' 'light' 'disk' 'changing' 'light' 'light' 'circle' 'circle' 'formation' 'light' 'light' 'cigar' 'light' 'triangle' 'oval' 'fireball' 'cylinder' 'other' 'circle' 'egg' 'changing' 'triangle' 'circle' 'other' 'oval' 'disk' 'light' 'flash' 'fireball' 'circle' 'circle' 'circle' 'circle' 'light' 'disk' 'fireball' 'other' 'sphere' 'light' 'changing' 'cigar' 'light' 'cylinder' 'rectangle' 'chevron' 'light' 'light' 'light' 'light' 'circle' 'circle' 'light' 'light' 'circle' 'sphere' 'triangle' 'light' 'egg' 'circle' 'fireball' 'sphere' 'sphere' 'triangle' 'light' 'other' 'cigar' 'sphere' 'sphere' 'fireball' 'light' 'light' 'disk' 'oval' 'oval' 'other' 'cigar' 'triangle' 'light' 'light' 'light' 'disk' 'light' 'light' 'light' 'light' 'other' 'light' 'teardrop' 'triangle' 'teardrop' 'fireball' 'sphere' 'cylinder' 'fireball' 'circle' 'egg' 'sphere' 'disk' 'chevron' 'triangle' 'light' 'other' 'light' 'circle' 'rectangle' 'fireball' 'formation' 'light' 'light' 'circle' 'light' 'light' 'formation' 'light' 'triangle' 'light' 'oval' 'light' 'unknown' 'fireball' 'diamond' 'light' 'circle' 'light' 'triangle' 'oval' 'oval' 'cylinder' 'circle' 'light' 'disk' 'light' 'sphere' 'circle' 'light' 'triangle' 'light' 'fireball' 'triangle' 'light' 'flash' 'triangle' 'egg' 'disk' 'oval' 'circle' 'flash' 'light' 'oval' 'sphere' 'light' 'triangle' 'other' 'chevron' 'other' 'circle' 'unknown' 'unknown' 'sphere' 'light' 'cigar' 'light' 'fireball' 'circle' 'diamond' 'fireball' 'triangle' 'diamond' 'sphere' 'circle' 'chevron' 'cylinder' 'light' 'circle' 'fireball' 'unknown' 'light' 'circle' 'fireball' 'light' 'fireball' 'fireball' 'fireball' 'light' 'sphere' 'light' 'sphere' 'sphere' 'formation' 'light' 'fireball' 'fireball' 'disk' 'disk' 'circle' 'rectangle' 'unknown' 'disk' 'unknown' 'disk' 'triangle' 'other' 'sphere' 'diamond' 'light' 'light' 'unknown' 'sphere' 'circle' 'disk' 'circle' 'oval' 'changing' 'other' 'other' 'disk' 'unknown' 'unknown' 'disk' 'rectangle' 'disk' 'light' 'oval' 'unknown' 'sphere' 'light' 'changing' 'disk' 'disk' 'other' 'other' 'disk' 'cylinder' 'disk' 'rectangle' 'light' 'disk' 'disk' 'light' 'fireball' 'formation' 'cigar' 'oval' 'fireball' 'unknown' 'disk' 'light' 'light' 'triangle' 'triangle' 'light' 'sphere' 'triangle' 'sphere' 'circle' 'light' 'oval' 'oval' 'circle' 'oval' 'rectangle' 'disk' 'oval' 'light' 'light' 'other' 'cigar' 'triangle' 'disk' 'cigar' 'other' 'triangle' 'egg' 'unknown' 'triangle' 'light' 'triangle' 'disk' 'changing' 'triangle' 'disk' 'disk' 'rectangle' 'other' 'triangle' 'triangle' 'formation' 'triangle' 'egg' 'sphere' 'fireball' 'triangle' 'rectangle' 'light' 'triangle' 'triangle' 'other' 'light' 'light' 'disk' 'fireball' 'light' 'disk' 'oval' 'triangle' 'other' 'fireball' 'light' 'light' 'triangle' 'unknown' 'cigar' 'light' 'unknown' 'chevron' 'formation' 'disk' 'cigar' 'light' 'sphere' 'cigar' 'unknown' 'triangle' 'other' 'light' 'light' 'triangle' 'diamond' 'light' 'triangle' 'oval' 'changing' 'light' 'flash' 'circle' 'oval' 'other' 'sphere' 'circle' 'triangle' 'unknown' 'teardrop' 'unknown' 'fireball' 'light' 'light' 'cigar' 'cigar' 'light' 'fireball' 'other' 'egg' 'light' 'other' 'unknown' 'unknown' 'changing' 'circle' 'light' 'other' 'unknown' 'unknown' 'light' 'other' 'light' 'unknown' 'cylinder' 'triangle' 'circle' 'light' 'circle' 'circle' 'circle' 'light' 'light' 'changing' 'changing' 'circle' 'circle' 'triangle' 'triangle' 'light' 'light' 'light' 'light' 'other' 'changing' 'triangle' 'cylinder' 'light' 'unknown' 'circle' 'disk' 'sphere' 'oval' 'formation' 'teardrop' 'triangle' 'chevron' 'light' 'unknown' 'unknown' 'other' 'egg' 'circle' 'oval' 'cigar' 'unknown' 'chevron' 'oval' 'cigar' 'fireball' 'circle' 'unknown' 'light' 'sphere' 'fireball' 'changing' 'light' 'circle' 'unknown' 'fireball' 'light' 'sphere' 'light' 'formation' 'circle' 'fireball' 'formation' 'formation' 'formation' 'light' 'other' 'light' 'light' 'circle' 'diamond' 'oval' 'circle' 'oval' 'triangle' 'light' 'disk' 'light' 'other' 'triangle' 'triangle' 'cylinder' 'disk' 'cylinder' 'light' 'oval' 'cigar' 'circle' 'disk' 'light' 'unknown' 'circle' 'other' 'light' 'light' 'light' 'unknown' 'triangle' 'other' 'disk' 'cylinder' 'triangle' 'oval' 'disk' 'light' 'triangle' 'circle' 'light' 'other' 'light' 'other' 'circle' 'disk' 'other' 'triangle' 'oval' 'unknown' 'light' 'triangle' 'unknown' 'circle' 'unknown' 'light' 'fireball' 'fireball' 'rectangle' 'light' 'formation' 'unknown' 'light' 'light' 'formation' 'fireball' 'light' 'light' 'other' 'unknown' 'light' 'triangle' 'fireball' 'triangle' 'triangle' 'flash' 'circle' 'triangle' 'disk' 'light' 'unknown' 'light' 'light' 'fireball' 'circle' 'unknown' 'unknown' 'circle' 'disk' 'chevron' 'disk' 'disk' 'triangle' 'light' 'light' 'disk'
Вывод: Наша модель дерева решений показала низкую точность предсказаний (Точность модели на тестовой выборке: 0.1377245508982036), что означает, что она не очень хорошо предсказывает форму НЛО на основе выбранных признаков (население и время). Из-за чего можно сделать вывод, что возможно, эти признаки недостаточно информативны или недостаточно связаны с формой НЛО.