IIS_2023_1/podkorytova_yulia_lab_1/README.md
2023-10-27 01:23:28 +04:00

4.2 KiB
Raw Permalink Blame History

Лабораторная работа 1. Работа с типовыми наборами данных и различными моделями

Задание на лабораторную:

Используя код из пункта «Регуляризация и сеть прямого распространения», сгенерируйте определенный тип данных и сравните на нем 3 модели (по варианту). Постройте графики, отобразите качество моделей, объясните полученные результаты.

Вариант 20. Данные: make_circles (noise=0.2, factor=0.5, random_state=rs)

Модели:

  • Линейную регрессию
  • Полиномиальную регрессию (со степенью 5)
  • Гребневую полиномиальную регрессию (со степенью 5, alpha= 1.0)

Как запустить лабораторную работу:

Для запуска лабораторной работы необходимо открыть файл lr1.py, нажать на ПКМ и в выпадающем списке выбрать опцию "Run".


Технологии:

NumPy (Numerical Python) - это библиотека для научных вычислений в Python, которая обеспечивает эффективные вычисления и манипуляции с данными.

Matplotlib - это библиотека визуализации данных для языка программирования Python, которая предоставляет широкий спектр инструментов для создания различных типов графиков, диаграмм и визуализаций данных.

Scikit-learn (Sklearn) - это библиотека для языка программирования Python, которая предоставляет инструменты для разработки и применения различных алгоритмов машинного обучения, включая классификацию, регрессию, кластеризацию, снижение размерности и многое другое. Scikit-learn также предлагает функции для предобработки данных, оценки моделей и выбора наилучших параметров.


Что делает лабораторная работа:

В лабораторной работе генерируется набор данных при помощи функции make_circles с параметрами из задания. Далее происходит разделение данных на обучащий и тестовый наборы при помощи функции train_test_split. После создаются 3 модели (линейная, полиномиальная и гребневая полиномиальная), а дальше происходит обучение моделей, предсказание и оценка качества.

Результатом работы являются показатели качества моделей, выведенные в консоль, и 3 графика, отображающие данные, их классификацию и границы решения моделей.


Пример выходных данных:

Качество моделей:

Графики:


Вывод: результаты показали, что для сгенерированного набора данных из 3 моделей наиболее точной оказалась полиномиальная регрессия (со степенью 5), гребневая полиномиальная регрессия (со степенью 5, alpha= 1.0), которая идентична полиномиальной регрессии, стала второй по точности, а линейная регрессия показала самую низкую точность.