IIS_2023_1/podkorytova_yulia_lab_1/README.md

37 lines
4.2 KiB
Markdown
Raw Normal View History

2023-10-27 01:23:28 +04:00
# Лабораторная работа 1. Работа с типовыми наборами данных и различными моделями
### Задание на лабораторную:
Используя код из пункта «Регуляризация и сеть прямого распространения», сгенерируйте определенный тип данных и сравните на нем 3 модели (по варианту). Постройте графики, отобразите качество моделей, объясните полученные результаты.
**Вариант 20.**
Данные: make_circles (noise=0.2, factor=0.5, random_state=rs)
Модели:
* Линейную регрессию
* Полиномиальную регрессию (со степенью 5)
* Гребневую полиномиальную регрессию (со степенью 5, alpha= 1.0)
***
### Как запустить лабораторную работу:
Для запуска лабораторной работы необходимо открыть файл `lr1.py`, нажать на ПКМ и в выпадающем списке выбрать опцию "Run".
***
### Технологии:
**NumPy (Numerical Python)** - это библиотека для научных вычислений в Python, которая обеспечивает эффективные вычисления и манипуляции с данными.
**Matplotlib** - это библиотека визуализации данных для языка программирования Python, которая предоставляет широкий спектр инструментов для создания различных типов графиков, диаграмм и визуализаций данных.
**Scikit-learn (Sklearn)** - это библиотека для языка программирования Python, которая предоставляет инструменты для разработки и применения различных алгоритмов машинного обучения, включая классификацию, регрессию, кластеризацию, снижение размерности и многое другое. Scikit-learn также предлагает функции для предобработки данных, оценки моделей и выбора наилучших параметров.
***
### Что делает лабораторная работа:
В лабораторной работе генерируется набор данных при помощи функции *make_circles* с параметрами из задания.
Далее происходит разделение данных на обучащий и тестовый наборы при помощи функции *train_test_split*.
После создаются 3 модели (линейная, полиномиальная и гребневая полиномиальная), а дальше происходит обучение моделей, предсказание и оценка качества.
Результатом работы являются показатели качества моделей, выведенные в консоль, и 3 графика, отображающие данные, их классификацию и границы решения моделей.
***
### Пример выходных данных:
***Качество моделей:***
![](scoreRes.jpg)
***Графики:***
![](plotRes.jpg)
***
**Вывод**: результаты показали, что для сгенерированного набора данных из 3 моделей наиболее точной оказалась полиномиальная регрессия (со степенью 5), гребневая полиномиальная регрессия (со степенью 5, alpha= 1.0), которая идентична полиномиальной регрессии, стала второй по точности, а линейная регрессия показала самую низкую точность.