kondrashin_mikhail_lab_1_ready #202

Merged
Alexey merged 1 commits from kondrashin_mikhail_lab_1 into main 2023-12-05 22:52:02 +04:00
7 changed files with 107 additions and 0 deletions

View File

@ -0,0 +1,44 @@
#### Кондрашин Михаил ПИбд-41
## Лабораторная работа 1. Работа с типовыми наборами данных и различными моделями
### Задание:
**Данные:** make_classification (n_samples=500, n_features=2, n_redundant=0, n_informative=2, random_state=rs,
n_clusters_per_class=1)
**Модели:**
* Линейная регрессия
* Полиномиальная регрессия (со степенью 3)
* Гребневая полиномиальная регрессия (со степенью 4, alpha = 1.0)
### Запуск лабораторной работы:
* установить `python`, `numpy`, `matplotlib`, `sklearn`
* запустить проект (стартовая точка класс `main.py`)
### Используемые технологии:
* Язык программирования `Python`,
* Библиотеки `numpy`, `matplotlib`, `sklearn`
* Среда разработки `IntelliJ IDEA` (В версии "Ultimate edition" можно писать на python)
### Описание решения:
* Программа генерирует данные с make_classification (n_samples=500, n_features=2, n_redundant=0, n_informative=2,
random_state=rs, n_clusters_per_class=1)
* Сравнивает три типа моделей: линейная, полиномиальная, гребневая полиномиальная регрессии
* Выдает графики и оценки качества по коэффициенту детерминации для каждой модели
### Результат:
![Linear](images/linear.png)
![Polynomial](images/polynomial.png)
![Greb](images/greb_polynom.png)
* Результат расчета оценки качества:
![Result](images/result.png)
По результатам оценки качества можно сказать, что **полиномиальная регрессия** показала наибольшую оценку

View File

@ -0,0 +1,47 @@
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Ridge
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures
def lin(x_train, x_test, y_train, y_test):
plt.scatter(x_test, y_test)
model = LinearRegression().fit(x_train, y_train)
y_predict = model.intercept_ + model.coef_ * x_test
plt.plot(x_test, y_predict, color='red')
plt.title('Линейная регрессия')
plt.savefig('images/linear.png')
plt.show()
print('Линейная регрессия')
print('Оценка качества:', model.score(x_train, y_train))
def polynom(x_train, y_train):
plt.scatter(x_train, y_train)
x_poly = PolynomialFeatures(degree=4).fit_transform(x_train)
pol_reg = LinearRegression()
model = pol_reg.fit(x_poly, y_train)
y_predict = pol_reg.predict(x_poly)
plt.plot(x_train, y_predict, color='green')
plt.title('Полиномиальная регрессия')
plt.savefig('images/polynomial.png')
plt.show()
print('Полиномиальная регрессия')
print('Оценка качества:', model.score(x_poly, y_train))
def greb_polynom(x_train, x_test, y_train, y_test):
plt.scatter(x_test, y_test)
pipeline = Pipeline([("polynomial_features", PolynomialFeatures(degree=4)), ("ridge", Ridge(alpha=1.0))])
model = pipeline.fit(x_train, y_train)
y_predict = pipeline.predict(x_test)
plt.plot(x_test, y_predict, color='blue')
plt.title('Гребневая полиномиальная регрессия')
plt.savefig('images/greb_polynom.png')
plt.show()
print('Гребневая полиномиальная регрессия')
print('Оценка качества:', model.score(x_train, y_train))

Binary file not shown.

After

Width:  |  Height:  |  Size: 52 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 19 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 64 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 54 KiB

View File

@ -0,0 +1,16 @@
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from funcs import *
x, y = make_classification(n_samples=500, n_features=2, n_redundant=0, n_informative=2, random_state=0,
n_clusters_per_class=1)
x = x[:, np.newaxis, 1]
x_train, x_test, y_train, y_test = train_test_split(x, y)
lin(x_train, x_test, y_train, y_test)
polynom(x_train, y_train)
greb_polynom(x_train, x_test, y_train, y_test)