Merge pull request 'shadaev_anton_lab_1' (#127) from shadaev_anton_lab_1 into main
Reviewed-on: http://student.git.athene.tech/Alexey/IIS_2023_1/pulls/127
This commit is contained in:
commit
1aef95a6d9
48
shadaev_anton_lab_1/README.md
Normal file
48
shadaev_anton_lab_1/README.md
Normal file
@ -0,0 +1,48 @@
|
|||||||
|
# IIS_2023_1
|
||||||
|
<h4>Задание</h4>
|
||||||
|
<p>
|
||||||
|
Используя код из пункта «Регуляризация и сеть прямого
|
||||||
|
распространения» из [1] (стр. 228), сгенерируйте определенный тип данных и
|
||||||
|
сравните на нем 3 модели (по варианту). Постройте графики, отобразите
|
||||||
|
качество моделей, объясните полученные результаты.
|
||||||
|
</p>
|
||||||
|
<p>
|
||||||
|
9. Данные: make_classification (n_samples=500, n_features=2,
|
||||||
|
n_redundant=0, n_informative=2, random_state=rs, n_clusters_per_class=1)
|
||||||
|
Модели:
|
||||||
|
- Персептрон
|
||||||
|
· Многослойный персептрон с 10-ю нейронами в скрытом слое (alpha =
|
||||||
|
0.01)
|
||||||
|
· Многослойный персептрон со 100-а нейронами в скрытом слое (alpha
|
||||||
|
= 0.01)
|
||||||
|
</p>
|
||||||
|
<h4>Способок запуска программы</h4>
|
||||||
|
<p>Выполнить скрипт shadaev_anton_lab_1/main.py (перед этим установить импортированные библиотеки) после которого будут нарисованы 3 графика</p>
|
||||||
|
<h4>Стек технологий</h4>
|
||||||
|
<p>
|
||||||
|
<ul>
|
||||||
|
<li>NumPy - это библиотека Python, предоставляющая поддержку для больших, многомерных массивов и матриц, а также набор функций для их манипуляции и обработки.</li>
|
||||||
|
<li>Matplotlib - это библиотека для визуализации данных в Python, предоставляющая инструменты для создания статических, анимированных и интерактивных графиков и диаграмм.</li>
|
||||||
|
<li>Scikit-learn - это библиотека Python, предназначенная для машинного обучения, которая содержит функции и алгоритмы для классификации, прогнозирования и разбиения данных на группы.</li>
|
||||||
|
</ul>
|
||||||
|
</p>
|
||||||
|
<h4>Описание кода</h4>
|
||||||
|
<p>
|
||||||
|
<ol>
|
||||||
|
<li>Импортирование необходимых библиотек</li>
|
||||||
|
<li>Создание искусственных данных с помощью функции <i>make_classification()</i> из sklearn. Данные состоят из 500 образцов.</li>
|
||||||
|
<li>Данные разделяются на обучающие и тестовые наборы данных с использованием функции <i>train_test_split()</i>.</li>
|
||||||
|
<li>Создается список моделей для обучения (Перцептрон и многослойные перцептроны).</li>
|
||||||
|
<li>Выполняется обучение для каждой модели, предсказание на тестовых данных и вычисление точности предсказания.</li>
|
||||||
|
<li>Строится кривая обучения для каждой модели и кросс-валидации с использованием функции <i>learning_curve()</i> из sklearn. Данная функция позволяет визуализировать, как производительность модели изменяется в зависимости от количества обучающих примеров.</li>
|
||||||
|
<li>Наконец, <i>plt.show()</i> отображает все графики.</li>
|
||||||
|
</ol>
|
||||||
|
<h6>Полученные графики</h6>
|
||||||
|
Графики показывают производительность моделей при обучении на разных размерах обучающего набора данных.
|
||||||
|
<ul>
|
||||||
|
<li><b>Оценка обучения</b> - кривая, показывающая среднюю точность модели на обучающем наборе данных для различных размеров обучающего набора. Это позволяет увидеть, как точность модели меняется с увеличением размера обучающего набора.</li>
|
||||||
|
<li><b>Оценка кросс-валидации</b> - кривая, показывающая среднюю точность модели на валидационном наборе данных для различных размеров обучающего набора. Это позволяет увидеть, как точность модели меняется с увеличением размера обучающего набора, но с использованием кросс-валидации для оценки производительности модели.</li>
|
||||||
|
<li><b>Оси графика:</b> Ось X представляет размер обучающего набора, а ось Y представляет среднюю точность модели.</li>
|
||||||
|
</ul>
|
||||||
|
<img src="myplot.png" />
|
||||||
|
</p>
|
37
shadaev_anton_lab_1/main.py
Normal file
37
shadaev_anton_lab_1/main.py
Normal file
@ -0,0 +1,37 @@
|
|||||||
|
import numpy as np
|
||||||
|
import matplotlib.pyplot as plt
|
||||||
|
from sklearn.datasets import make_classification
|
||||||
|
from sklearn.linear_model import Perceptron
|
||||||
|
from sklearn.neural_network import MLPClassifier
|
||||||
|
from sklearn.model_selection import train_test_split
|
||||||
|
from sklearn.metrics import accuracy_score
|
||||||
|
|
||||||
|
# Наполнение искусственными данными
|
||||||
|
rs = np.random.RandomState(42)
|
||||||
|
X, y = make_classification(n_samples=500, n_features=2, n_redundant=0, n_informative=2, random_state=rs,
|
||||||
|
n_clusters_per_class=1)
|
||||||
|
|
||||||
|
# Обучающие и тестовые наборы данных
|
||||||
|
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=rs)
|
||||||
|
|
||||||
|
# Список моделей для обучения
|
||||||
|
models = [
|
||||||
|
('Перцептрон', Perceptron()),
|
||||||
|
('MLP (10 нейронов)', MLPClassifier(hidden_layer_sizes=(10,), alpha=0.01, random_state=rs)),
|
||||||
|
('MLP (100 нейронов)', MLPClassifier(hidden_layer_sizes=(100,), alpha=0.01, random_state=rs))
|
||||||
|
]
|
||||||
|
|
||||||
|
fig, axs = plt.subplots(1, len(models), figsize=(12, 4))
|
||||||
|
|
||||||
|
# Визуализация графиков
|
||||||
|
for i, (name, model) in enumerate(models):
|
||||||
|
model.fit(X_train, y_train)
|
||||||
|
y_pred = model.predict(X_test)
|
||||||
|
accuracy = accuracy_score(y_test, y_pred)
|
||||||
|
|
||||||
|
axs[i].scatter(X_test[:, 0], X_test[:, 1], c=y_pred, cmap=plt.cm.Paired)
|
||||||
|
axs[i].set_title(f'{name} (Accuracy: {accuracy:.2f})')
|
||||||
|
axs[i].set_xlabel("Размер обучающего набора")
|
||||||
|
axs[i].set_ylabel("Средняя точность модели")
|
||||||
|
|
||||||
|
plt.show()
|
BIN
shadaev_anton_lab_1/myplot.png
Normal file
BIN
shadaev_anton_lab_1/myplot.png
Normal file
Binary file not shown.
After Width: | Height: | Size: 53 KiB |
Loading…
Reference in New Issue
Block a user