zavrazhnova_svetlana_lab_6 is ready

2023-10-27 14:17:35 +04:00 · 2023-10-27 14:17:35 +04:00 · 25acce2c79
commit 25acce2c79
parent 481361b7e0
3 changed files with 51 additions and 74 deletions
--- a/zavrazhnova_svetlana_lab_6/README.md
+++ b/zavrazhnova_svetlana_lab_6/README.md
@ -0,0 +1,28 @@
+# Задание
+Использовать нейронную сеть MLPClassifier для данных из файла `fraud_dataset.csv`, для задачи: Предсказать, является ли транзакция мошеннической или нет на основе имеющихся данных.
+### Как запустить лабораторную работу:
+ЛР запускается в файле zavrazhnova_svetlana_lab_6.py через Run, а затем в консоли должны появится вычисления
+
+### Технологии
+Библиотека sklearn.neuralnetwork содержит реализацию MLP (Multilayer Perceptron) - это алгоритм искусственного нейронного сети для классификации и регрессии.
+Классификатор MLPClassifier является реализацией многослойного перцептрона для задач классификации.
+
+Библиотека sklearn.metrics содержит различные метрики для оценки качества моделей машинного обучения. В данном случае, используются следующие метрики:
+- accuracyscore - точность модели, которая показывает долю правильно классифицированных объектов.
+- confusionmatrix - матрица ошибок, которая показывает количество правильно и неправильно классифицированных объектов для каждого класса.
+- classificationreport - отчет о классификации, который содержит информацию о точности, полноте, F1-мере и поддержке для каждого класса.
+
+### Что делает лабораторная:
+Создает и обучает модель нейронной сети с помощью MLPClassifier. Оценивает точность модели с помощью функции accuracy_score(). Строит матрицу ошибок и выводит отчет о классификации
+
+### Пример выходных значений:
+![result.png](result.png)
+ 
+### Вывод
+Модель MLPClassifier, обученная на данных из файла fraud_dataset.csv, показывает высокую точность в предсказании мошеннических и не мошеннических транзакций.
+Об этом говорят результаты вычислений: 
+- Accuracy: 1.0 - это показатель точности модели, который равен 1.0, что означает 100% точность модели в предсказании мошеннических и не мошеннических транзакций на тестовой выборке.
+
+- Confusion Matrix: матрица ошибок, показывающая количество верно и неверно классифицированных транзакций. В данном случае, видим, что все 17 не мошеннических транзакций были правильно предсказаны, а одна мошенническая транзакция была неправильно предсказана.
+
+- Classification Report: отчет о классификации, который содержит информацию о точности, полноте (recall), F1-мере и поддержке (support) для каждого класса. Из отчета видно, что как для класса 0 (не мошенническая транзакция), так и для класса 1 (мошенническая транзакция), точность, полнота и F1-мера равны 1.0, что говорит о идеальной предсказательной способности модели для обоих классов. Поддержка указывает на количество образцов в каждом классе в тестовой выборке.
--- a/zavrazhnova_svetlana_lab_6/result.png
+++ b/zavrazhnova_svetlana_lab_6/result.png
--- a/zavrazhnova_svetlana_lab_6/zavrazhnova_svetlana_lab_6.py
+++ b/zavrazhnova_svetlana_lab_6/zavrazhnova_svetlana_lab_6.py
@ -1,84 +1,33 @@
-# import pandas as pd
-# from sklearn.neural_network import MLPClassifier
-# from sklearn.preprocessing import OneHotEncoder
-#
-# # Загрузка данных из файла
-# df = pd.read_csv('fraud_dataset.csv')
-#
-# # Разделение признаков и целевой переменной
-# # В данном случае целевая переменная - fraud_label
-# X = df[['transaction_amount', 'location', 'merchant', 'age', 'gender']]
-# y = df['fraud_label']
-#
-# X[['location', 'merchant', 'gender']] = X[['location', 'merchant', 'gender']].astype(str)
-#
-# # Преобразование категориальных признаков в числовые
-# enc = OneHotEncoder()
-# X_encoded = enc.fit_transform(X[['location', 'merchant', 'gender']]).toarray()
-#
-# # Объединение закодированных признаков с числовыми признаками
-# X_final = pd.concat([X['transaction_amount'], pd.DataFrame(X_encoded), X['age']], axis=1)
-#
-# # Создание модели MLPClassifier
-# model = MLPClassifier(hidden_layer_sizes=(100, 100)) # Можно настроить размеры и количество скрытых слоев
-#
-# # Обучение модели
-# model.fit(X_final, y)
-#
-# # Предсказание для новых данных
-# # Пример предсказания для новой транзакции
-# new_transaction = pd.DataFrame([[2000.00, 'New York', 'ABC Corp', 35, 'M']],
-#                                columns=['transaction_amount', 'location', 'merchant', 'age', 'gender'])
-# new_transaction_encoded = enc.transform(new_transaction[['location', 'merchant', 'gender']]).toarray()
-# new_transaction_final = pd.concat([new_transaction['transaction_amount'],
-#                                    pd.DataFrame(new_transaction_encoded),
-#                                    new_transaction['age']], axis=1)
-# prediction = model.predict(new_transaction_final)
-#
-# # Вывод предсказания
-# print(prediction)
-
 import pandas as pd
-import numpy as np
-from matplotlib import pyplot as plt
-from sklearn import metrics
 from sklearn.model_selection import train_test_split
-from sklearn.neural_network import MLPRegressor
-from sklearn.preprocessing import LabelEncoder
+from sklearn.neural_network import MLPClassifier
+from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

-# Метод обучения нейронной сети
-def reg_neural_net():
-    df = pd.read_csv('fraud_dataset.csv')
-    x, y = [df.drop("fraud_label", axis=1).values,
-            df["fraud_label"].values]
-    encoder = LabelEncoder()
-    df['location'] = encoder.fit_transform(df['location'])  # Преобразование категориального столбца "location" в числовой формат
+data = pd.read_csv('fraud_dataset.csv')

-    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.001, random_state=42)
+X = data[['transaction_amount', 'location', 'merchant', 'age', 'gender']]
+y = data['fraud_label']

-    mlp = MLPRegressor(hidden_layer_sizes=(100, 50), activation='tanh', solver='adam', random_state=15000)
-    mlp.fit(x_train, y_train)
-    y_predict = mlp.predict(x_test)
-    err = pred_errors(y_predict, y_test)
-    make_plots(y_test, y_predict, err[0], err[1], "Нейронная сеть")
+# Преобразование категориальных переменных в числовые
+X = pd.get_dummies(X, columns=['location', 'merchant', 'gender'])

+X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

-# Метод рассчёта ошибок
-def pred_errors(y_predict, y_test):
-    mid_square = np.round(np.sqrt(metrics.mean_squared_error(y_test, y_predict)),3)            # Рассчёт среднеквадратичной ошибки модели
-    det_kp = np.round(metrics.r2_score(y_test, y_predict), 2)                                  # Рассчёт коэфициента детерминации модели
-    return mid_square, det_kp
+# Обучение модели нейронной сети
+model = MLPClassifier(random_state=1, max_iter=2000, n_iter_no_change=20,
+                        alpha=0.001, hidden_layer_sizes=[1280], tol=0.0000001)
+model.fit(X_train, y_train)

+# Предсказание на тестовой выборке
+y_pred = model.predict(X_test)

-# Метод отрисовки графиков
-def make_plots(y_test, y_predict, mid_sqrt, det_kp, title):
-        plt.plot(y_test, c="red", label="\"y\" исходная")                                # Создание графика исходной функции
-        plt.plot(y_predict, c="green", label="\"y\" предсказанная \n"
-                                                  "Ср^2 = " + str(mid_sqrt) + "\n"
-                                                  "Кд = " + str(det_kp))                       # Создание графика предсказанной функции
-        plt.legend(loc='lower left')
-        plt.title(title)
-        plt.savefig('static/' + title + '.png')
-        plt.close()
+# Оценка качества модели
+accuracy = accuracy_score(y_test, y_pred)
+confusion = confusion_matrix(y_test, y_pred)
+report = classification_report(y_test, y_pred)

-reg_neural_net()
+print("Accuracy:", accuracy)
+print("Confusion Matrix:")
+print(confusion)
+print("Classification Report:")
+print(report)