lab6 is done

2023-11-15 20:38:05 +04:00 · 2023-11-15 20:38:05 +04:00 · 15e5bb787a
commit 15e5bb787a
parent b8dc1e4cd8
2 changed files with 84 additions and 0 deletions
--- a/sergeev_evgenii_lab_6/lab6.py
+++ b/sergeev_evgenii_lab_6/lab6.py
@ -0,0 +1,53 @@
 import math
 from sklearn.neural_network import MLPRegressor
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler, LabelEncoder
 from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score, accuracy_score, classification_report
 import pandas as pd
 # Загрузим данные
 df = pd.read_csv("hotel_bookings_raw.csv")
 df.dropna(inplace=True)
 # Объявляю объект для преобразования строковых значений в числовые
 label_encoder = LabelEncoder()
 # Выберем признаки и целевую переменную (доход)
 features_list = ['lead_time', 'stays_in_weekend_nights',
                 'stays_in_week_nights', 'adults', 'children', 'babies', 'meal', 'customer_type',
                 'previous_cancellations',
                 'previous_bookings_not_canceled', 'required_car_parking_spaces',
                 'CPI_AVG', 'INFLATION', 'INFLATION_CHG', 'GDP', 'CPI_HOTELS']
 # Выбираем признаки и целевую переменную
 features = df[features_list].copy()
 target = df['adr'].copy()
 # Применяю к каждому столбцу признака преобразования
 for f in features_list:
    features[f] = label_encoder.fit_transform(features[f])
 # Разделяем данные на тренировочный и тестовый наборы
 X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.1, random_state=42)
 # Масштабируем признаки для лучшей производительности модели
 scaler = StandardScaler()
 X_train_scaled = scaler.fit_transform(X_train)
 X_test_scaled = scaler.transform(X_test)
 # Создаем и обучаем MLPRegressor
 mlp_model = MLPRegressor(hidden_layer_sizes=(100, 50), max_iter=500, random_state=42)
 mlp_model.fit(X_train_scaled, y_train)
 # Делаем предсказания на тестовых данных
 predictions = mlp_model.predict(X_test_scaled)
 # Оцениваем производительность модели
 mse = mean_squared_error(y_test, predictions)
 mae = mean_absolute_error(y_test, predictions)
 r2 = r2_score(y_test, predictions)
 print(f"Среднеквадратичная ошибка (MSE): {round(math.sqrt(mse), 2)}%")
 print(f"Среднеабсолютное отклонение (MAE): {round(mae, 2)}%")
 print(f"Коэффициент детерминации (R^2): {round(r2, 4) * 100}%")
--- a/sergeev_evgenii_lab_6/readme.md
+++ b/sergeev_evgenii_lab_6/readme.md
@ -0,0 +1,31 @@
 # Лабораторная работа 6. Нейронная сеть
 ## Задание
 Использовать нейронную сеть по варианту (24 % 2 == 0) для данных из таблицы, самостоятельно  сформулировав  задачу. 
 Оценить, насколько хорошо она подходит для решения сформулированной мной задачи.
 Ссылка на мой датасет: https://www.kaggle.com/datasets/mlardi/hotel-booking-demand-with-economic-indicators
 ## Задача
 Прогнозирование среднего дохода отеля (adr) на основе различных 
 экономических и операционных показателей, используя многослойный персептрон (MLPRegressor)
 ### Запуск программы
 Файл lab6.py содержит и запускает программу.
 ### Описание программы
 Программа состоит из двух частей:
 1. Она считывает файл с данными о двух отелях: City Hotel и Resort Hotel. Содержит множество различных метрик
 2. Далее определяет необходимые признаки для характеристики дохода
 3. Обучает нейронную сеть и выводит степень ошибок по различным метрикам
 ### Результаты тестирования
 По результатам тестирования, можно сказать следующее:
 Вывод:
 * Среднеквадратичная ошибка (MSE): 29.84% - показывает самое большое отклонение, но является неплохим результатом, 
 хоть и может быть оптимизировано лучше
 * Среднеабсолютное отклонение (MAE): 21.11% - показывает средний уровень отклонения, но является неплохим результатом
 * Коэффициент детерминации (R^2): 59.650000000000006% - показывает неплохой уровень изменчивости целевой переменной, 
 которое может быть объяснено моделью, но может быть улучшено
 Результаты показывают, что модель может быть еще больше улучшена, 
 так как имеется неплохой уровень ошибки, но всё же эта модель показывает лучший результат, чем модель регрессии