volkov_rafael_lab_5 is done

2023-12-05 12:47:51 +04:00 · 2023-12-05 12:47:51 +04:00 · fab8430c9e
commit fab8430c9e
parent a8c58683dd
6 changed files with 20487 additions and 0 deletions
--- a/volkov_rafael_lab_5/app.py
+++ b/volkov_rafael_lab_5/app.py
@ -0,0 +1,72 @@
+from flask import Flask, render_template, request
+import pandas as pd
+from sklearn.model_selection import train_test_split
+from sklearn.linear_model import LogisticRegression
+from sklearn.pipeline import Pipeline
+from sklearn.preprocessing import Binarizer
+import joblib
+
+app = Flask(__name__)
+
+# Загрузка данных
+data_bgg = pd.read_csv("bgg_dataset.csv", delimiter=";")
+
+# Выбор нужных столбцов
+selected_columns_bgg = ['Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average']
+features = data_bgg[selected_columns_bgg]
+
+# Замена запятых на точки в столбцах 'Users Rated' и 'Owned Users'
+features['Rating Average'] = features['Rating Average'].str.replace(',', '.').astype(float)
+features['Complexity Average'] = features['Complexity Average'].str.replace(',', '.').astype(float)
+
+# Замена пропущенных значений средними значениями по столбцам
+features = features.fillna(features.mean())
+
+# Определение порога для классификации (средний рейтинг)
+threshold = features['Rating Average'].mean()
+
+# Разделение данных
+X_bgg = features.drop('Rating Average', axis=1)
+y_bgg = features['Rating Average'] > threshold  # Классификация: 1 - выше среднего, 0 - ниже среднего
+X_train_bgg, X_test_bgg, y_train_bgg, y_test_bgg = train_test_split(X_bgg, y_bgg, test_size=0.2, random_state=42)
+
+# Обучение модели логистической регрессии
+logistic_regression_model = Pipeline([
+    ('binarizer', Binarizer(threshold=threshold)),
+    ('logistic_regression', LogisticRegression())
+])
+logistic_regression_model.fit(X_train_bgg, y_train_bgg)
+
+# Сохранение модели
+joblib.dump(logistic_regression_model, 'logistic_regression_model.joblib')
+
+# Загрузка модели
+logistic_regression_model = joblib.load('logistic_regression_model.joblib')
+
+# Обновление маршрута для предсказания
+@app.route('/')
+def index():
+    return render_template('index.html')
+
+@app.route('/predict', methods=['POST'])
+def predict():
+    if request.method == 'POST':
+        # Получение данных из формы
+        input_data_bgg = {
+            'Year Published': int(request.form['Year Published']),
+            'Users Rated': int(request.form['Users Rated']),
+            'BGG Rank': int(request.form['BGG Rank']),
+            'Owned Users': int(request.form['Owned Users']),
+            'Complexity Average': float(request.form['Complexity Average'])
+        }
+
+        # Преобразование данных в DataFrame
+        input_df_bgg = pd.DataFrame([input_data_bgg])
+
+        # Предсказание
+        prediction_bgg = logistic_regression_model.predict(input_df_bgg)[0]
+
+        return render_template('index.html', prediction_bgg=prediction_bgg)
+
+if __name__ == '__main__':
+    app.run(debug=True)
--- a/volkov_rafael_lab_5/bgg_dataset.csv
+++ b/volkov_rafael_lab_5/bgg_dataset.csv
--- a/volkov_rafael_lab_5/linear_regression_model.joblib
+++ b/volkov_rafael_lab_5/linear_regression_model.joblib
--- a/volkov_rafael_lab_5/logistic_regression_model.joblib
+++ b/volkov_rafael_lab_5/logistic_regression_model.joblib
--- a/volkov_rafael_lab_5/readme.md
+++ b/volkov_rafael_lab_5/readme.md
@ -0,0 +1,35 @@
+Общее задание:
+Использовать регрессию по варианту для данных из курсовой работы, самостоятельно сформулировав задачу.
+Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
+
+Задание по вариантам:
+алгоритм Логистическая регрессия
+Датасет: Board Games
+Ссылки:
+https://www.kaggle.com/datasets/andrewmvd/board-games
+
+Задача для регрессии: предсказать будет ли рейтинг игры выше среднего или ниже на основе характеристик: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'
+
+Запуск через файл app.py
+
+Программа использует следующие технологии:
+
+Flask: для создания веб-приложения.
+pandas: для работы с данными в формате CSV.
+scikit-learn: для обучения и использования моделей машинного обучения (Linear Regression и Logistic Regression).
+joblib: для сохранения и загрузки обученных моделей.
+Описание работы программы:
+
+Программа загружает данные из файла "bgg_dataset.csv", используя библиотеку pandas.
+Выбираются нужные столбцы: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'.
+Производится замена запятых на точки в столбцах 'Rating Average' и 'Complexity Average'.
+Пропущенные значения в данных заменяются средними значениями по соответствующим столбцам.
+Данные разделяются на обучающий и тестовый наборы.
+Создается и обучается модель (линейной или логистической регрессии) с использованием scikit-learn и сохраняется в файле.
+Веб-приложение на Flask запускается локально.
+Пользователь взаимодействует с веб-формой, вводя параметры игры (Year Published, Users Rated, BGG Rank, Owned Users, Complexity Average).
+Введенные данные передаются в обученную модель, которая делает предсказание.
+Предсказание выводится на веб-странице.
+Входные данные: параметры игры (Year Published, Users Rated, BGG Rank, Owned Users, Complexity Average) через веб-форму.
+
+Выходные данные: предсказание (например, классификация игры как "выше среднего"(1) или "ниже среднего"(0)) на веб-странице.
--- a/volkov_rafael_lab_5/templates/index.html
+++ b/volkov_rafael_lab_5/templates/index.html
@ -0,0 +1,36 @@
+<!DOCTYPE html>
+<html lang="en">
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1.0">
+    <title>Board Game Rating Prediction</title>
+</head>
+<body>
+    <h1>Board Game Rating Prediction</h1>
+
+    <!-- Форма для ввода данных -->
+    <form method="post" action="/predict">
+        <label for="Year Published">Year Published:</label>
+        <input type="number" name="Year Published" required><br>
+
+        <label for="Users Rated">Users Rated:</label>
+        <input type="number" name="Users Rated" required><br>
+
+        <label for="BGG Rank">BGG Rank:</label>
+        <input type="number" name="BGG Rank" required><br>
+
+        <label for="Owned Users">Owned Users:</label>
+        <input type="number" name="Owned Users" required><br>
+
+        <label for="Complexity Average">Complexity Average:</label>
+        <input type="number" step="0.01" name="Complexity Average" required><br>
+
+        <button type="submit">Predict Rating Average</button>
+    </form>
+
+    <!-- Отображение предсказания -->
+    {% if prediction_bgg %}
+        <p>Predicted Rating Average: {{ prediction_bgg }}</p>
+    {% endif %}
+</body>
+</html>