Merge pull request 'volkov_rafael_lab_5 is done' (#254) from volkov_rafael_lab_5 into main
Reviewed-on: http://student.git.athene.tech/Alexey/IIS_2023_1/pulls/254
This commit is contained in:
commit
baa38c6fa7
72
volkov_rafael_lab_5/app.py
Normal file
72
volkov_rafael_lab_5/app.py
Normal file
@ -0,0 +1,72 @@
|
|||||||
|
from flask import Flask, render_template, request
|
||||||
|
import pandas as pd
|
||||||
|
from sklearn.model_selection import train_test_split
|
||||||
|
from sklearn.linear_model import LogisticRegression
|
||||||
|
from sklearn.pipeline import Pipeline
|
||||||
|
from sklearn.preprocessing import Binarizer
|
||||||
|
import joblib
|
||||||
|
|
||||||
|
app = Flask(__name__)
|
||||||
|
|
||||||
|
# Загрузка данных
|
||||||
|
data_bgg = pd.read_csv("bgg_dataset.csv", delimiter=";")
|
||||||
|
|
||||||
|
# Выбор нужных столбцов
|
||||||
|
selected_columns_bgg = ['Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average']
|
||||||
|
features = data_bgg[selected_columns_bgg]
|
||||||
|
|
||||||
|
# Замена запятых на точки в столбцах 'Users Rated' и 'Owned Users'
|
||||||
|
features['Rating Average'] = features['Rating Average'].str.replace(',', '.').astype(float)
|
||||||
|
features['Complexity Average'] = features['Complexity Average'].str.replace(',', '.').astype(float)
|
||||||
|
|
||||||
|
# Замена пропущенных значений средними значениями по столбцам
|
||||||
|
features = features.fillna(features.mean())
|
||||||
|
|
||||||
|
# Определение порога для классификации (средний рейтинг)
|
||||||
|
threshold = features['Rating Average'].mean()
|
||||||
|
|
||||||
|
# Разделение данных
|
||||||
|
X_bgg = features.drop('Rating Average', axis=1)
|
||||||
|
y_bgg = features['Rating Average'] > threshold # Классификация: 1 - выше среднего, 0 - ниже среднего
|
||||||
|
X_train_bgg, X_test_bgg, y_train_bgg, y_test_bgg = train_test_split(X_bgg, y_bgg, test_size=0.2, random_state=42)
|
||||||
|
|
||||||
|
# Обучение модели логистической регрессии
|
||||||
|
logistic_regression_model = Pipeline([
|
||||||
|
('binarizer', Binarizer(threshold=threshold)),
|
||||||
|
('logistic_regression', LogisticRegression())
|
||||||
|
])
|
||||||
|
logistic_regression_model.fit(X_train_bgg, y_train_bgg)
|
||||||
|
|
||||||
|
# Сохранение модели
|
||||||
|
joblib.dump(logistic_regression_model, 'logistic_regression_model.joblib')
|
||||||
|
|
||||||
|
# Загрузка модели
|
||||||
|
logistic_regression_model = joblib.load('logistic_regression_model.joblib')
|
||||||
|
|
||||||
|
# Обновление маршрута для предсказания
|
||||||
|
@app.route('/')
|
||||||
|
def index():
|
||||||
|
return render_template('index.html')
|
||||||
|
|
||||||
|
@app.route('/predict', methods=['POST'])
|
||||||
|
def predict():
|
||||||
|
if request.method == 'POST':
|
||||||
|
# Получение данных из формы
|
||||||
|
input_data_bgg = {
|
||||||
|
'Year Published': int(request.form['Year Published']),
|
||||||
|
'Users Rated': int(request.form['Users Rated']),
|
||||||
|
'BGG Rank': int(request.form['BGG Rank']),
|
||||||
|
'Owned Users': int(request.form['Owned Users']),
|
||||||
|
'Complexity Average': float(request.form['Complexity Average'])
|
||||||
|
}
|
||||||
|
|
||||||
|
# Преобразование данных в DataFrame
|
||||||
|
input_df_bgg = pd.DataFrame([input_data_bgg])
|
||||||
|
|
||||||
|
# Предсказание
|
||||||
|
prediction_bgg = logistic_regression_model.predict(input_df_bgg)[0]
|
||||||
|
|
||||||
|
return render_template('index.html', prediction_bgg=prediction_bgg)
|
||||||
|
|
||||||
|
if __name__ == '__main__':
|
||||||
|
app.run(debug=True)
|
20344
volkov_rafael_lab_5/bgg_dataset.csv
Normal file
20344
volkov_rafael_lab_5/bgg_dataset.csv
Normal file
File diff suppressed because it is too large
Load Diff
BIN
volkov_rafael_lab_5/linear_regression_model.joblib
Normal file
BIN
volkov_rafael_lab_5/linear_regression_model.joblib
Normal file
Binary file not shown.
BIN
volkov_rafael_lab_5/logistic_regression_model.joblib
Normal file
BIN
volkov_rafael_lab_5/logistic_regression_model.joblib
Normal file
Binary file not shown.
35
volkov_rafael_lab_5/readme.md
Normal file
35
volkov_rafael_lab_5/readme.md
Normal file
@ -0,0 +1,35 @@
|
|||||||
|
Общее задание:
|
||||||
|
Использовать регрессию по варианту для данных из курсовой работы, самостоятельно сформулировав задачу.
|
||||||
|
Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
|
||||||
|
|
||||||
|
Задание по вариантам:
|
||||||
|
алгоритм Логистическая регрессия
|
||||||
|
Датасет: Board Games
|
||||||
|
Ссылки:
|
||||||
|
https://www.kaggle.com/datasets/andrewmvd/board-games
|
||||||
|
|
||||||
|
Задача для регрессии: предсказать будет ли рейтинг игры выше среднего или ниже на основе характеристик: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'
|
||||||
|
|
||||||
|
Запуск через файл app.py
|
||||||
|
|
||||||
|
Программа использует следующие технологии:
|
||||||
|
|
||||||
|
Flask: для создания веб-приложения.
|
||||||
|
pandas: для работы с данными в формате CSV.
|
||||||
|
scikit-learn: для обучения и использования моделей машинного обучения (Linear Regression и Logistic Regression).
|
||||||
|
joblib: для сохранения и загрузки обученных моделей.
|
||||||
|
Описание работы программы:
|
||||||
|
|
||||||
|
Программа загружает данные из файла "bgg_dataset.csv", используя библиотеку pandas.
|
||||||
|
Выбираются нужные столбцы: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'.
|
||||||
|
Производится замена запятых на точки в столбцах 'Rating Average' и 'Complexity Average'.
|
||||||
|
Пропущенные значения в данных заменяются средними значениями по соответствующим столбцам.
|
||||||
|
Данные разделяются на обучающий и тестовый наборы.
|
||||||
|
Создается и обучается модель (линейной или логистической регрессии) с использованием scikit-learn и сохраняется в файле.
|
||||||
|
Веб-приложение на Flask запускается локально.
|
||||||
|
Пользователь взаимодействует с веб-формой, вводя параметры игры (Year Published, Users Rated, BGG Rank, Owned Users, Complexity Average).
|
||||||
|
Введенные данные передаются в обученную модель, которая делает предсказание.
|
||||||
|
Предсказание выводится на веб-странице.
|
||||||
|
Входные данные: параметры игры (Year Published, Users Rated, BGG Rank, Owned Users, Complexity Average) через веб-форму.
|
||||||
|
|
||||||
|
Выходные данные: предсказание (например, классификация игры как "выше среднего"(1) или "ниже среднего"(0)) на веб-странице.
|
36
volkov_rafael_lab_5/templates/index.html
Normal file
36
volkov_rafael_lab_5/templates/index.html
Normal file
@ -0,0 +1,36 @@
|
|||||||
|
<!DOCTYPE html>
|
||||||
|
<html lang="en">
|
||||||
|
<head>
|
||||||
|
<meta charset="UTF-8">
|
||||||
|
<meta name="viewport" content="width=device-width, initial-scale=1.0">
|
||||||
|
<title>Board Game Rating Prediction</title>
|
||||||
|
</head>
|
||||||
|
<body>
|
||||||
|
<h1>Board Game Rating Prediction</h1>
|
||||||
|
|
||||||
|
<!-- Форма для ввода данных -->
|
||||||
|
<form method="post" action="/predict">
|
||||||
|
<label for="Year Published">Year Published:</label>
|
||||||
|
<input type="number" name="Year Published" required><br>
|
||||||
|
|
||||||
|
<label for="Users Rated">Users Rated:</label>
|
||||||
|
<input type="number" name="Users Rated" required><br>
|
||||||
|
|
||||||
|
<label for="BGG Rank">BGG Rank:</label>
|
||||||
|
<input type="number" name="BGG Rank" required><br>
|
||||||
|
|
||||||
|
<label for="Owned Users">Owned Users:</label>
|
||||||
|
<input type="number" name="Owned Users" required><br>
|
||||||
|
|
||||||
|
<label for="Complexity Average">Complexity Average:</label>
|
||||||
|
<input type="number" step="0.01" name="Complexity Average" required><br>
|
||||||
|
|
||||||
|
<button type="submit">Predict Rating Average</button>
|
||||||
|
</form>
|
||||||
|
|
||||||
|
<!-- Отображение предсказания -->
|
||||||
|
{% if prediction_bgg %}
|
||||||
|
<p>Predicted Rating Average: {{ prediction_bgg }}</p>
|
||||||
|
{% endif %}
|
||||||
|
</body>
|
||||||
|
</html>
|
Loading…
Reference in New Issue
Block a user