IIS_2023_1/kamyshov_danila_lab_6/app.py

83 lines
3.3 KiB
Python
Raw Permalink Normal View History

2023-12-06 13:43:48 +04:00
from flask import Flask, request, render_template
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import make_pipeline
# Создание экземпляра Flask
app = Flask(__name__)
# Загрузка данных из файла
data = pd.read_csv("student-mat.csv")
# Подготовка данных
X = data[["Pstatus", "guardian", "internet", "romantic", "famrel", "freetime", "goout", "Dalc", "Walc", "health", "absences"]]
y = data["G3"]
# Преобразование категориальных признаков в числовые
label_encoders = {}
for column in ["Pstatus", "guardian", "internet", "romantic"]:
label_encoder = LabelEncoder()
X[column] = label_encoder.fit_transform(X[column])
label_encoders[column] = label_encoder
# Разделение данных на обучающий и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Преобразование данных
preprocessor = ColumnTransformer(
transformers=[('num', StandardScaler(), X.columns)],
remainder='passthrough'
)
# Создание модели MLPClassifier
mlp_classifier = MLPClassifier(
hidden_layer_sizes=(100, 50), # Увеличим количество нейронов и слоев
max_iter=1000,
random_state=42
)
# Создание конвейера для обработки данных и обучения модели
model = make_pipeline(preprocessor, mlp_classifier)
# Обучение модели
model.fit(X_train, y_train)
# Маршрут для отображения HTML-формы
@app.route('/', methods=['GET'])
def index():
return render_template('index.html')
# Маршрут для предсказания оценки
@app.route('/predict', methods=['POST'])
def predict():
data = request.form.to_dict()
# Подготовка данных для предсказания
input_data = [data.get(feature, 0) for feature in X.columns]
# Преобразование категориальных признаков в числовые с использованием сохраненных LabelEncoder
for column, label_encoder in label_encoders.items():
input_data[X.columns.get_loc(column)] = label_encoder.transform([input_data[X.columns.get_loc(column)]])
# Преобразование в DataFrame
input_df = pd.DataFrame([input_data], columns=X.columns)
# Дополним признаки, если какие-то из них отсутствуют в данных
missing_features = set(X.columns) - set(input_df.columns)
for feature in missing_features:
input_df[feature] = 0
# Сортировка столбцов в том же порядке, что и при обучении модели
input_df = input_df[X.columns]
# Предсказание с использованием обученной модели
prediction = model.predict(input_df)[0]
return f"Предсказанная оценка: {prediction}"
if __name__ == '__main__':
app.run(port=5000)