diff --git a/lab_4/lab_4.ipynb b/lab_4/lab_4.ipynb new file mode 100644 index 0000000..a88831b --- /dev/null +++ b/lab_4/lab_4.ipynb @@ -0,0 +1,1935 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Начало лабораторной работы" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Index(['age', 'sex', 'bmi', 'children', 'smoker', 'region', 'charges'], dtype='object')\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "print(df.columns)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Бизнес-цели" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:\n", + "\n", + "Цель: Разработать модель, которая будет предсказывать стоимость страховых взносов для новых клиентов на основе их характеристик (возраст, пол, ИМТ, количество детей, статус курения, регион проживания).\n", + "\n", + "Применение:\n", + "Клиенты могут получить представление о примерной стоимости страховки до обращения в компанию.\n", + "\n", + "2. Оптимизация тарифной сетки:\n", + "\n", + "Цель: Определить оптимальные коэффициенты для различных факторов, влияющих на стоимость страховки (например, возраст, ИМТ, статус курения), чтобы максимизировать прибыль компании при сохранении конкурентоспособных тарифов.\n", + "\n", + "Применение:\n", + "Страховые компании могут использовать эти коэффициенты для корректировки тарифной сетки и повышения эффективности бизнеса." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:" + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Среднее значение поля 'charges': 13261.369959046897\n", + " age sex bmi children smoker region charges \\\n", + "0 19 female 27.900 0 yes southwest 16884.92400 \n", + "1 18 male 33.770 1 no southeast 1725.55230 \n", + "2 28 male 33.000 3 no southeast 4449.46200 \n", + "3 33 male 22.705 0 no northwest 21984.47061 \n", + "4 32 male 28.880 0 no northwest 3866.85520 \n", + "\n", + " above_average_charges charges_volatility \n", + "0 1 62648.55411 \n", + "1 0 62648.55411 \n", + "2 0 62648.55411 \n", + "3 1 62648.55411 \n", + "4 0 62648.55411 \n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Устанавливаем случайное состояние\n", + "random_state = 42\n", + "\n", + "# Рассчитываем среднее значение стоимости страховых взносов\n", + "average_charges = df['charges'].mean()\n", + "print(f\"Среднее значение поля 'charges': {average_charges}\")\n", + "\n", + "# Создаем новую переменную, указывающую, превышает ли стоимость страховых взносов среднюю\n", + "df['above_average_charges'] = (df['charges'] > average_charges).astype(int)\n", + "\n", + "# Рассчитываем волатильность (разницу между максимальной и минимальной стоимостью страховых взносов)\n", + "df['charges_volatility'] = df['charges'].max() - df['charges'].min()\n", + "\n", + "# Выводим первые строки измененной таблицы для проверки\n", + "print(df.head())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "2. Оптимизация тарифной сетки:" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Средняя стоимость страховых взносов для 'age':\n", + "age\n", + "18 6714.267794\n", + "19 9634.641344\n", + "20 10159.697736\n", + "21 5349.737625\n", + "22 10675.132648\n", + "23 12050.721224\n", + "24 10648.015962\n", + "25 9610.781531\n", + "26 5955.403311\n", + "27 13130.462272\n", + "28 8757.474523\n", + "29 10430.158727\n", + "30 13580.480238\n", + "31 10196.980573\n", + "32 10071.740266\n", + "33 12118.482617\n", + "34 11613.528121\n", + "35 11307.182031\n", + "36 12204.476138\n", + "37 17595.511688\n", + "38 8102.733674\n", + "39 11468.895088\n", + "40 11772.251310\n", + "41 9533.603123\n", + "42 13061.038669\n", + "43 19267.278653\n", + "44 16439.727524\n", + "45 14404.055995\n", + "46 14201.069951\n", + "47 18153.128652\n", + "48 14632.500445\n", + "49 12696.006264\n", + "50 15663.003301\n", + "51 15452.800438\n", + "52 18951.581034\n", + "53 15795.645012\n", + "54 18252.834139\n", + "55 16164.545488\n", + "56 14727.018377\n", + "57 16283.671944\n", + "58 13815.290525\n", + "59 18639.637165\n", + "60 21979.418507\n", + "61 22024.457609\n", + "62 18926.646066\n", + "63 19884.998461\n", + "64 24419.101775\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'sex':\n", + "sex\n", + "female 12486.831977\n", + "male 14013.872721\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'bmi':\n", + "bmi\n", + "15.960 1694.796400\n", + "16.815 4904.000350\n", + "17.195 14455.644050\n", + "17.290 7813.353433\n", + "17.385 2775.192150\n", + " ... \n", + "48.070 9432.925300\n", + "49.060 11381.325400\n", + "50.380 2438.055200\n", + "52.580 44501.398200\n", + "53.130 1163.462700\n", + "Name: charges, Length: 548, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'children':\n", + "children\n", + "0 12317.920881\n", + "1 12722.650521\n", + "2 15268.182723\n", + "3 15304.070620\n", + "4 13550.983876\n", + "5 8706.036629\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'smoker':\n", + "smoker\n", + "no 8417.874411\n", + "yes 32223.139764\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'region':\n", + "region\n", + "northeast 13475.874737\n", + "northwest 12463.129315\n", + "southeast 14748.777706\n", + "southwest 12164.196435\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'age' и 'smoker':\n", + "age smoker\n", + "18 no 3083.404099\n", + " yes 25473.730221\n", + "19 no 3492.047133\n", + " yes 26445.951817\n", + "20 no 3673.112925\n", + " ... \n", + "62 yes 37084.607312\n", + "63 no 14205.335706\n", + " yes 40331.784380\n", + "64 no 15805.350545\n", + " yes 40569.885331\n", + "Name: charges, Length: 94, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'bmi' и 'smoker':\n", + "bmi smoker\n", + "15.960 no 1694.79640\n", + "16.815 no 4904.00035\n", + "17.195 yes 14455.64405\n", + "17.290 no 5305.30260\n", + " yes 12829.45510\n", + " ... \n", + "48.070 no 9432.92530\n", + "49.060 no 11381.32540\n", + "50.380 no 2438.05520\n", + "52.580 yes 44501.39820\n", + "53.130 no 1163.46270\n", + "Name: charges, Length: 701, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'region' и 'smoker':\n", + "region smoker\n", + "northeast no 9225.395851\n", + " yes 29790.212814\n", + "northwest no 8681.948181\n", + " yes 29959.103039\n", + "southeast no 7887.181702\n", + " yes 35262.090761\n", + "southwest no 7956.579615\n", + " yes 32346.494062\n", + "Name: charges, dtype: float64\n", + "\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Устанавливаем случайное состояние\n", + "random_state = 42\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для каждого значения каждого признака\n", + "for column in ['age', 'sex', 'bmi', 'children', 'smoker', 'region']:\n", + " print(f\"Средняя стоимость страховых взносов для '{column}':\")\n", + " print(df.groupby(column)['charges'].mean())\n", + " print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинаций признаков\n", + "# для комбинации 'age' и 'smoker'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'age' и 'smoker':\")\n", + "print(df.groupby(['age', 'smoker'])['charges'].mean())\n", + "print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинации 'bmi' и 'smoker'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'bmi' и 'smoker':\")\n", + "print(df.groupby(['bmi', 'smoker'])['charges'].mean())\n", + "print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинации 'region' и 'smoker'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'region' и 'smoker':\")\n", + "print(df.groupby(['region', 'smoker'])['charges'].mean())\n", + "print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Выбор ориентира для каждой задачи:\n", + "1. Прогнозирование стоимости страховых взносов:\n", + "Ориентир:\n", + "\n", + "R² (коэффициент детерминации): 0.75 - 0.85\n", + "\n", + "MAE (средняя абсолютная ошибка): 2000 - 3000 долларов\n", + "\n", + "RMSE (среднеквадратичная ошибка): 3000 - 5000 долларов\n", + "\n", + "Объяснение:\n", + "\n", + "R²: Значение 0.75 - 0.85 будет означать, что модель объясняет 75-85% вариации стоимости страховых взносов, что является хорошим результатом для задачи регрессии.\n", + "\n", + "MAE: Значение 2000 - 3000 долларов будет означать, что в среднем модель ошибается на 2000 - 3000 долларов при прогнозировании стоимости страховых взносов.\n", + "\n", + "RMSE: Значение 3000 - 5000 долларов будет означать, что среднеквадратичная ошибка модели составляет 3000 - 4000 долларов.\n", + "\n", + "2. Оптимизация тарифной сетки:\n", + "Ориентир:\n", + "\n", + "Увеличение прибыли компании: 5% - 10%\n", + "\n", + "Сохранение конкурентоспособных тарифов:\n", + "\n", + "Средняя стоимость страховых взносов не должна увеличиваться более чем на 5% по сравнению с текущими тарифами.\n", + "\n", + "Доля клиентов, считающих тарифы дорогими, не должна увеличиваться более чем на 2%.\n", + "\n", + "Объяснение:\n", + "\n", + "Увеличение прибыли компании: Цель оптимизации тарифной сетки - максимизировать прибыль компании. Ориентир в 5% - 10% увеличения прибыли является реалистичным и достижимым.\n", + "\n", + "Сохранение конкурентоспособных тарифов: Важно, чтобы оптимизация тарифной сетки не привела к значительному увеличению стоимости страховых взносов для клиентов. Ориентир в 5% увеличения средней стоимости страховых взносов и 2% увеличения доли клиентов, считающих тарифы дорогими, позволяет сохранить конкурентоспособность компании." + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "MAE: 4160.247974762991\n", + "MSE: 39933194.54805147\n", + "RMSE: 6319.271678607549\n", + "R²: 0.73981661775643\n", + "Ориентиры для прогнозирования стоимости страховых взносов не достигнуты.\n", + "Средняя стоимость страховых взносов для 'age':\n", + "age\n", + "18 6714.267794\n", + "19 9634.641344\n", + "20 10159.697736\n", + "21 5349.737625\n", + "22 10675.132648\n", + "23 12050.721224\n", + "24 10648.015962\n", + "25 9610.781531\n", + "26 5955.403311\n", + "27 13130.462272\n", + "28 8757.474523\n", + "29 10430.158727\n", + "30 13580.480238\n", + "31 10196.980573\n", + "32 10071.740266\n", + "33 12118.482617\n", + "34 11613.528121\n", + "35 11307.182031\n", + "36 12204.476138\n", + "37 17595.511688\n", + "38 8102.733674\n", + "39 11468.895088\n", + "40 11772.251310\n", + "41 9533.603123\n", + "42 13061.038669\n", + "43 19267.278653\n", + "44 16439.727524\n", + "45 14404.055995\n", + "46 14201.069951\n", + "47 18153.128652\n", + "48 14632.500445\n", + "49 12696.006264\n", + "50 15663.003301\n", + "51 15452.800438\n", + "52 18951.581034\n", + "53 15795.645012\n", + "54 18252.834139\n", + "55 16164.545488\n", + "56 14727.018377\n", + "57 16283.671944\n", + "58 13815.290525\n", + "59 18639.637165\n", + "60 21979.418507\n", + "61 22024.457609\n", + "62 18926.646066\n", + "63 19884.998461\n", + "64 24419.101775\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'bmi':\n", + "bmi\n", + "15.960 1694.796400\n", + "16.815 4904.000350\n", + "17.195 14455.644050\n", + "17.290 7813.353433\n", + "17.385 2775.192150\n", + " ... \n", + "48.070 9432.925300\n", + "49.060 11381.325400\n", + "50.380 2438.055200\n", + "52.580 44501.398200\n", + "53.130 1163.462700\n", + "Name: charges, Length: 548, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'children':\n", + "children\n", + "0 12317.920881\n", + "1 12722.650521\n", + "2 15268.182723\n", + "3 15304.070620\n", + "4 13550.983876\n", + "5 8706.036629\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'sex_male':\n", + "sex_male\n", + "False 12486.831977\n", + "True 14013.872721\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'smoker_yes':\n", + "smoker_yes\n", + "False 8417.874411\n", + "True 32223.139764\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'region_northwest':\n", + "region_northwest\n", + "False 13512.808188\n", + "True 12463.129315\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'region_southeast':\n", + "region_southeast\n", + "False 12693.396712\n", + "True 14748.777706\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для 'region_southwest':\n", + "region_southwest\n", + "False 13620.788872\n", + "True 12164.196435\n", + "Name: charges, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'age' и 'smoker_yes':\n", + "age smoker_yes\n", + "18 False 3083.404099\n", + " True 25473.730221\n", + "19 False 3492.047133\n", + " True 26445.951817\n", + "20 False 3673.112925\n", + " ... \n", + "62 True 37084.607312\n", + "63 False 14205.335706\n", + " True 40331.784380\n", + "64 False 15805.350545\n", + " True 40569.885331\n", + "Name: charges, Length: 94, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'bmi' и 'smoker_yes':\n", + "bmi smoker_yes\n", + "15.960 False 1694.79640\n", + "16.815 False 4904.00035\n", + "17.195 True 14455.64405\n", + "17.290 False 5305.30260\n", + " True 12829.45510\n", + " ... \n", + "48.070 False 9432.92530\n", + "49.060 False 11381.32540\n", + "50.380 False 2438.05520\n", + "52.580 True 44501.39820\n", + "53.130 False 1163.46270\n", + "Name: charges, Length: 701, dtype: float64\n", + "\n", + "Средняя стоимость страховых взносов для комбинации 'region_northwest' и 'smoker_yes':\n", + "region_northwest smoker_yes\n", + "False False 8331.120934\n", + " True 32822.144996\n", + "True False 8681.948181\n", + " True 29959.103039\n", + "Name: charges, dtype: float64\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression\n", + "from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Преобразуем категориальные переменные в числовые\n", + "df = pd.get_dummies(df, columns=['sex', 'smoker', 'region'], drop_first=True)\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y)\n", + "X = df.drop('charges', axis=1)\n", + "y = df['charges']\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки\n", + "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)\n", + "\n", + "# Стандартизируем признаки\n", + "scaler = StandardScaler()\n", + "X_train = scaler.fit_transform(X_train)\n", + "X_test = scaler.transform(X_test)\n", + "\n", + "# Обучаем модель линейной регрессии\n", + "model = LinearRegression()\n", + "model.fit(X_train, y_train)\n", + "\n", + "# Делаем предсказания на тестовой выборке\n", + "y_pred = model.predict(X_test)\n", + "\n", + "# Оцениваем качество модели\n", + "mae = mean_absolute_error(y_test, y_pred)\n", + "mse = mean_squared_error(y_test, y_pred)\n", + "rmse = mean_squared_error(y_test, y_pred, squared=False)\n", + "r2 = r2_score(y_test, y_pred)\n", + "\n", + "print(f\"MAE: {mae}\")\n", + "print(f\"MSE: {mse}\")\n", + "print(f\"RMSE: {rmse}\")\n", + "print(f\"R²: {r2}\")\n", + "\n", + "# Проверяем, достигнуты ли ориентиры\n", + "if r2 >= 0.75 and mae <= 3000 and rmse <= 5000:\n", + " print(\"Ориентиры для прогнозирования стоимости страховых взносов достигнуты!\")\n", + "else:\n", + " print(\"Ориентиры для прогнозирования стоимости страховых взносов не достигнуты.\")\n", + "\n", + "# Оптимизация тарифной сетки\n", + "# Убедитесь, что столбцы существуют\n", + "columns_to_group = ['age', 'bmi', 'children', 'sex_male', 'smoker_yes', 'region_northwest', 'region_southeast', 'region_southwest']\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для каждого значения каждого признака\n", + "for column in columns_to_group:\n", + " print(f\"Средняя стоимость страховых взносов для '{column}':\")\n", + " print(df.groupby(column)['charges'].mean())\n", + " print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинаций признаков\n", + "# Например, для комбинации 'age' и 'smoker_yes'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'age' и 'smoker_yes':\")\n", + "print(df.groupby(['age', 'smoker_yes'])['charges'].mean())\n", + "print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинации 'bmi' и 'smoker_yes'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'bmi' и 'smoker_yes':\")\n", + "print(df.groupby(['bmi', 'smoker_yes'])['charges'].mean())\n", + "print()\n", + "\n", + "# Рассчитываем среднюю стоимость страховых взносов для комбинации 'region_northwest' и 'smoker_yes'\n", + "print(\"Средняя стоимость страховых взносов для комбинации 'region_northwest' и 'smoker_yes':\")\n", + "print(df.groupby(['region_northwest', 'smoker_yes'])['charges'].mean())\n", + "print()\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Анализ применимости алгоритмов обучения с учителем для решения поставленных задач:\n", + "1. Прогнозирование стоимости страховых взносов:\n", + "Задача: Регрессия\n", + "\n", + "Свойства алгоритмов:\n", + "\n", + "Линейная регрессия:\n", + "Применимость: Хорошо подходит для задач, где зависимость между признаками и целевой переменной линейна.\n", + "Преимущества: Проста в реализации, интерпретируема.\n", + "Недостатки: Может плохо работать, если зависимость нелинейна.\n", + "\n", + "Деревья решений (регрессия):\n", + "Применимость: Подходит для задач с нелинейными зависимостями.\n", + "Преимущества: Может обрабатывать категориальные признаки, не требует масштабирования данных.\n", + "Недостатки: Подвержены переобучению, могут давать нестабильные результаты.\n", + "\n", + "Случайный лес (регрессия):\n", + "Применимость: Хорошо подходит для задач с нелинейными зависимостями и большим количеством признаков.\n", + "Преимущества: Устойчив к переобучению, может обрабатывать категориальные признаки.\n", + "Недостатки: Менее интерпретируем, чем линейная регрессия.\n", + "\n", + "Градиентный бустинг (регрессия):\n", + "Применимость: Подходит для задач с нелинейными зависимостями и сложными взаимосвязями между признаками.\n", + "Преимущества: Может достигать высокой точности, устойчив к переобучению.\n", + "Недостатки: Сложнее в настройке, чем случайный лес, менее интерпретируем.\n", + "\n", + "Нейронные сети (регрессия):\n", + "Применимость: Подходит для задач с очень сложными зависимостями и большим количеством данных.\n", + "Преимущества: Может моделировать очень сложные зависимости.\n", + "Недостатки: Требует большого количества данных, сложнее в настройке и интерпретации.\n", + "\n", + "Вывод:\n", + "\n", + "Линейная регрессия: Может быть хорошим выбором для начала, особенно если зависимость между признаками и целевой переменной линейна.\n", + "\n", + "Деревья решений и случайный лес: Подходят для задач с нелинейными зависимостями.\n", + "\n", + "Градиентный бустинг: Может давать более высокую точность, чем случайный лес, но требует больше времени на настройку.\n", + "\n", + "Нейронные сети: Могут быть излишними для этой задачи, если данных недостаточно много.\n", + "\n", + "2. Оптимизация тарифной сетки:\n", + "Задача: Классификация (группировка клиентов по группам риска)\n", + "\n", + "Свойства алгоритмов:\n", + "\n", + "Логистическая регрессия:\n", + "Применимость: Хорошо подходит для задач бинарной классификации, где зависимость между признаками и целевой переменной линейна.\n", + "Преимущества: Проста в реализации, интерпретируема.\n", + "Недостатки: Может плохо работать, если зависимость нелинейна.\n", + "\n", + "Деревья решений (классификация):\n", + "Применимость: Подходит для задач с нелинейными зависимостями.\n", + "Преимущества: Может обрабатывать категориальные признаки, не требует масштабирования данных.\n", + "Недостатки: Подвержены переобучению, могут давать нестабильные результаты.\n", + "\n", + "Случайный лес (классификация):\n", + "Применимость: Хорошо подходит для задач с нелинейными зависимостями и большим количеством признаков.\n", + "Преимущества: Устойчив к переобучению, может обрабатывать категориальные признаки.\n", + "Недостатки: Менее интерпретируем, чем линейная регрессия.\n", + "\n", + "Градиентный бустинг (классификация):\n", + "Применимость: Подходит для задач с нелинейными зависимостями и сложными взаимосвязями между признаками.\n", + "Преимущества: Может достигать высокой точности, устойчив к переобучению.\n", + "Недостатки: Сложнее в настройке, чем случайный лес, менее интерпретируем.\n", + "\n", + "Нейронные сети (классификация):\n", + "Применимость: Подходит для задач с очень сложными зависимостями и большим количеством данных.\n", + "Преимущества: Может моделировать очень сложные зависимости.\n", + "Недостатки: Требует большого количества данных, сложнее в настройке и интерпретации.\n", + "\n", + "Вывод:\n", + "\n", + "Логистическая регрессия: Может быть хорошим выбором для начала, особенно если зависимость между признаками и целевой переменной линейна.\n", + "\n", + "Деревья решений и случайный лес: Подходят для задач с нелинейными зависимостями.\n", + "\n", + "Градиентный бустинг: Может давать более высокую точность, чем случайный лес, но требует больше времени на настройку.\n", + "\n", + "Нейронные сети: Могут быть излишними для этой задачи, если данных недостаточно много.\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:\n", + "Выбранные модели:\n", + "\n", + "Линейная регрессия\n", + "\n", + "Случайный лес (регрессия)\n", + "\n", + "Градиентный бустинг (регрессия)\n", + "\n", + "2. Оптимизация тарифной сетки:\n", + "Выбранные модели:\n", + "\n", + "Логистическая регрессия\n", + "\n", + "Случайный лес (классификация)\n", + "\n", + "Градиентный бустинг (классификация)" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи регрессии:\n", + "Model: Linear Regression\n", + "MAE: 4160.247974762991\n", + "MSE: 39933194.54805147\n", + "RMSE: 6319.271678607549\n", + "R²: 0.73981661775643\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n", + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n", + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Random Forest Regression\n", + "MAE: 1303.0047135437117\n", + "MSE: 7810682.767902057\n", + "RMSE: 2794.759876608732\n", + "R²: 0.9491097598580805\n", + "\n", + "Model: Gradient Boosting Regression\n", + "MAE: 2297.7789526178262\n", + "MSE: 19231434.89568898\n", + "RMSE: 4385.365993356652\n", + "R²: 0.8746982345593103\n", + "\n", + "Результаты для задачи классификации:\n", + "Model: Logistic Regression\n", + "Accuracy: 0.8864864864864865\n", + "\n", + "Model: Random Forest Classification\n", + "Accuracy: 0.9765765765765766\n", + "\n", + "Model: Gradient Boosting Classification\n", + "Accuracy: 0.9225225225225225\n", + "\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression, LogisticRegression\n", + "from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier\n", + "from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier\n", + "from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, accuracy_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Преобразуем категориальные переменные в числовые\n", + "df = pd.get_dummies(df, columns=['sex', 'smoker', 'region'], drop_first=True)\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df.drop('charges', axis=1)\n", + "y_reg = df['charges']\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи регрессии\n", + "X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)\n", + "\n", + "# Стандартизируем признаки для задачи регрессии\n", + "scaler_reg = StandardScaler()\n", + "X_train_reg = scaler_reg.fit_transform(X_train_reg)\n", + "X_test_reg = scaler_reg.transform(X_test_reg)\n", + "\n", + "# Список моделей для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": LinearRegression(),\n", + " \"Random Forest Regression\": RandomForestRegressor(),\n", + " \"Gradient Boosting Regression\": GradientBoostingRegressor()\n", + "}\n", + "\n", + "# Обучаем и оцениваем модели для задачи регрессии\n", + "print(\"Результаты для задачи регрессии:\")\n", + "for name, model in models_reg.items():\n", + " model.fit(X_train_reg, y_train_reg)\n", + " y_pred_reg = model.predict(X_test_reg)\n", + " mae = mean_absolute_error(y_test_reg, y_pred_reg)\n", + " mse = mean_squared_error(y_test_reg, y_pred_reg)\n", + " rmse = mean_squared_error(y_test_reg, y_pred_reg, squared=False)\n", + " r2 = r2_score(y_test_reg, y_pred_reg)\n", + " print(f\"Model: {name}\")\n", + " print(f\"MAE: {mae}\")\n", + " print(f\"MSE: {mse}\")\n", + " print(f\"RMSE: {rmse}\")\n", + " print(f\"R²: {r2}\")\n", + " print()\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df.drop('charges', axis=1)\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи классификации\n", + "X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(X_class, y_class, test_size=0.2, random_state=42)\n", + "\n", + "# Стандартизируем признаки для задачи классификации\n", + "scaler_class = StandardScaler()\n", + "X_train_class = scaler_class.fit_transform(X_train_class)\n", + "X_test_class = scaler_class.transform(X_test_class)\n", + "\n", + "# Список моделей для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": LogisticRegression(),\n", + " \"Random Forest Classification\": RandomForestClassifier(),\n", + " \"Gradient Boosting Classification\": GradientBoostingClassifier()\n", + "}\n", + "\n", + "# Обучаем и оцениваем модели для задачи классификации\n", + "print(\"Результаты для задачи классификации:\")\n", + "for name, model in models_class.items():\n", + " model.fit(X_train_class, y_train_class)\n", + " y_pred_class = model.predict(X_test_class)\n", + " accuracy = accuracy_score(y_test_class, y_pred_class)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Accuracy: {accuracy}\")\n", + " print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:\n", + "Конвейер для задачи регрессии:" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи регрессии:\n", + "Model: Linear Regression\n", + "MAE: 4158.694987099099\n", + "MSE: 39908584.112821\n", + "RMSE: 6317.32412599045\n", + "R²: 0.7399769662171334\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Random Forest Regression\n", + "MAE: 1302.1428312961073\n", + "MSE: 7363635.134840652\n", + "RMSE: 2713.6018747857343\n", + "R²: 0.9520224836336337\n", + "\n", + "Model: Gradient Boosting Regression\n", + "MAE: 2304.718628546955\n", + "MSE: 19256343.733882822\n", + "RMSE: 4388.205069716184\n", + "R²: 0.8745359418641633\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n", + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression\n", + "from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Список моделей для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": LinearRegression(),\n", + " \"Random Forest Regression\": RandomForestRegressor(),\n", + " \"Gradient Boosting Regression\": GradientBoostingRegressor()\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df[categorical_cols + numerical_cols]\n", + "y_reg = df['charges']\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи регрессии\n", + "X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи регрессии\n", + "print(\"Результаты для задачи регрессии:\")\n", + "for name, model in models_reg.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " pipeline.fit(X_train_reg, y_train_reg)\n", + " y_pred_reg = pipeline.predict(X_test_reg)\n", + " mae = mean_absolute_error(y_test_reg, y_pred_reg)\n", + " mse = mean_squared_error(y_test_reg, y_pred_reg)\n", + " rmse = mean_squared_error(y_test_reg, y_pred_reg, squared=False)\n", + " r2 = r2_score(y_test_reg, y_pred_reg)\n", + " print(f\"Model: {name}\")\n", + " print(f\"MAE: {mae}\")\n", + " print(f\"MSE: {mse}\")\n", + " print(f\"RMSE: {rmse}\")\n", + " print(f\"R²: {r2}\")\n", + " print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "2. Оптимизация тарифной сетки:\n", + "Конвейер для задачи классификации:" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи классификации:\n", + "Model: Logistic Regression\n", + "Accuracy: 0.8846846846846846\n", + "\n", + "Model: Random Forest Classification\n", + "Accuracy: 0.9801801801801802\n", + "\n", + "Model: Gradient Boosting Classification\n", + "Accuracy: 0.9243243243243243\n", + "\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LogisticRegression\n", + "from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "from sklearn.metrics import accuracy_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Список моделей для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": LogisticRegression(),\n", + " \"Random Forest Classification\": RandomForestClassifier(),\n", + " \"Gradient Boosting Classification\": GradientBoostingClassifier()\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df[categorical_cols + numerical_cols]\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи классификации\n", + "X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(X_class, y_class, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи классификации\n", + "print(\"Результаты для задачи классификации:\")\n", + "for name, model in models_class.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " pipeline.fit(X_train_class, y_train_class)\n", + " y_pred_class = pipeline.predict(X_test_class)\n", + " accuracy = accuracy_score(y_test_class, y_pred_class)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Accuracy: {accuracy}\")\n", + " print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:\n", + "\n", + "Настройка гиперпараметров для задачи регрессии:" + ] + }, + { + "cell_type": "code", + "execution_count": 17, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи регрессии:\n", + "Model: Linear Regression\n", + "Best Parameters: {}\n", + "MAE: 4158.694987099099\n", + "MSE: 39908584.112821\n", + "RMSE: 6317.32412599045\n", + "R²: 0.7399769662171334\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n", + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Random Forest Regression\n", + "Best Parameters: {'model__max_depth': None, 'model__n_estimators': 200}\n", + "MAE: 1292.4041719905688\n", + "MSE: 7345926.566814439\n", + "RMSE: 2710.3369839956135\n", + "R²: 0.9521378632113484\n", + "\n", + "Model: Gradient Boosting Regression\n", + "Best Parameters: {'model__learning_rate': 0.1, 'model__max_depth': 5, 'model__n_estimators': 200}\n", + "MAE: 1556.4693865098072\n", + "MSE: 9320749.44024657\n", + "RMSE: 3052.990245684806\n", + "R²: 0.9392709713847187\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split, GridSearchCV\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression\n", + "from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Список моделей и их гиперпараметров для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": (LinearRegression(), {}),\n", + " \"Random Forest Regression\": (RandomForestRegressor(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__max_depth': [None, 10, 20]\n", + " }),\n", + " \"Gradient Boosting Regression\": (GradientBoostingRegressor(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__learning_rate': [0.01, 0.1],\n", + " 'model__max_depth': [3, 5]\n", + " })\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df[categorical_cols + numerical_cols]\n", + "y_reg = df['charges']\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи регрессии\n", + "X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи регрессии\n", + "print(\"Результаты для задачи регрессии:\")\n", + "for name, (model, params) in models_reg.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " grid_search = GridSearchCV(pipeline, params, cv=5, scoring='neg_mean_absolute_error')\n", + " grid_search.fit(X_train_reg, y_train_reg)\n", + " best_model = grid_search.best_estimator_\n", + " y_pred_reg = best_model.predict(X_test_reg)\n", + " mae = mean_absolute_error(y_test_reg, y_pred_reg)\n", + " mse = mean_squared_error(y_test_reg, y_pred_reg)\n", + " rmse = mean_squared_error(y_test_reg, y_pred_reg, squared=False)\n", + " r2 = r2_score(y_test_reg, y_pred_reg)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Best Parameters: {grid_search.best_params_}\")\n", + " print(f\"MAE: {mae}\")\n", + " print(f\"MSE: {mse}\")\n", + " print(f\"RMSE: {rmse}\")\n", + " print(f\"R²: {r2}\")\n", + " print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "2. Оптимизация тарифной сетки:\n", + "\n", + "Настройка гиперпараметров для задачи классификации:" + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи классификации:\n", + "Model: Logistic Regression\n", + "Best Parameters: {'model__C': 10, 'model__solver': 'liblinear'}\n", + "Accuracy: 0.8864864864864865\n", + "\n", + "Model: Random Forest Classification\n", + "Best Parameters: {'model__max_depth': None, 'model__n_estimators': 100}\n", + "Accuracy: 0.9783783783783784\n", + "\n", + "Model: Gradient Boosting Classification\n", + "Best Parameters: {'model__learning_rate': 0.1, 'model__max_depth': 5, 'model__n_estimators': 200}\n", + "Accuracy: 0.9621621621621622\n", + "\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import train_test_split, GridSearchCV\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LogisticRegression\n", + "from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "from sklearn.metrics import accuracy_score\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Список моделей и их гиперпараметров для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": (LogisticRegression(), {\n", + " 'model__C': [0.1, 1, 10],\n", + " 'model__solver': ['liblinear', 'lbfgs']\n", + " }),\n", + " \"Random Forest Classification\": (RandomForestClassifier(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__max_depth': [None, 10, 20]\n", + " }),\n", + " \"Gradient Boosting Classification\": (GradientBoostingClassifier(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__learning_rate': [0.01, 0.1],\n", + " 'model__max_depth': [3, 5]\n", + " })\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df[categorical_cols + numerical_cols]\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи классификации\n", + "X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(X_class, y_class, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи классификации\n", + "print(\"Результаты для задачи классификации:\")\n", + "for name, (model, params) in models_class.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " grid_search = GridSearchCV(pipeline, params, cv=5, scoring='accuracy')\n", + " grid_search.fit(X_train_class, y_train_class)\n", + " best_model = grid_search.best_estimator_\n", + " y_pred_class = best_model.predict(X_test_class)\n", + " accuracy = accuracy_score(y_test_class, y_pred_class)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Best Parameters: {grid_search.best_params_}\")\n", + " print(f\"Accuracy: {accuracy}\")\n", + " print()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Прогнозирование стоимости страховых взносов:\n", + "Задача: Регрессия\n", + "\n", + "Выбор метрик:\n", + "\n", + "MAE (Mean Absolute Error): Средняя абсолютная ошибка. Показывает среднее отклонение предсказанных значений от фактических. Эта метрика легко интерпретируется, так как она измеряется в тех же единицах, что и целевая переменная (доллары).\n", + "\n", + "MSE (Mean Squared Error): Среднеквадратичная ошибка. Показывает среднее квадратичное отклонение предсказанных значений от фактических. Эта метрика чувствительна к выбросам, так как ошибки возводятся в квадрат.\n", + "\n", + "RMSE (Root Mean Squared Error): Квадратный корень из среднеквадратичной ошибки. Показывает среднее отклонение предсказанных значений от фактических в тех же единицах, что и целевая переменная. Эта метрика также чувствительна к выбросам, но легче интерпретируется, чем MSE.\n", + "\n", + "R² (R-squared): Коэффициент детерминации. Показывает, какую долю дисперсии целевой переменной объясняет модель. Значение R² близкое к 1 указывает на хорошее качество модели.\n", + "\n", + "Обоснование:\n", + "\n", + "MAE: Хорошо подходит для задач, где важно понимать среднее отклонение предсказаний от фактических значений.\n", + "\n", + "MSE и RMSE: Полезны для задач, где важно минимизировать влияние выбросов, так как они возводят ошибки в квадрат.\n", + "\n", + "R²: Позволяет оценить, насколько хорошо модель объясняет вариацию целевой переменной.\n", + "\n", + "2. Оптимизация тарифной сетки:\n", + "Задача: Классификация\n", + "\n", + "Выбор метрик:\n", + "\n", + "Accuracy: Доля правильных предсказаний среди всех предсказаний. Эта метрика показывает общую точность модели.\n", + "\n", + "Precision: Доля правильных положительных предсказаний среди всех положительных предсказаний. Эта метрика важна, если важно минимизировать количество ложноположительных результатов.\n", + "\n", + "Recall (Sensitivity): Доля правильных положительных предсказаний среди всех фактических положительных случаев. Эта метрика важна, если важно минимизировать количество ложноотрицательных результатов.\n", + "\n", + "F1-score: Гармоническое среднее между precision и recall. Эта метрика показывает баланс между precision и recall.\n", + "\n", + "Обоснование:\n", + "\n", + "Accuracy: Хорошо подходит для задач, где классы сбалансированы.\n", + "\n", + "Precision и Recall: Важны для задач, где важно минимизировать ошибки определенного типа (ложноположительные или ложноотрицательные).\n", + "\n", + "F1-score: Позволяет оценить баланс между precision и recall." + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Результаты для задачи регрессии:\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Linear Regression\n", + "Best Parameters: {}\n", + "MAE: 4158.694987099099\n", + "MSE: 39908584.112821\n", + "RMSE: 6317.32412599045\n", + "R²: 0.7399769662171334\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Random Forest Regression\n", + "Best Parameters: {'model__max_depth': None, 'model__n_estimators': 100}\n", + "MAE: 1309.2968994795137\n", + "MSE: 7399293.51911523\n", + "RMSE: 2720.164244878465\n", + "R²: 0.9517901526335497\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "c:\\Users\\midni\\AIM\\AIM-PIbd-32-Bulatova-K-R\\aimenv\\Lib\\site-packages\\sklearn\\metrics\\_regression.py:492: FutureWarning: 'squared' is deprecated in version 1.4 and will be removed in 1.6. To calculate the root mean squared error, use the function'root_mean_squared_error'.\n", + " warnings.warn(\n" + ] + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Gradient Boosting Regression\n", + "Best Parameters: {'model__learning_rate': 0.1, 'model__max_depth': 5, 'model__n_estimators': 200}\n", + "MAE: 1556.235766949439\n", + "MSE: 9320073.834850596\n", + "RMSE: 3052.879597175525\n", + "R²: 0.9392753732688899\n", + "\n", + "Результаты для задачи классификации:\n", + "Model: Logistic Regression\n", + "Best Parameters: {'model__C': 10, 'model__solver': 'liblinear'}\n", + "Accuracy: 0.8864864864864865\n", + "Precision: 1.0\n", + "Recall: 0.6204819277108434\n", + "F1-score: 0.7657992565055762\n", + "\n" + ] + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Random Forest Classification\n", + "Best Parameters: {'model__max_depth': 20, 'model__n_estimators': 200}\n", + "Accuracy: 0.9801801801801802\n", + "Precision: 0.9874213836477987\n", + "Recall: 0.9457831325301205\n", + "F1-score: 0.9661538461538461\n", + "\n" + ] + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Model: Gradient Boosting Classification\n", + "Best Parameters: {'model__learning_rate': 0.1, 'model__max_depth': 5, 'model__n_estimators': 200}\n", + "Accuracy: 0.9621621621621622\n", + "Precision: 0.9738562091503268\n", + "Recall: 0.8975903614457831\n", + "F1-score: 0.9341692789968652\n", + "\n" + ] + }, + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAAAhQAAAHHCAYAAADnOMH5AAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjkuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8hTgPZAAAACXBIWXMAAA9hAAAPYQGoP6dpAABdAElEQVR4nO3dd1gU1/oH8O+C7FIXRKkRiV1R7NEQjCUiiMao6DUaC1ijQU2wm8QeJVeTq9HYYkONqIn1amzYGzF2jYUIotgAo9Kl7vn94Y+5roDuugO44fvxmedxZ86eeWcXlnffc2ZGIYQQICIiIjKASWkHQERERMaPCQUREREZjAkFERERGYwJBRERERmMCQUREREZjAkFERERGYwJBRERERmMCQUREREZjAkFERERGYwJhQ5u3LgBX19f2NraQqFQYNu2bbL2f+vWLSgUCoSFhcnarzFr3bo1WrduLVt/aWlpGDRoEJydnaFQKPDFF1/I1vebrrCfr6lTp0KhUJReUP8wxvJ6vgmfNW+//TaCgoK01hX2GRsWFgaFQoFbt26VeIwKhQJTp04t8f0aO6NJKGJiYvDpp5+iatWqMDc3h1qthre3N3744Qc8ffq0WPcdGBiIy5cvY+bMmVi7di2aNm1arPsrSUFBQVAoFFCr1YW+jjdu3IBCoYBCocB3332nd//379/H1KlTceHCBRmifX2zZs1CWFgYhg0bhrVr16Jv377Fvk+NRoM1a9agXbt2qFixIszMzODo6AhfX1/89NNPyMrKKvYYSpO+733+H5DnF0dHR7Rp0wa7d+8u3mB1kJGRgalTp+Lw4cOlHUqhDh8+jICAADg7O0OpVMLR0RGdOnXCli1bSju0VyqNz9hdu3YxaZCbMAI7d+4UFhYWws7OTowcOVL89NNP4scffxQ9e/YUZmZmYvDgwcW274yMDAFAfPXVV8W2D41GI54+fSpyc3OLbR9FCQwMFOXKlROmpqZi48aNBbZPmTJFmJubCwBizpw5evd/+vRpAUCsWrVKr+dlZWWJrKwsvfdXlObNmwtvb2/Z+nuVjIwM4efnJwCI9957T4SGhoqVK1eK7777TnTq1EmYmpqKAQMGlEgssbGxBd6DnJwc8fTp02Ldr77v/apVqwQAMX36dLF27VqxZs0aMWfOHFG3bl0BQOzYsaNY432Vhw8fCgBiypQpBbaVxOv5MpMnTxYARI0aNcTkyZPFihUrxOzZs0Xr1q0FALFu3TohROE/CyUtMzNTZGdnS4+L+ozNzc0VT58+FRqNpljiCA4OFkX9CXz69KnIyckplv3+k5UrjSRGH7GxsejZsyfc3d1x8OBBuLi4SNuCg4MRHR2N3377rdj2//DhQwCAnZ1dse1DoVDA3Ny82Pp/FZVKBW9vb6xfvx49evTQ2hYeHo6OHTti8+bNJRJLRkYGLC0toVQqZe03MTERHh4esvWXm5sLjUZTZJwhISHYu3cv5s2bh88//1xr2+jRo3Hjxg1EREQYtA9DlCtXDuXKvZm//v7+/lrfUAcOHAgnJyesX78eH374YSlGVrTSfD03bdqE6dOno3v37ggPD4eZmZm0bezYsdi7dy9ycnJKJbbCqFQqrcdFfcaamprC1NS0pMLSUpqfx0attDOaVxk6dKgAIE6cOKFT+5ycHDF9+nRRtWpVoVQqhbu7u5g4caLIzMzUaufu7i46duwojh07Jt555x2hUqlElSpVxOrVq6U2U6ZMEQC0Fnd3dyHEs2/2+f9/Xv5znrdv3z7h7e0tbG1thZWVlahZs6aYOHGitL2obw0HDhwQLVq0EJaWlsLW1lZ89NFH4urVq4Xu78aNGyIwMFDY2toKtVotgoKCRHp6+itfr8DAQGFlZSXCwsKESqUST548kbb98ccfAoDYvHlzgQrFo0ePxOjRo0W9evWElZWVsLGxEe3btxcXLlyQ2hw6dKjA6/f8cbZq1UrUrVtXnDlzRrz//vvCwsJCfP7559K2Vq1aSX3169dPqFSqAsfv6+sr7OzsxL179wo9vqJiiI2NFUIIkZCQIAYMGCAcHR2FSqUS9evXF2FhYVp95L8/c+bMEXPnzhVVq1YVJiYm4vz584XuMy4uTpiamor27du/5JXX9rJ9ZGVliUmTJonGjRsLtVotLC0tRYsWLcTBgwcL9PPkyRMRGBgo1Gq1sLW1Ff369RPnz58v8PNV2M+pEEKsXbtWNG7cWJibm4vy5cuLjz/+WMTFxWm1yX/frly5Ilq3bi0sLCyEq6ur+Pe//y21edV7X5j8CsXp06e11ms0GqFWq0W/fv201qelpYlRo0aJSpUqCaVSKWrWrCnmzJlT4Butrp8Jp0+fFr6+vqJChQrC3NxcvP3226J///5a78+LS361orDXE4AIDg4WW7duFXXr1hVKpVJ4eHiI3bt3Fzj2Q4cOiSZNmgiVSiWqVq0qlixZUuR79KLatWsLe3t7kZKS8sq2hX3WXLx4UQQGBooqVaoIlUolnJycRP/+/cXff/+t9dyUlBTx+eefC3d3d6FUKoWDg4Pw8fERZ8+eldr89ddfIiAgQDg5OQmVSiXeeust8fHHH4ukpCSpjbu7uwgMDNR63Qr7jM3/ecj/Xc23a9cu0bJlS2FtbS1sbGxE06ZNpQqMEEIcPXpUdO/eXbi5uQmlUikqVaokvvjiC5GRkSG1CQwMLPT9zPf8e5vv3Llzon379sLGxkZYWVmJDz74QERGRmq1yY/5+PHjIiQkRFSsWFFYWlqKLl26iMTExFe+P8buzfyK8pwdO3agatWqeO+993RqP2jQIKxevRrdu3fH6NGjcerUKYSGhuLatWvYunWrVtvo6Gh0794dAwcORGBgIFauXImgoCA0adIEdevWRUBAAOzs7BASEoJevXqhQ4cOsLa21iv+K1eu4MMPP0T9+vUxffp0qFQqREdH48SJEy993v79++Hv74+qVati6tSpePr0KRYsWABvb2+cO3cOb7/9tlb7Hj16oEqVKggNDcW5c+ewfPlyODo64t///rdOcQYEBGDo0KHYsmULBgwYAOBZdaJ27dpo3LhxgfY3b97Etm3b8K9//QtVqlRBQkICli5dilatWuHq1atwdXVFnTp1MH36dEyePBlDhgzB+++/DwBa7+WjR4/g7++Pnj17ok+fPnBycio0vh9++AEHDx5EYGAgIiMjYWpqiqVLl2Lfvn1Yu3YtXF1dC31enTp1sHbtWoSEhKBSpUoYPXo0AMDBwQFPnz5F69atER0djeHDh6NKlSr49ddfERQUhKSkpAKVhVWrViEzMxNDhgyBSqWCvb19ofvcvXs38vLy0KdPn1e86gUVto+UlBQsX74cvXr1wuDBg5GamooVK1bAz88Pf/zxBxo2bAgAEEKgc+fOOH78OIYOHYo6depg69atCAwM1GnfM2fOxKRJk9CjRw8MGjQIDx8+xIIFC9CyZUucP39e6xvkkydP0L59ewQEBKBHjx7YtGkTxo8fD09PT/j7++v03hclOTkZf//9N4QQSExMxIIFC5CWlqb1egoh8NFHH+HQoUMYOHAgGjZsiL1792Ls2LG4d+8e5s6dK7XV5TMhMTERvr6+cHBwwIQJE2BnZ4dbt25J8w8cHBywePFiDBs2DF27dkVAQAAAoH79+i89luPHj2PLli347LPPYGNjg/nz56Nbt26Ii4tDhQoVAADnz59H+/bt4eLigmnTpiEvLw/Tp0+Hg4PDK1+rGzdu4Pr16xgwYABsbGxe2b4wERERuHnzJvr37w9nZ2dcuXIFP/30E65cuYLff/9dmmw6dOhQbNq0CcOHD4eHhwcePXqE48eP49q1a2jcuDGys7Ph5+eHrKwsjBgxAs7Ozrh37x527tyJpKQk2NraFti3vp+xYWFhGDBgAOrWrYuJEyfCzs4O58+fx549e/DJJ58AAH799VdkZGRg2LBhqFChAv744w8sWLAAd+/exa+//goA+PTTT3H//n1ERERg7dq1r3yNrly5gvfffx9qtRrjxo2DmZkZli5ditatW+PIkSNo3ry5VvsRI0agfPnymDJlCm7duoV58+Zh+PDh2Lhxo87vi1Eq5YTmpZKTkwUA0blzZ53aX7hwQQAQgwYN0lo/ZswYAUDrG527u7sAII4ePSqtS0xMFCqVSowePVpa9/w3x+fpWqGYO3euACAePnxYZNyFfWto2LChcHR0FI8ePZLWXbx4UZiYmGh9U8vf34vj8V27dhUVKlQocp/PH4eVlZUQQoju3buLtm3bCiGEyMvLE87OzmLatGmFvgaZmZkiLy+vwHGoVCoxffp0ad3LxtFbtWolAIglS5YUuu35CoUQQuzdu1cAEN988424efOmsLa2Fl26dHnlMQrxv4rU8+bNmycAiJ9//llal52dLby8vIS1tbX0jS//+NVqtU7fMkJCQgQArWqNEM/mhTx8+FBanv8G+LJ95ObmFphP8uTJE+Hk5KT1vm/btk0AELNnz9Z67vvvv//KCsWtW7eEqampmDlzptZ+Ll++LMqVK6e1Pv99W7NmjdaxOTs7i27duknrXncOxYuLSqUqUDXKP9ZvvvlGa3337t2FQqEQ0dHRQgjdPxO2bt1aaHXkeS+bQ1FUhUKpVEqxCPHsdxiAWLBggbSuU6dOwtLSUqvKduPGDVGuXLlXVii2b98uAIi5c+e+tF2+wj5rnv/mnm/9+vUFPh9tbW1FcHBwkX3nV8J+/fXXl8bwfIXi+Zhe/Ix9sUKRlJQkbGxsRPPmzQvMV3m+KlXY8YSGhgqFQiFu374trXvZHIoX3+cuXboIpVIpYmJipHX3798XNjY2omXLlgVi9vHx0YopJCREmJqaalVq/one6LM8UlJSAEDnzHvXrl0AgFGjRmmtz/9W+uJcCw8PD+mbE/DsW0itWrVw8+bN1475Rfnf6rZv3w6NRqPTcx48eIALFy4gKChI61tw/fr10a5dO+k4nzd06FCtx++//z4ePXokvYa6+OSTT3D48GHEx8fj4MGDiI+Pl7L+F6lUKpiYPPvxycvLw6NHj2BtbY1atWrh3LlzOu9TpVKhf//+OrX19fXFp59+iunTpyMgIADm5uZYunSpzvt60a5du+Ds7IxevXpJ68zMzDBy5EikpaXhyJEjWu27deum07fG/Nf8xW9au3btgoODg7S4u7sXeG5h+zA1NZXmUWg0Gjx+/Bi5ublo2rSp1mu9a9culCtXDsOGDdN67ogRI14Z85YtW6DRaNCjRw/8/fff0uLs7IwaNWrg0KFDWu2tra21KgZKpRLNmjWT5Xdn4cKFiIiIQEREBH7++We0adMGgwYN0jpbYdeuXTA1NcXIkSO1njt69GgIIaSzQnT9TMj/Pd25c6es8w18fHxQrVo16XH9+vWhVqul1ykvLw/79+9Hly5dtKps1atXh7+//yv71/czsjAWFhbS/zMzM/H333/j3XffBQCtny87OzucOnUK9+/fL7Sf/ArE3r17kZGR8drxFCUiIgKpqamYMGFCgTkOz5+y+/zxpKen4++//8Z7770HIQTOnz+v937z8vKwb98+dOnSBVWrVpXWu7i44JNPPsHx48cLfM4OGTJEK6b3338feXl5uH37tt77NyZvdEKhVqsBAKmpqTq1v337NkxMTFC9enWt9c7OzrCzsyvwZlauXLlAH+XLl8eTJ09eM+KCPv74Y3h7e2PQoEFwcnJCz5498csvv7w0uciPs1atWgW21alTB3///TfS09O11r94LOXLlwcAvY6lQ4cOsLGxwcaNG7Fu3Tq88847BV7LfBqNBnPnzkWNGjWgUqlQsWJFODg44NKlS0hOTtZ5n2+99ZZekw6/++472Nvb48KFC5g/fz4cHR11fu6Lbt++jRo1akiJUb46depI259XpUoVnfrN/3BPS0vTWu/t7S39ofT19S30uUXtY/Xq1ahfvz7Mzc1RoUIFODg44LffftN6rW/fvg0XF5cCiUxhP0cvunHjBoQQqFGjhlbS4+DggGvXriExMVGrfaVKlQpcd0Gu351mzZrBx8cHPj4+6N27N3777Td4eHhg+PDhyM7OBvDsWF1dXQv8IX3xvdP1M6FVq1bo1q0bpk2bhooVK6Jz585YtWqVwaf2vuozJjExEU+fPi3096yo373n6fsZWZjHjx/j888/h5OTEywsLODg4CD9HD7/8zV79mz8+eefcHNzQ7NmzTB16lStBLJKlSoYNWoUli9fjooVK8LPzw8LFy7U6/PgZWJiYgAA9erVe2m7uLg46cuYtbU1HBwc0KpVqwLHo6uHDx8iIyOjyM9jjUaDO3fuaK2X4/PYGL3xCYWrqyv+/PNPvZ6n6wVmippBLIR47X3k5eVpPbawsMDRo0exf/9+9O3bF5cuXcLHH3+Mdu3aFWhrCEOOJZ9KpUJAQABWr16NrVu3FlmdAJ5d12HUqFFo2bIlfv75Z+zduxcRERGoW7euzpUYQPvbhC7Onz8v/XG7fPmyXs81lK6x1q5dGwAK/Nw6ODhIfyifP1vpVfv4+eefERQUhGrVqmHFihXYs2cPIiIi8MEHH+j1Wr+MRqOBQqGQ+n5xebESJMfPm65MTEzQpk0bPHjwADdu3HitPl71maBQKLBp0yZERkZi+PDhuHfvHgYMGIAmTZoUSAz1UdyvU/7PmiG/Cz169MCyZcukOVT79u3Dnj17AEDr56tHjx64efMmFixYAFdXV8yZMwd169bVukbI999/j0uXLuHLL7/E06dPMXLkSNStWxd379597fj0kZeXh3bt2uG3337D+PHjsW3bNkREREgX8pLr9+VVSvL3403yRicUAPDhhx8iJiYGkZGRr2zr7u4OjUZT4EMnISEBSUlJhZaYX1f58uWRlJRUYH1hJS0TExO0bdsW//nPf3D16lXMnDkTBw8eLFBGzpcfZ1RUVIFt169fR8WKFWFlZWXYARThk08+wfnz55GamoqePXsW2W7Tpk1o06YNVqxYgZ49e8LX1xc+Pj4FXhM5rx6Ynp6O/v37w8PDA0OGDMHs2bNx+vTp1+7P3d0dN27cKPAhc/36dWn76/D394epqSnWrVv32rE9b9OmTahatSq2bNmCvn37ws/PDz4+PsjMzNRq5+7ujgcPHhT4A1jYz9GLqlWrBiEEqlSpIiU9zy/5JXB9yPne5+bmAvhf1cfd3R33798v8M38xfdO38+Ed999FzNnzsSZM2ewbt06XLlyBRs2bJD9ePI5OjrC3Nwc0dHRBbYVtu5FNWvWRK1atbB9+/bXSnyePHmCAwcOYMKECZg2bRq6du2Kdu3aaZX2n+fi4oLPPvsM27ZtQ2xsLCpUqICZM2dqtfH09MTXX3+No0eP4tixY7h37x6WLFmid2wvyh86etkXzMuXL+Ovv/7C999/j/Hjx6Nz587w8fEpdNK2ru+ng4MDLC0ti/w8NjExgZubm45H8c/2xicU48aNg5WVFQYNGoSEhIQC22NiYvDDDz8AeFayB4B58+ZptfnPf/4DAOjYsaNscVWrVg3Jycm4dOmStO7BgwcFziR5/Phxgefmz8ovqpzq4uKChg0bYvXq1Vp/oP/880/s27dPOs7i0KZNG8yYMQM//vgjnJ2di2xnampaINv+9ddfce/ePa11+YlPYcmXvsaPH4+4uDisXr0a//nPf/D2228jMDDwtcvSHTp0QHx8vNbM69zcXCxYsADW1tZSmVRflStXxoABA7B79278+OOPhbbR55tK/red559z6tSpAkl2hw4dkJubi8WLF0vr8vLysGDBglfuIyAgAKamppg2bVqB2IQQePTokc7x5pPrvc/JycG+ffugVCqlIY0OHTogLy+vwOs7d+5cKBQKaf6Brp8JT548KXDcL/6eWlpaynI8zzM1NYWPjw+2bdumNTchOjpa56uDTps2DY8ePcKgQYOkxOt5+/btw86dO4vcP1Dw5/HF1ysvL6/AcIGjoyNcXV2l1yclJaXA/j09PWFiYiLLVWF9fX1hY2OD0NDQAsl0fvyFHY8QQvob8Txdfz5NTU3h6+uL7du3a10GPCEhAeHh4WjRooU09FTWvfGnjVarVg3h4eH4+OOPUadOHfTr1w/16tVDdnY2Tp48KZ3mBwANGjRAYGAgfvrpJyQlJaFVq1b4448/sHr1anTp0gVt2rSRLa6ePXti/Pjx6Nq1K0aOHImMjAwsXrwYNWvW1JrINH36dBw9ehQdO3aEu7s7EhMTsWjRIlSqVAktWrQosv85c+bA398fXl5eGDhwoHTaqK2tbbFeLtbExARff/31K9t9+OGHmD59Ovr374/33nsPly9fxrp16wp8s6lWrRrs7OywZMkS2NjYwMrKCs2bN9d5PkK+gwcPYtGiRZgyZYp0GuuqVavQunVrTJo0CbNnz9arP+DZxKmlS5ciKCgIZ8+exdtvv41NmzbhxIkTmDdvnkET3ebNm4fY2FiMGDECGzZsQKdOneDo6Ii///4bJ06cwI4dO3Sa2wA8e623bNmCrl27omPHjoiNjcWSJUvg4eGh9a20U6dO8Pb2xoQJE3Dr1i14eHhgy5YtOo0bV6tWDd988w0mTpyIW7duoUuXLrCxsUFsbCy2bt2KIUOGYMyYMXq9Bq/73u/evVuqNCQmJiI8PBw3btzAhAkTpA/uTp06oU2bNvjqq69w69YtNGjQAPv27cP27dvxxRdfSN9mdf1MWL16NRYtWoSuXbuiWrVqSE1NxbJly6BWq6WkxMLCAh4eHti4cSNq1qwJe3t71KtX75Vj+q8ydepU7Nu3D97e3hg2bJiUKNWrV0+ny5Z//PHH0mWrz58/j169esHd3R2PHj3Cnj17cODAAYSHhxf6XLVajZYtW2L27NnIycnBW2+9hX379iE2NlarXWpqKipVqoTu3bujQYMGsLa2xv79+3H69Gl8//33AJ79jg4fPhz/+te/ULNmTeTm5mLt2rUwNTVFt27dDHqN8mOdO3cuBg0ahHfeeQeffPIJypcvj4sXLyIjIwOrV69G7dq1Ua1aNYwZMwb37t2DWq3G5s2bC5270KRJEwDAyJEj4efnB1NT0yKrst988w0iIiLQokULfPbZZyhXrhyWLl2KrKys1/rs+ccq4bNKXttff/0lBg8eLN5++22hVCqFjY2N8Pb2FgsWLNC6QE1OTo6YNm2aqFKlijAzMxNubm4vvbDVi148XbGoU5qEeHbBqnr16gmlUilq1aolfv755wKnjx04cEB07txZuLq6CqVSKVxdXUWvXr3EX3/9VWAfL55et3//fuHt7S0sLCyEWq0WnTp1KvLCVi+ellrURWFe9Pxpo0Up6rTR0aNHCxcXF2FhYSG8vb1FZGRkoad7bt++XXh4eEinwb14YavCPN9PSkqKcHd3F40bNy5wOdyQkBBhYmJS4AIzLyrq/U5ISBD9+/cXFStWFEqlUnh6ehZ4H172M/Ayubm5YtWqVeKDDz4Q9vb2oly5cqJixYqibdu2YsmSJVqnvr1sHxqNRsyaNUu4u7sLlUolGjVqJHbu3FnoqcuPHj0Sffv2lS5s1bdvX70ubLV582bRokULYWVlJaysrETt2rVFcHCwiIqKktoU9b4VFk9R731hCjtt1NzcXDRs2FAsXry4wAWrUlNTRUhIiHB1dRVmZmaiRo0aRV7Y6lWfCefOnRO9evUSlStXFiqVSjg6OooPP/xQnDlzRquvkydPiiZNmgilUqnzha1e9OJpk0I8+5xo1KiRUCqVolq1amL58uVi9OjRwtzcvMjX60X5nzWOjo6iXLlywsHBQXTq1Els375dalPYZ83du3dF165dhZ2dnbC1tRX/+te/xP3797WOLysrS4wdO1Y0aNBAurBTgwYNxKJFi6R+bt68KQYMGCCqVasmzM3Nhb29vWjTpo3Yv3//S49f19NG8/33v/8V7733nvS52KxZM7F+/Xpp+9WrV4WPj4+wtrYWFStWFIMHD5ZO133+uHNzc8WIESOEg4ODUCgUOl3Yys/PT1hbWwtLS0vRpk0bcfLkyUJjfvH04/wLvR06dEj8kymE+IfPEiEiMkJdunTBlStXXnsiKlFJe+PnUBAR/dO9eKffGzduYNeuXWjdunXpBET0GlihICIqZS4uLggKCkLVqlVx+/ZtLF68GFlZWTh//jxq1KhR2uER6eSNn5RJRPRP1759e6xfvx7x8fFQqVTw8vLCrFmzmEyQUWGFgoiIiAzGORRERERkMCYUREREZDDOodCBRqPB/fv3YWNjUyyX3yUiouIjhEBqaipcXV0L3AxQTpmZmdIN7AylVCoL3FX1TceEQgf379/ntdqJiIzcnTt3UKlSpWLpOzMzExY2FYBceW7d7uzsjNjYWKNKKphQ6CD/EsxKj0AoTHW/1TaRMYk7/F1ph0BULFJTUlC9iptBl9N/lezsbCA3AyqPQMDQvxN52Yi/uhrZ2dlMKP5p8oc5FKZKJhT0j8UbHNE/XYkMWZczN/jvhFAY5/RGJhRERERyUQAwNHEx0ql6TCiIiIjkojB5thjahxEyzqiJiIjojcIKBRERkVwUChmGPIxzzIMJBRERkVw45EFERET0+lihICIikguHPIiIiMhwMgx5GOnggXFGTURERG8UViiIiIjkwiEPIiIiMhjP8iAiIiJ6faxQEBERyYVDHkRERGSwMjzkwYSCiIhILmW4QmGcaRARERG9UVihICIikguHPIiIiMhgCoUMCQWHPIiIiKiMYoWCiIhILiaKZ4uhfRghJhRERERyKcNzKIwzaiIiInqjsEJBREQklzJ8HQomFERERHLhkAcRERHR62OFgoiISC4c8iAiIiKDcciDiIiIDJZfoTB00dHixYtRv359qNVqqNVqeHl5Yffu3dL21q1bQ6FQaC1Dhw7V6iMuLg4dO3aEpaUlHB0dMXbsWOTm5up96KxQEBERGalKlSrh22+/RY0aNSCEwOrVq9G5c2ecP38edevWBQAMHjwY06dPl55jaWkp/T8vLw8dO3aEs7MzTp48iQcPHqBfv34wMzPDrFmz9IqFCQUREZFcSnjIo1OnTlqPZ86cicWLF+P333+XEgpLS0s4OzsX+vx9+/bh6tWr2L9/P5ycnNCwYUPMmDED48ePx9SpU6FUKnWOhUMeREREcpFxyCMlJUVrycrKeumu8/LysGHDBqSnp8PLy0tav27dOlSsWBH16tXDxIkTkZGRIW2LjIyEp6cnnJycpHV+fn5ISUnBlStX9Dp0ViiIiIjeQG5ublqPp0yZgqlTpxZod/nyZXh5eSEzMxPW1tbYunUrPDw8AACffPIJ3N3d4erqikuXLmH8+PGIiorCli1bAADx8fFayQQA6XF8fLxe8TKhICIiko0MQx7/P3hw584dqNVqaa1KpSq0da1atXDhwgUkJydj06ZNCAwMxJEjR+Dh4YEhQ4ZI7Tw9PeHi4oK2bdsiJiYG1apVMzDOwqImIiIiw8k45JF/5kb+UlRCoVQqUb16dTRp0gShoaFo0KABfvjhh0LbNm/eHAAQHR0NAHB2dkZCQoJWm/zHRc27KAoTCiIion8QjUZT5HyLCxcuAABcXFwAAF5eXrh8+TISExOlNhEREVCr1dKwia445EFERCQXhUKGszx0vw7FxIkT4e/vj8qVKyM1NRXh4eE4fPgw9u7di5iYGISHh6NDhw6oUKECLl26hJCQELRs2RL169cHAPj6+sLDwwN9+/bF7NmzER8fj6+//hrBwcFFVkSKwoSCiIhILiV82mhiYiL69euHBw8ewNbWFvXr18fevXvRrl073LlzB/v378e8efOQnp4ONzc3dOvWDV9//bX0fFNTU+zcuRPDhg2Dl5cXrKysEBgYqHXdCl0xoSAiIjJSK1asKHKbm5sbjhw58so+3N3dsWvXLoNjYUJBREQkF94cjIiIiAxWhm8OxoSCiIhILmW4QmGcaRARERG9UVihICIikguHPIiIiMhgHPIgIiIien2sUBAREclEoVBAUUYrFEwoiIiIZFKWEwoOeRAREZHBWKEgIiKSi+L/F0P7MEJMKIiIiGTCIQ8iIiIiA7BCQUREJJOyXKFgQkFERCQTJhRERERksLKcUHAOBRERERmMFQoiIiK58LRRIiIiMhSHPIiIiIgMwAoFERGRTJ7dvdzQCoU8sZQ0JhREREQyUUCGIQ8jzSg45EFEREQGY4WCiIhIJmV5UiYTCiIiIrmU4dNGOeRBREREBmOFgoiISC4yDHkIDnkQERGVbXLMoTD8LJHSwYSCiIhIJmU5oeAcCiIiIjIYKxRERERyKcNneTChICIikgmHPIiIiIgMwAoFERGRTMpyhYIJBRERkUzKckLBIQ8iIiIyGCsUREREMmGFgoiIiAynkGnR0eLFi1G/fn2o1Wqo1Wp4eXlh9+7d0vbMzEwEBwejQoUKsLa2Rrdu3ZCQkKDVR1xcHDp27AhLS0s4Ojpi7NixyM3N1fvQmVAQEREZqUqVKuHbb7/F2bNncebMGXzwwQfo3Lkzrly5AgAICQnBjh078Ouvv+LIkSO4f/8+AgICpOfn5eWhY8eOyM7OxsmTJ7F69WqEhYVh8uTJeseiEEII2Y7sHyolJQW2trZQeQ6GwlRZ2uEQFYsnp38s7RCIikVKSgqcKtgiOTkZarW62PZha2sL5wE/w0RpaVBfmuwMxK/s89rx2tvbY86cOejevTscHBwQHh6O7t27AwCuX7+OOnXqIDIyEu+++y52796NDz/8EPfv34eTkxMAYMmSJRg/fjwePnwIpVL3v3msUBAREckkfw6FocvryMvLw4YNG5Ceng4vLy+cPXsWOTk58PHxkdrUrl0blStXRmRkJAAgMjISnp6eUjIBAH5+fkhJSZGqHLripEwiIiKZyDkpMyUlRWu9SqWCSqUq0P7y5cvw8vJCZmYmrK2tsXXrVnh4eODChQtQKpWws7PTau/k5IT4+HgAQHx8vFYykb89f5s+WKEgIiJ6A7m5ucHW1lZaQkNDC21Xq1YtXLhwAadOncKwYcMQGBiIq1evlnC0rFAQERHJR8abg925c0drDkVh1QkAUCqVqF69OgCgSZMmOH36NH744Qd8/PHHyM7ORlJSklaVIiEhAc7OzgAAZ2dn/PHHH1r95Z8Fkt9GV6xQEBERyUTOORT5p4LmL0UlFC/SaDTIyspCkyZNYGZmhgMHDkjboqKiEBcXBy8vLwCAl5cXLl++jMTERKlNREQE1Go1PDw89Dp2ViiIiIiM1MSJE+Hv74/KlSsjNTUV4eHhOHz4MPbu3QtbW1sMHDgQo0aNgr29PdRqNUaMGAEvLy+8++67AABfX194eHigb9++mD17NuLj4/H1118jODhY5wQmHxMKKhEDurXAgG7vw83FHgBw/WY85qzYjf0nn43zOVawwfSRXdG6eW1YW6oQfTsR36/cix2HLkh9XNw+DZVdK2j1O+3H7Zi3OqLEjoNILnPD9mH6wv9iaM/WCB3dvbTDIZmU9JUyExMT0a9fPzx48AC2traoX78+9u7di3bt2gEA5s6dCxMTE3Tr1g1ZWVnw8/PDokWLpOebmppi586dGDZsGLy8vGBlZYXAwEBMnz5d77jfqIQiKCgISUlJ2LZtW2mHQjK7n5iEaT9uR8ydh1AoFOjVsTnWfTcErfp8i+s347F4aj/Y2ljgk1FL8Sg5Dd39mmJV6AC06Tcbl/+6K/Uzc8lOrNl2Qnqclp5VGodDZJBzV24jbOsJ1K3xVmmHQjJTQIaEQo9JGCtWrHjpdnNzcyxcuBALFy4sso27uzt27dql8z6LwjkUVCL2HPsTESev4uadh4iJS8Q3i3cgPSMLTetVAQA0q18VyzYewbmrt3H73iN8v3IvklOfomEdN61+0jIykfgoVVoyMrNL43CIXltaRhaGTA7DD1/2gp2NRWmHQyQbo0ko/vzzT/j7+8Pa2hpOTk7o27cv/v77b2n7pk2b4OnpCQsLC1SoUAE+Pj5IT08HABw+fBjNmjWDlZUV7Ozs4O3tjdu3b5fWoZR5JiYKBLRrAksLJU5fjgUA/HHpJrq2awI7tSUUimfbVapyOH72htZzvwj0RUzEv3Hk5/EY0actTE2N5keYCAAwdvZG+HrXQ+vmtUs7FCoGpXlhq9L2Rg15FCUpKQkffPABBg0ahLlz5+Lp06cYP348evTogYMHD+LBgwfo1asXZs+eja5duyI1NRXHjh2DEAK5ubno0qULBg8ejPXr1yM7Oxt//PGH0b5hxsyjmiv2rhwNc2U5pD/NQt+xyxAV++zCKf0nrsTKWQMQe2A2cnLz8DQzG33HLkPs3f8ljUs3HsHF63eQlJKOZvWrYnLwR3CqaIuv520prUMi0svmfWdw8fodHFw9rrRDoeIi42mjxsYoEooff/wRjRo1wqxZs6R1K1euhJubG/766y+kpaUhNzcXAQEBcHd3BwB4enoCAB4/fozk5GR8+OGHqFatGgCgTp06L91fVlYWsrL+Nzb/4tXK6PXcuJ2Alr1Doba2QOe2jbBoal98+OkPiIqNx1dDP4StjQU6fzYfj5PS0aFVfawKHYAOg+fhasx9AMCi8INSX1ei7yM7Jxdzv+yF6Qv/i+wc/e+MR1SS7sY/wcTvN2PLj8NhrjIr7XCIZGcUCcXFixdx6NAhWFtbF9gWExMDX19ftG3bFp6envDz84Ovry+6d++O8uXLw97eHkFBQfDz80O7du3g4+ODHj16wMXFpcj9hYaGYtq0acV5SGVSTm6eVHG4eP0OGnlUxtCerfHDmv0Y8nEreH38Da7ffFax+PPGPXg1qoZB/2qJUd9uKLS/s1duwaycKSq72iP6dmKhbYjeFBevx+Hh41S07vtvaV1engYnz8dg2a9HkXBiHofw/gFK+iyPN4lR/PSmpaWhU6dOuHDhgtZy48YNtGzZEqampoiIiMDu3bvh4eGBBQsWoFatWoiNfTY+v2rVKkRGRuK9997Dxo0bUbNmTfz+++9F7m/ixIlITk6Wljt37pTUoZYpJgoFlMpysDR/djc7jUb7xrd5eQIKk6J/sTxrVkJengYPH6cWa5xEcmj5Ti2cWP8ljv48QVoa1amMf7VviqM/T2Ay8Q/BORRvuMaNG2Pz5s14++23Ua5c4SErFAp4e3vD29sbkydPhru7O7Zu3YpRo0YBABo1aoRGjRph4sSJ8PLyQnh4uHRhjxcVdQMWen2Tgz/C/pNXcCf+CWwszdG9fVO0aFID3UYswl+34hETl4i5E3th0g9b8Tg5HR1b10eb5rXQM2QJAOAdzypoUs8dx8/cQGpGJpp5VsHMkG74ZfdpJKc+LeWjI3o1GytzeFR31VpnaaGEva1VgfVkvBSKZ4uhfRijNy6hSE5OxoULF7TWDRkyBMuWLUOvXr0wbtw42NvbIzo6Ghs2bMDy5ctx5swZHDhwAL6+vnB0dMSpU6fw8OFD1KlTB7Gxsfjpp5/w0UcfwdXVFVFRUbhx4wb69etXOgdYRlUsb43FU/vBqaIaKWmZuBJ9D91GLMLhP64DAHp8sRhThnfG+v98CitLFWLvPMRnU9ci4v8vfJWVnYOAdk0wYXAHKM3K4fb9R1i8/hAWrjv4st0SEVEJeeMSisOHD6NRo0Za6wYOHIgTJ05g/Pjx8PX1RVZWFtzd3dG+fXuYmJhArVbj6NGjmDdvHlJSUuDu7o7vv/8e/v7+SEhIwPXr17F69Wo8evQILi4uCA4OxqefflpKR1g2jfwm/KXbb955iMDxy4vcfinqLnwHfC93WESlaufSL0o7BJLZswqFoXMoZAqmhCmEEOLVzcq2lJQU2NraQuU5GApTZWmHQ1Qsnpz+sbRDICoWKSkpcKpgi+TkZK27d8q9D1tbW1QduQmmKiuD+srLSsfN+d2LNd7iwFlAREREZLA3bsiDiIjIWJXl00aZUBAREcmkLJ/lwSEPIiIiMhgrFERERDIxMVHA5CUX5NOFMPD5pYUJBRERkUw45EFERERkAFYoiIiIZMKzPIiIiMhgZXnIgwkFERGRTMpyhYJzKIiIiMhgrFAQERHJpCxXKJhQEBERyaQsz6HgkAcREREZjBUKIiIimSggw5AHjLNEwYSCiIhIJhzyICIiIjIAKxREREQy4VkeREREZDAOeRAREREZgBUKIiIimXDIg4iIiAxWloc8mFAQERHJpCxXKDiHgoiIiAzGCgUREZFcZBjyMNILZTKhICIikguHPIiIiIgMwAoFERGRTMryWR6sUBAREckkf8jD0EVXoaGheOedd2BjYwNHR0d06dIFUVFRWm1at25doP+hQ4dqtYmLi0PHjh1haWkJR0dHjB07Frm5uXodOysURERERurIkSMIDg7GO++8g9zcXHz55Zfw9fXF1atXYWVlJbUbPHgwpk+fLj22tLSU/p+Xl4eOHTvC2dkZJ0+exIMHD9CvXz+YmZlh1qxZOsfChIKIiEgmJT3ksWfPHq3HYWFhcHR0xNmzZ9GyZUtpvaWlJZydnQvtY9++fbh69Sr2798PJycnNGzYEDNmzMD48eMxdepUKJVKnWLhkAcREZFM5BzySElJ0VqysrJeuf/k5GQAgL29vdb6devWoWLFiqhXrx4mTpyIjIwMaVtkZCQ8PT3h5OQkrfPz80NKSgquXLmi87GzQkFERPQGcnNz03o8ZcoUTJ06tcj2Go0GX3zxBby9vVGvXj1p/SeffAJ3d3e4urri0qVLGD9+PKKiorBlyxYAQHx8vFYyAUB6HB8fr3O8TCiIiIhkIud1KO7cuQO1Wi2tV6lUL31ecHAw/vzzTxw/flxr/ZAhQ6T/e3p6wsXFBW3btkVMTAyqVatmUKzP45AHERGRTPLnUBi6AIBardZaXpZQDB8+HDt37sShQ4dQqVKll8bYvHlzAEB0dDQAwNnZGQkJCVpt8h8XNe+iMEwoiIiIZFLSp40KITB8+HBs3boVBw8eRJUqVV75nAsXLgAAXFxcAABeXl64fPkyEhMTpTYRERFQq9Xw8PDQORYOeRARERmp4OBghIeHY/v27bCxsZHmPNja2sLCwgIxMTEIDw9Hhw4dUKFCBVy6dAkhISFo2bIl6tevDwDw9fWFh4cH+vbti9mzZyM+Ph5ff/01goODXznM8jxWKIiIiGQi55CHLhYvXozk5GS0bt0aLi4u0rJx40YAgFKpxP79++Hr64vatWtj9OjR6NatG3bs2CH1YWpqip07d8LU1BReXl7o06cP+vXrp3XdCl2wQkFERCSTkr45mBDipdvd3Nxw5MiRV/bj7u6OXbt26bzfwrBCQURERAZjhYKIiEgmCshwpUxZIil5TCiIiIhkYqJQwMTAjMLQ55cWDnkQERGRwVihICIikklJ3xzsTcKEgoiISCYlfZbHm4QJBRERkUxMFM8WQ/swRpxDQURERAZjhYKIiEguChmGLIy0QsGEgoiISCZleVImhzyIiIjIYKxQEBERyUTx//8M7cMYMaEgIiKSCc/yICIiIjIAKxREREQy4YWtXuG///2vzh1+9NFHrx0MERGRMSvLZ3nolFB06dJFp84UCgXy8vIMiYeIiIiMkE4JhUajKe44iIiIjF5Zvn25QXMoMjMzYW5uLlcsRERERq0sD3nofZZHXl4eZsyYgbfeegvW1ta4efMmAGDSpElYsWKF7AESEREZi/xJmYYuxkjvhGLmzJkICwvD7NmzoVQqpfX16tXD8uXLZQ2OiIiIjIPeCcWaNWvw008/oXfv3jA1NZXWN2jQANevX5c1OCIiImOSP+Rh6GKM9J5Dce/ePVSvXr3Aeo1Gg5ycHFmCIiIiMkZleVKm3hUKDw8PHDt2rMD6TZs2oVGjRrIERURERMZF7wrF5MmTERgYiHv37kGj0WDLli2IiorCmjVrsHPnzuKIkYiIyCgo/n8xtA9jpHeFonPnztixYwf2798PKysrTJ48GdeuXcOOHTvQrl274oiRiIjIKJTlszxe6zoU77//PiIiIuSOhYiIiIzUa1/Y6syZM7h27RqAZ/MqmjRpIltQRERExqgs375c74Ti7t276NWrF06cOAE7OzsAQFJSEt577z1s2LABlSpVkjtGIiIio1CW7zaq9xyKQYMGIScnB9euXcPjx4/x+PFjXLt2DRqNBoMGDSqOGImIiOgNp3eF4siRIzh58iRq1aolratVqxYWLFiA999/X9bgiIiIjI2RFhgMpndC4ebmVugFrPLy8uDq6ipLUERERMaIQx56mDNnDkaMGIEzZ85I686cOYPPP/8c3333nazBERERGZP8SZmGLsZIpwpF+fLltTKm9PR0NG/eHOXKPXt6bm4uypUrhwEDBqBLly7FEigRERG9uXRKKObNm1fMYRARERm/sjzkoVNCERgYWNxxEBERGb2yfOnt176wFQBkZmYiOztba51arTYoICIiIjI+ek/KTE9Px/Dhw+Ho6AgrKyuUL19eayEiIiqr8m9fbuiiq9DQULzzzjuwsbGBo6MjunTpgqioKK02mZmZCA4ORoUKFWBtbY1u3bohISFBq01cXBw6duwIS0tLODo6YuzYscjNzdXv2PVqDWDcuHE4ePAgFi9eDJVKheXLl2PatGlwdXXFmjVr9O2OiIjoH0OhkGfR1ZEjRxAcHIzff/8dERERyMnJga+vL9LT06U2ISEh2LFjB3799VccOXIE9+/fR0BAgLQ9Ly8PHTt2RHZ2Nk6ePInVq1cjLCwMkydP1u/YhRBCnydUrlwZa9asQevWraFWq3Hu3DlUr14da9euxfr167Fr1y69AjAGKSkpsLW1hcpzMBSmytIOh6hYPDn9Y2mHQFQsUlJS4FTBFsnJycU2LJ//d6LfqkgoLa0N6is7Iw1r+nu9VrwPHz6Eo6Mjjhw5gpYtWyI5ORkODg4IDw9H9+7dAQDXr19HnTp1EBkZiXfffRe7d+/Ghx9+iPv378PJyQkAsGTJEowfPx4PHz6EUqnb3z29KxSPHz9G1apVATybL/H48WMAQIsWLXD06FF9uyMiIvrHKO3blycnJwMA7O3tAQBnz55FTk4OfHx8pDa1a9dG5cqVERkZCQCIjIyEp6enlEwAgJ+fH1JSUnDlyhWd9613QlG1alXExsZKQf3yyy8AgB07dkg3CyMiIiqL5BzySElJ0VqysrJeum+NRoMvvvgC3t7eqFevHgAgPj4eSqWywN9nJycnxMfHS22eTybyt+dv05XeCUX//v1x8eJFAMCECROwcOFCmJubIyQkBGPHjtW3OyIiIiqEm5sbbG1tpSU0NPSl7YODg/Hnn39iw4YNJRShNr1PGw0JCZH+7+Pjg+vXr+Ps2bOoXr066tevL2twRERExkTfszSK6gMA7ty5ozWHQqVSFfmc4cOHY+fOnTh69CgqVaokrXd2dkZ2djaSkpK0qhQJCQlwdnaW2vzxxx9a/eWfBZLfRqe4dW5ZBHd3dwQEBDCZICKiMk/OIQ+1Wq21FJZQCCEwfPhwbN26FQcPHkSVKlW0tjdp0gRmZmY4cOCAtC4qKgpxcXHw8vICAHh5eeHy5ctITEyU2kRERECtVsPDw0PnY9epQjF//nydOxw5cqTObYmIiP5JSvrS28HBwQgPD8f27dthY2MjzXmwtbWFhYUFbG1tMXDgQIwaNQr29vZQq9UYMWIEvLy88O677wIAfH194eHhgb59+2L27NmIj4/H119/jeDg4JdWRV6kU0Ixd+5cnTpTKBRMKIiIiErI4sWLAQCtW7fWWr9q1SoEBQUBePY33MTEBN26dUNWVhb8/PywaNEiqa2pqSl27tyJYcOGwcvLC1ZWVggMDMT06dP1ikXv61CURfnnF8fFP+alxekf69dLd0s7BKJi8TQ9FSPbepbIdSiG/PyHLNeh+KlPs2KNtzgYdC8PIiIi+p+yfLdRgydlEhEREbFCQUREJBOFAjAxsMBgpAUKJhRERERyMZEhoTD0+aWFQx5ERERksNdKKI4dO4Y+ffrAy8sL9+7dAwCsXbsWx48flzU4IiIiY1LaNwcrTXonFJs3b4afnx8sLCxw/vx56WYlycnJmDVrluwBEhERGYv8IQ9DF2Okd0LxzTffYMmSJVi2bBnMzMyk9d7e3jh37pyswREREZFx0HtSZlRUFFq2bFlgva2tLZKSkuSIiYiIyCg9fy8OQ/owRnpXKJydnREdHV1g/fHjx1G1alVZgiIiIjJG+XcbNXQxRnonFIMHD8bnn3+OU6dOQaFQ4P79+1i3bh3GjBmDYcOGFUeMRERERsFEpsUY6T3kMWHCBGg0GrRt2xYZGRlo2bIlVCoVxowZgxEjRhRHjERERPSG0zuhUCgU+OqrrzB27FhER0cjLS0NHh4esLY27GYoRERExq4sz6F47StlKpVKeHh4yBkLERGRUTOB4XMgTGCcGYXeCUWbNm1eetGNgwcPGhQQERERGR+9E4qGDRtqPc7JycGFCxfw559/IjAwUK64iIiIjA6HPPQwd+7cQtdPnToVaWlpBgdERERkrHhzMBn06dMHK1eulKs7IiIiMiKy3b48MjIS5ubmcnVHRERkdBQKGDwps8wMeQQEBGg9FkLgwYMHOHPmDCZNmiRbYERERMaGcyj0YGtrq/XYxMQEtWrVwvTp0+Hr6ytbYERERGQ89Eoo8vLy0L9/f3h6eqJ8+fLFFRMREZFR4qRMHZmamsLX15d3FSUiIiqEQqZ/xkjvszzq1auHmzdvFkcsRERERi2/QmHoYoz0Tii++eYbjBkzBjt37sSDBw+QkpKitRAREVHZo/MciunTp2P06NHo0KEDAOCjjz7SugS3EAIKhQJ5eXnyR0lERGQEyvIcCp0TimnTpmHo0KE4dOhQccZDRERktBQKxUvvd6VrH8ZI54RCCAEAaNWqVbEFQ0RERMZJr9NGjTVrIiIiKgkc8tBRzZo1X5lUPH782KCAiIiIjBWvlKmjadOmFbhSJhEREZFeCUXPnj3h6OhYXLEQEREZNROFwuCbgxn6/NKic0LB+RNEREQvV5bnUOh8Yav8szyIiIiIXqRzhUKj0RRnHERERMZPhkmZRnorD/1vX05ERESFM4ECJgZmBIY+v7QwoSAiIpJJWT5tVO+bgxERERG9iAkFERGRTErj9uVHjx5Fp06d4OrqCoVCgW3btmltDwoKku4xkr+0b99eq83jx4/Ru3dvqNVq2NnZYeDAgUhLS9Pv2PULm4iIiIqSfx0KQxd9pKeno0GDBli4cGGRbdq3b48HDx5Iy/r167W29+7dG1euXEFERAR27tyJo0ePYsiQIXrFwTkURERERszf3x/+/v4vbaNSqeDs7FzotmvXrmHPnj04ffo0mjZtCgBYsGABOnTogO+++w6urq46xcEKBRERkUzyJ2UaugBASkqK1pKVlfXacR0+fBiOjo6oVasWhg0bhkePHknbIiMjYWdnJyUTAODj4wMTExOcOnVK530woSAiIpKJCWQY8vj/00bd3Nxga2srLaGhoa8VU/v27bFmzRocOHAA//73v3HkyBH4+/sjLy8PABAfH1/gthrlypWDvb094uPjdd4PhzyIiIjeQHfu3IFarZYeq1Sq1+qnZ8+e0v89PT1Rv359VKtWDYcPH0bbtm0NjjMfKxREREQykXPIQ61Way2vm1C8qGrVqqhYsSKio6MBAM7OzkhMTNRqk5ubi8ePHxc576IwTCiIiIhkYiLTUpzu3r2LR48ewcXFBQDg5eWFpKQknD17Vmpz8OBBaDQaNG/eXOd+OeRBRERkxNLS0qRqAwDExsbiwoULsLe3h729PaZNm4Zu3brB2dkZMTExGDduHKpXrw4/Pz8AQJ06ddC+fXsMHjwYS5YsQU5ODoYPH46ePXvqfIYHwAoFERGRbF68gNTrLvo4c+YMGjVqhEaNGgEARo0ahUaNGmHy5MkwNTXFpUuX8NFHH6FmzZoYOHAgmjRpgmPHjmkNoaxbtw61a9dG27Zt0aFDB7Ro0QI//fSTXnGwQkFERCQTBQy/Wai+z2/dujWEEEVu37t37yv7sLe3R3h4uJ571saEgoiISCavc6XLwvowRhzyICIiIoOxQkFERCQj46wvGI4JBRERkUyev46EIX0YIw55EBERkcFYoSAiIpLJ65z2WVgfxogJBRERkUzkuNKlsQ4dGGvcRERE9AZhhYKIiEgmHPIgIiIig5XGlTLfFBzyICIiIoOxQkFERCQTDnkQERGRwcryWR5MKIiIiGRSlisUxpoIERER0RuEFQoiIiKZlOWzPJhQEBERyYQ3ByMiIiIyACsUREREMjGBAiYGDloY+vzSwoSCiIhIJhzyICIiIjIAKxREREQyUfz/P0P7MEZMKIiIiGTCIQ8iIiIiA7BCQUREJBOFDGd5cMiDiIiojCvLQx5MKIiIiGRSlhMKzqEgIiIig7FCQUREJBOeNkpEREQGM1E8WwztwxhxyIOIiIgMxgoFERGRTDjkQURERAbjWR5EREREBmCFgoiISCYKGD5kYaQFCiYUREREcuFZHkREREQGYIWCSk3k+WgsCj+IS1F3kPB3ClaFDoR/q/rSduf3Pi/0eZOCP0Jw77YlFSaRTqJv3MGBfacRFxePlOR0DBraBQ0a1ii07YZ1+3Di2EUE/KsN2rRtKq2/E5eA7VuOIO52PBQmCjRsVBMB3dtAZa4sqcMgA5XGWR5Hjx7FnDlzcPbsWTx48ABbt25Fly5dpO1CCEyZMgXLli1DUlISvL29sXjxYtSo8b+fz8ePH2PEiBHYsWMHTExM0K1bN/zwww+wtrbWOY5SrVAEBQVBoVBg6NChBbYFBwdDoVAgKCio5AOjEpGRmY261d9C6OjuhW6/tGOG1jL3y15QKBT4sHWDEo6U6NWysnLwViUH9Ojp89J2F8//hVux92Frq/1BnZyUhh/n/QIHRzuMHt8Hn43ojgf3/8bPq3cXZ9gks/yzPAxd9JGeno4GDRpg4cKFhW6fPXs25s+fjyVLluDUqVOwsrKCn58fMjMzpTa9e/fGlStXEBERgZ07d+Lo0aMYMmSIXnGUeoXCzc0NGzZswNy5c2FhYQEAyMzMRHh4OCpXrvza/QohkJeXh3LlSv0QqQhtvTzQ1sujyO2OFdRaj/ce+xPejavD/a2KxR0akd7q1quKuvWqvrRN0pNUbNp4AJ+N/BeW/LhZa9ufl2NgamqCf/VsB5P/H0Tv2dsXoTPC8DDxCRwcyxdb7CQfBQyfVKnv8/39/eHv71/oNiEE5s2bh6+//hqdO3cGAKxZswZOTk7Ytm0bevbsiWvXrmHPnj04ffo0mjZ9VjFbsGABOnTogO+++w6urq46xVHqcygaN24MNzc3bNmyRVq3ZcsWVK5cGY0aNZLWZWVlYeTIkXB0dIS5uTlatGiB06dPS9sPHz4MhUKB3bt3o0mTJlCpVDh+/Dg0Gg1CQ0NRpUoVWFhYoEGDBti0aVOJHiMZ7uHjFOw/eQWfdHq3tEMhei0ajcCasF1o264ZXFwLJsW5uXkwLWcqJRMAYGb27AtRTPS9EouT/lliY2MRHx8PH5//Vc5sbW3RvHlzREZGAgAiIyNhZ2cnJRMA4OPjAxMTE5w6dUrnfZV6QgEAAwYMwKpVq6THK1euRP/+/bXajBs3Dps3b8bq1atx7tw5VK9eHX5+fnj8+LFWuwkTJuDbb7/FtWvXUL9+fYSGhmLNmjVYsmQJrly5gpCQEPTp0wdHjhwpMp6srCykpKRoLVS6Nu46DWtLc3RoxeEOMk77952CqYkCrT5oXOj2mrUqIyU5Hfv3/YHc3DxkpGfiv1uPAgBSUtJKMlQygAkUMFEYuPx/jeLFv0NZWVl6xxMfHw8AcHJy0lrv5OQkbYuPj4ejo6PW9nLlysHe3l5qo9uxvwH69OmD48eP4/bt27h9+zZOnDiBPn36SNvT09OxePFizJkzB/7+/vDw8MCyZctgYWGBFStWaPU1ffp0tGvXDtWqVYOVlRVmzZqFlStXws/PD1WrVkVQUBD69OmDpUuXFhlPaGgobG1tpcXNza3Yjp10s2Hn7wjwawJzlVlph0Kkt7jb8Th88Cz6BHaAoogBchfXiugb5I+D+09j9Mi5+Gr8IlSoaAsbtWWRz6E3j0KmBXg2JeD5v0WhoaEleSh6eyMmGDg4OKBjx44ICwuDEAIdO3ZExYr/KwnGxMQgJycH3t7e0jozMzM0a9YM165d0+rr+ZJNdHQ0MjIy0K5dO6022dnZWsMpL5o4cSJGjRolPU5JSWFSUYp+vxCD6LhELJ0RVNqhEL2WmOi7SEvNwOQvl0jrNBqBrZsO4/CBs5g261MAQNNmHmjazAMpKelQKc0ABXBw/xlUrGhXSpFTabpz5w7U6v/NJVOpVHr34ezsDABISEiAi4uLtD4hIQENGzaU2iQmJmo9Lzc3F48fP5aer4s3IqEAng17DB8+HACKnKmqCysrK+n/aWnPyoS//fYb3nrrLa12L3tjVCrVa71xVDzCd/6O+rXdULfGW69uTPQGata8LmrVdtdat2j+Jrzzrgfe9fIs0F6tfvY5FnniMszMyqFWHfcCbegNJeOsTLVarZVQvI4qVarA2dkZBw4ckBKIlJQUnDp1CsOGDQMAeHl5ISkpCWfPnkWTJk0AAAcPHoRGo0Hz5s113tcbk1C0b98e2dnZUCgU8PPz09pWrVo1KJVKnDhxAu7uz36xcnJycPr0aXzxxRdF9unh4QGVSoW4uDi0atWqOMOn15CekYXYuw+lx3EPHuHPv+7CTm2JSs72AIDU9EzsOHgBU0d0Lq0wiXSSlZmNhw+fSI8f/Z2Mu3cSYGllAXt7NaysLbTam5qaQK22gtP//6wDwJFD51C12ltQqcxw/dotbNt8BB91bQlLS/MSOw4yTGlchyItLQ3R0dHS49jYWFy4cAH29vaoXLkyvvjiC3zzzTeoUaMGqlSpgkmTJsHV1VW6VkWdOnXQvn17DB48GEuWLEFOTg6GDx+Onj176nyGB/AGJRSmpqbS8IWpqanWNisrKwwbNgxjx46VXqDZs2cjIyMDAwcOLLJPGxsbjBkzBiEhIdBoNGjRogWSk5Nx4sQJqNVqBAYGFusx0ctduB6HbsN/lB5Pmb8NANCjQzPM/7o3AGBbxDlACHRt16Q0QiTSWdzteMyfu1F6vHXTIQBAs3from9QB536uH3rAXbtPIHsrBw4OtmjZ29fNHu3brHES/8cZ86cQZs2baTH+UP2gYGBCAsLw7hx45Ceno4hQ4YgKSkJLVq0wJ49e2Bu/r9Edd26dRg+fDjatm0rXdhq/vz5esWhEEIIeQ5Jf0FBQUhKSsK2bdsK3d6lSxfY2dkhLCwMmZmZGDduHNavX4/U1FQ0bdoUc+fOxTvvvAPg2Wmjbdq0wZMnT2BnZyf1IYTA/PnzsXjxYty8eRN2dnZo3LgxvvzyS7Rs2VKnOFNSUmBra4u4+McGl5+I3lS/Xrpb2iEQFYun6akY2dYTycnJxfYZnv934sCFOFjbGLaPtNQUtG1YuVjjLQ6lmlAYCyYUVBYwoaB/qpJMKA7KlFB8YIQJxRtx2igREREZtzdmDgUREZHRK41rb78hmFAQERHJpDTO8nhTMKEgIiKSyevcLbSwPowR51AQERGRwVihICIikkkZnkLBhIKIiEg2ZTij4JAHERERGYwVCiIiIpnwLA8iIiIyGM/yICIiIjIAKxREREQyKcNzMplQEBERyaYMZxQc8iAiIiKDsUJBREQkE57lQURERAYry2d5MKEgIiKSSRmeQsE5FERERGQ4ViiIiIjkUoZLFEwoiIiIZFKWJ2VyyIOIiIgMxgoFERGRTHiWBxERERmsDE+h4JAHERERGY4VCiIiIrmU4RIFEwoiIiKZ8CwPIiIiIgOwQkFERCQTnuVBREREBivDUyiYUBAREcmmDGcUnENBREREBmOFgoiISCZl+SwPJhRERERykWFSppHmExzyICIiIsOxQkFERCSTMjwnkwkFERGRbMpwRsEhDyIiIjIYEwoiIiKZKGT6p6upU6dCoVBoLbVr15a2Z2ZmIjg4GBUqVIC1tTW6deuGhISE4jh0JhRERERyyb/0tqGLPurWrYsHDx5Iy/Hjx6VtISEh2LFjB3799VccOXIE9+/fR0BAgMxH/QznUBARERmxcuXKwdnZucD65ORkrFixAuHh4fjggw8AAKtWrUKdOnXw+++/491335U1DlYoiIiIZKKQaQGAlJQUrSUrK6vQfd64cQOurq6oWrUqevfujbi4OADA2bNnkZOTAx8fH6lt7dq1UblyZURGRsp85EwoiIiI5CNjRuHm5gZbW1tpCQ0NLbC75s2bIywsDHv27MHixYsRGxuL999/H6mpqYiPj4dSqYSdnZ3Wc5ycnBAfHy/7oXPIg4iISCZyXnr7zp07UKvV0nqVSlWgrb+/v/T/+vXro3nz5nB3d8cvv/wCCwsLg+LQFysUREREbyC1Wq21FJZQvMjOzg41a9ZEdHQ0nJ2dkZ2djaSkJK02CQkJhc65MBQTCiIiIpkoIMNZHgbsPy0tDTExMXBxcUGTJk1gZmaGAwcOSNujoqIQFxcHLy8vg4/1RRzyICIikklJXyhzzJgx6NSpE9zd3XH//n1MmTIFpqam6NWrF2xtbTFw4ECMGjUK9vb2UKvVGDFiBLy8vGQ/wwNgQkFERGS07t69i169euHRo0dwcHBAixYt8Pvvv8PBwQEAMHfuXJiYmKBbt27IysqCn58fFi1aVCyxMKEgIiKSyetcmKqwPnS1YcOGl243NzfHwoULsXDhQsOC0gETCiIiItmU3buDcVImERERGYwVCiIiIpmU9JDHm4QJBRERkUzK7oAHhzyIiIhIBqxQEBERyYRDHkRERGQwOe/lYWyYUBAREcmlDE+i4BwKIiIiMhgrFERERDIpwwUKJhRERERyKcuTMjnkQURERAZjhYKIiEgmPMuDiIiIDFeGJ1FwyIOIiIgMxgoFERGRTMpwgYIJBRERkVx4lgcRERGRAVihICIiko3hZ3kY66AHEwoiIiKZcMiDiIiIyABMKIiIiMhgHPIgIiKSSVke8mBCQUREJJOyfOltDnkQERGRwVihICIikgmHPIiIiMhgZfnS2xzyICIiIoOxQkFERCSXMlyiYEJBREQkE57lQURERGQAViiIiIhkwrM8iIiIyGBleAoFEwoiIiLZlOGMgnMoiIiIyGCsUBAREcmkLJ/lwYSCiIhIJpyUSS8lhAAApKamlHIkRMXnaXpqaYdAVCyepqcB+N9neXFKSTH874QcfZQGJhQ6SE199kFbt8bbpRsIERG9ttTUVNja2hZL30qlEs7OzqhRxU2W/pydnaFUKmXpq6QoREmkbEZOo9Hg/v37sLGxgcJYa1FGJCUlBW5ubrhz5w7UanVph0MkO/6MlywhBFJTU+Hq6goTk+I7FyEzMxPZ2dmy9KVUKmFubi5LXyWFFQodmJiYoFKlSqUdRpmjVqv5YUv/aPwZLznFVZl4nrm5udElAXLiaaNERERkMCYUREREZDAmFPTGUalUmDJlClQqVWmHQlQs+DNO/0SclElEREQGY4WCiIiIDMaEgoiIiAzGhIKIiIgMxoSCiIiIDMaEgopVUFAQunTpUtphEMkuKCgICoUCQ4cOLbAtODgYCoUCQUFBJR8YUSlhQkFE9Jrc3NywYcMGPH36VFqXmZmJ8PBwVK5c+bX7FUIgNzdXjhCJSgwTCio1f/75J/z9/WFtbQ0nJyf07dsXf//9t7R906ZN8PT0hIWFBSpUqAAfHx+kp6cDAA4fPoxmzZrBysoKdnZ28Pb2xu3bt0vrUKiMaty4Mdzc3LBlyxZp3ZYtW1C5cmU0atRIWpeVlYWRI0fC0dER5ubmaNGiBU6fPi1tP3z4MBQKBXbv3o0mTZpApVLh+PHj0Gg0CA0NRZUqVWBhYYEGDRpg06ZNJXqMRLpiQkGlIikpCR988AEaNWqEM2fOYM+ePUhISECPHj0AAA8ePECvXr0wYMAAXLt2DYcPH0ZAQID0za1Lly5o1aoVLl26hMjISAwZMoQ3bqNSMWDAAKxatUp6vHLlSvTv31+rzbhx47B582asXr0a586dQ/Xq1eHn54fHjx9rtZswYQK+/fZbXLt2DfXr10doaCjWrFmDJUuW4MqVKwgJCUGfPn1w5MiREjk2Ir0IomIUGBgoOnfuXGD9jBkzhK+vr9a6O3fuCAAiKipKnD17VgAQt27dKvDcR48eCQDi8OHDxRU20Svl/2wnJiYKlUolbt26JW7duiXMzc3Fw4cPRefOnUVgYKBIS0sTZmZmYt26ddJzs7Ozhaurq5g9e7YQQohDhw4JAGLbtm1Sm8zMTGFpaSlOnjyptd+BAweKXr16lcxBEumBdxulUnHx4kUcOnQI1tbWBbbFxMTA19cXbdu2haenJ/z8/ODr64vu3bujfPnysLe3R1BQEPz8/NCuXTv4+PigR48ecHFxKYUjobLOwcEBHTt2RFhYGIQQ6NixIypWrChtj4mJQU5ODry9vaV1ZmZmaNasGa5du6bVV9OmTaX/R0dHIyMjA+3atdNqk52drTWcQvSmYEJBpSItLQ2dOnXCv//97wLbXFxcYGpqioiICJw8eRL79u3DggUL8NVXX+HUqVOoUqUKVq1ahZEjR2LPnj3YuHEjvv76a0RERODdd98thaOhsm7AgAEYPnw4AGDhwoWv3Y+VlZX0/7S0NADAb7/9hrfeekurHe8BQm8izqGgUtG4cWNcuXIFb7/9NqpXr6615H+oKhQKeHt7Y9q0aTh//jyUSiW2bt0q9dGoUSNMnDgRJ0+eRL169RAeHl5ah0NlXPv27ZGdnY2cnBz4+flpbatWrRqUSiVOnDghrcvJycHp06fh4eFRZJ8eHh5QqVSIi4sr8Dvi5uZWbMdC9LpYoaBil5ycjAsXLmitGzJkCJYtW4ZevXph3LhxsLe3R3R0NDZs2IDly5fjzJkzOHDgAHx9feHo6IhTp07h4cOHqFOnDmJjY/HTTz/ho48+gqurK6KionDjxg3069evdA6QyjxTU1Np+MLU1FRrm5WVFYYNG4axY8fC3t4elStXxuzZs5GRkYGBAwcW2aeNjQ3GjBmDkJAQaDQatGjRAsnJyThx4gTUajUCAwOL9ZiI9MWEgord4cOHC4z5Dhw4ECdOnMD48ePh6+uLrKwsuLu7o3379jAxMYFarcbRo0cxb948pKSkwN3dHd9//z38/f2RkJCA69evY/Xq1Xj06BFcXFwQHByMTz/9tJSOkAhQq9VFbvv222+h0WjQt29fpKamomnTpti7dy/Kly//0j5nzJgBBwcHhIaG4ubNm7Czs0Pjxo3x5Zdfyh0+kcF4+3IiIiIyGOdQEBERkcGYUBAREZHBmFAQERGRwZhQEBERkcGYUBAREZHBmFAQERGRwZhQEBERkcGYUBAZiaCgIHTp0kV63Lp1a3zxxRclHsfhw4ehUCiQlJRUZBuFQoFt27bp3OfUqVPRsGFDg+K6desWFApFgauyElHJYEJBZICgoCAoFAooFAoolUpUr14d06dPR25ubrHve8uWLZgxY4ZObXVJAoiIDMFLbxMZqH379li1ahWysrKwa9cuBAcHw8zMDBMnTizQNjs7G0qlUpb92tvby9IPEZEcWKEgMpBKpYKzszPc3d0xbNgw+Pj44L///S+A/w1TzJw5E66urqhVqxYA4M6dO+jRowfs7Oxgb2+Pzp0749atW1KfeXl5GDVqFOzs7FChQgWMGzcOL14l/8Uhj6ysLIwfPx5ubm5QqVSoXr06VqxYgVu3bqFNmzYAgPLly0OhUCAoKAgAoNFoEBoaiipVqsDCwgINGjTApk2btPaza9cu1KxZExYWFmjTpo1WnLoaP348atasCUtLS1StWhWTJk1CTk5OgXZLly6Fm5sbLC0t0aNHDyQnJ2ttX758OerUqQNzc3PUrl0bixYt0jsWIioeTCiIZGZhYYHs7Gzp8YEDBxAVFYWIiAjs3LlTusW1jY0Njh07hhMnTsDa2lq6BTYAfP/99wgLC8PKlStx/PhxPH78WOvW7YXp168f1q9fj/nz5+PatWtYunQprK2t4ebmhs2bNwMAoqKi8ODBA/zwww8AgNDQUKxZswZLlizBlStXEBISgj59+uDIkSMAniU+AQEB6NSpEy5cuIBBgwZhwoQJer8mNjY2CAsLw9WrV/HDDz9g2bJlmDt3rlab6Oho/PLLL9ixYwf27NmD8+fP47PPPpO2r1u3DpMnT8bMmTNx7do1zJo1C5MmTcLq1av1joeIioEgotcWGBgoOnfuLIQQQqPRiIiICKFSqcSYMWOk7U5OTiIrK0t6ztq1a0WtWrWERqOR1mVlZQkLCwuxd+9eIYQQLi4uYvbs2dL2nJwcUalSJWlfQgjRqlUr8fnnnwshhIiKihIARERERKFxHjp0SAAQT548kdZlZmYKS0tLcfLkSa22AwcOFL169RJCCDFx4kTh4eGhtX38+PEF+noRALF169Yit8+ZM0c0adJEejxlyhRhamoq7t69K63bvXu3MDExEQ8ePBBCCFGtWjURHh6u1c+MGTOEl5eXEEKI2NhYAUCcP3++yP0SUfHhHAoiA+3cuRPW1tbIycmBRqPBJ598gqlTp0rbPT09teZNXLx4EdHR0bCxsdHqJzMzEzExMUhOTsaDBw/QvHlzaVu5cuXQtGnTAsMe+S5cuABTU1O0atVK57ijo6ORkZGBdu3aaa3Pzs6Wbjd/7do1rTgAwMvLS+d95Nu4cSPmz5+PmJgYpKWlITc3t8DtvitXroy33npLaz8ajQZRUVGwsbFBTEwMBg4ciMGDB0ttcnNzYWtrq3c8RCQ/JhREBmrTpg0WL14MpVIJV1dXlCun/WtlZWWl9TgtLQ1NmjTBunXrCvTl4ODwWjFYWFjo/Zy0tDQAwG+//ab1hxx4Ni9ELpGRkejduzemTZsGPz8/2NraYsOGDfj+++/1jnXZsmUFEhxTU1PZYiWi18eEgshAVlZWqF69us7tGzdujI0bN8LR0bHAt/R8Li4uOHXqFFq2bAng2Tfxs2fPonHjxoW29/T0hEajwZEjR+Dj41Nge36FJC8vT1rn4eEBlUqFuLi4IisbderUkSaY5vv9999ffZDPOXnyJNzd3fHVV19J627fvl2gXVxcHO7fvw9XV1dpPyYmJqhVqxacnJzg6uqKmzdvonfv3nrtn4hKBidlEpWw3r17o2LFiujcuTOOHTuG2NhYHD58GCNHjsTdu3cBAJ9//jm+/fZbbNu2DdevX8dnn3320mtIvP322wgMDMSAAQOwbds2qc9ffvkFAODu7g6FQoGdO3fi4cOHSEtLg42NDcaMGYOQkBCsXr0aMTExOHfuHBYsWCBNdBw6dChu3LiBsWPHIioqCuHh4QgLC9PreGvUqIG4uDhs2LABMTExmD9/fqETTM3NzREYGIiLFy/i2LFjGDlyJHr06AFnZ2cAwLRp0xAaGor58+fjr7/+wuXLl7Fq1Sr85z//0SseIioeTCiISpilpSWOHj2KypUrIyAgAHXq1MHAgQORmZkpVSxGjx6Nvn37IjAwEF5eXrCxsUHXrl1f2u/ixYvRvXt3fPbZZ6hduzYGDx6M9PR0AMBbb72FadOmYcKECXBycsLw4cMBADNmzMCkSZMQGhqKOnXqoH379vjtt99QpUoVAM/mNWzevBnbtm1DgwYNsGTJEsyaNUuv4/3oo48QEhKC4cOHo2HDhjh58iQmTZpUoF316tUREBCADh06wNfXF/Xr19c6LXTQoEFYvnw5Vq1aBU9PT7Rq1QphYWFSrERUuhSiqFleRERERDpihYKIiIgMxoSCiIiIDMaEgoiIiAzGhIKIiIgMxoSCiIiIDMaEgoiIiAzGhIKIiIgMxoSCiIiIDMaEgoiIiAzGhIKIiIgMxoSCiIiIDMaEgoiIiAz2fyeITLmaUR3uAAAAAElFTkSuQmCC", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import pandas as pd\n", + "import matplotlib.pyplot as plt\n", + "import seaborn as sns\n", + "from sklearn.model_selection import train_test_split, GridSearchCV\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression, LogisticRegression\n", + "from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier\n", + "from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, ConfusionMatrixDisplay\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Список моделей и их гиперпараметров для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": (LinearRegression(), {}),\n", + " \"Random Forest Regression\": (RandomForestRegressor(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__max_depth': [None, 10, 20]\n", + " }),\n", + " \"Gradient Boosting Regression\": (GradientBoostingRegressor(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__learning_rate': [0.01, 0.1],\n", + " 'model__max_depth': [3, 5]\n", + " })\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df[categorical_cols + numerical_cols]\n", + "y_reg = df['charges']\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи регрессии\n", + "X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи регрессии\n", + "print(\"Результаты для задачи регрессии:\")\n", + "for name, (model, params) in models_reg.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " grid_search = GridSearchCV(pipeline, params, cv=5, scoring='neg_mean_absolute_error')\n", + " grid_search.fit(X_train_reg, y_train_reg)\n", + " best_model = grid_search.best_estimator_\n", + " y_pred_reg = best_model.predict(X_test_reg)\n", + " mae = mean_absolute_error(y_test_reg, y_pred_reg)\n", + " mse = mean_squared_error(y_test_reg, y_pred_reg)\n", + " rmse = mean_squared_error(y_test_reg, y_pred_reg, squared=False)\n", + " r2 = r2_score(y_test_reg, y_pred_reg)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Best Parameters: {grid_search.best_params_}\")\n", + " print(f\"MAE: {mae}\")\n", + " print(f\"MSE: {mse}\")\n", + " print(f\"RMSE: {rmse}\")\n", + " print(f\"R²: {r2}\")\n", + " print()\n", + "\n", + "# Список моделей и их гиперпараметров для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": (LogisticRegression(), {\n", + " 'model__C': [0.1, 1, 10],\n", + " 'model__solver': ['liblinear', 'lbfgs']\n", + " }),\n", + " \"Random Forest Classification\": (RandomForestClassifier(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__max_depth': [None, 10, 20]\n", + " }),\n", + " \"Gradient Boosting Classification\": (GradientBoostingClassifier(), {\n", + " 'model__n_estimators': [100, 200],\n", + " 'model__learning_rate': [0.01, 0.1],\n", + " 'model__max_depth': [3, 5]\n", + " })\n", + "}\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df[categorical_cols + numerical_cols]\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Разделяем данные на обучающую и тестовую выборки для задачи классификации\n", + "X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(X_class, y_class, test_size=0.2, random_state=42)\n", + "\n", + "# Обучаем и оцениваем модели для задачи классификации\n", + "print(\"Результаты для задачи классификации:\")\n", + "for name, (model, params) in models_class.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " grid_search = GridSearchCV(pipeline, params, cv=5, scoring='accuracy')\n", + " grid_search.fit(X_train_class, y_train_class)\n", + " best_model = grid_search.best_estimator_\n", + " y_pred_class = best_model.predict(X_test_class)\n", + " accuracy = accuracy_score(y_test_class, y_pred_class)\n", + " precision = precision_score(y_test_class, y_pred_class)\n", + " recall = recall_score(y_test_class, y_pred_class)\n", + " f1 = f1_score(y_test_class, y_pred_class)\n", + " print(f\"Model: {name}\")\n", + " print(f\"Best Parameters: {grid_search.best_params_}\")\n", + " print(f\"Accuracy: {accuracy}\")\n", + " print(f\"Precision: {precision}\")\n", + " print(f\"Recall: {recall}\")\n", + " print(f\"F1-score: {f1}\")\n", + " print()\n", + "\n", + " # Визуализация матрицы ошибок\n", + " cm = confusion_matrix(y_test_class, y_pred_class)\n", + " disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=['Less', 'More'])\n", + " disp.plot(cmap=plt.cm.Blues)\n", + " plt.title(f'Confusion Matrix for {name}')\n", + " plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Давайте проанализируем полученные значения метрик и определим, являются ли они нормальными или их можно улучшить.\n", + "\n", + "### Оценка смещения и дисперсии для задачи регрессии:\n", + "\n", + "### Вывод для задачи регрессии:\n", + "\n", + "- **Random Forest Regression** демонстрирует наилучшие результаты по метрикам MAE и R², что указывает на высокую точность и стабильность модели.\n", + "- **Linear Regression** и **Gradient Boosting Regression** также показывают хорошие результаты, но уступают случайному лесу.\n", + "\n", + "### Вывод для задачи классификации:\n", + "\n", + "- **Random Forest Classification** демонстрирует наилучшие результаты по всем метрикам (Accuracy, Precision, Recall, F1-score), что указывает на высокую точность и стабильность модели.\n", + "- **Logistic Regression** и **Gradient Boosting Classification** также показывают хорошие результаты, но уступают случайному лесу.\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Для оценки смещения (bias) и дисперсии (variance) моделей можно использовать метод перекрестной проверки (cross-validation). Этот метод позволяет оценить, насколько хорошо модель обобщается на новых данных.\n", + "\n", + "Оценка смещения и дисперсии для задачи регрессии:\n", + "Для задачи регрессии мы будем использовать метрики MAE (Mean Absolute Error) и R² (R-squared) для оценки смещения и дисперсии.\n", + "\n", + "Оценка смещения и дисперсии для задачи классификации:\n", + "Для задачи классификации мы будем использовать метрики Accuracy, Precision, Recall и F1-score для оценки смещения и дисперсии.\n", + "\n", + "Пример кода для оценки смещения и дисперсии:" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Оценка смещения и дисперсии для задачи регрессии:\n", + "Model: Linear Regression\n", + "MAE (Cross-Validation): Mean = 4185.5421072063355, Std = 92.43821200753904\n", + "R² (Cross-Validation): Mean = 0.7497293059031158, Std = 0.008805026203658282\n", + "\n", + "Model: Random Forest Regression\n", + "MAE (Cross-Validation): Mean = 956.4848341519103, Std = 88.92646158556248\n", + "R² (Cross-Validation): Mean = 0.9768968000358168, Std = 0.003942950295159459\n", + "\n", + "Model: Gradient Boosting Regression\n", + "MAE (Cross-Validation): Mean = 2189.5694438069927, Std = 96.31677771605824\n", + "R² (Cross-Validation): Mean = 0.8873175260899913, Std = 0.011188839103376261\n", + "\n", + "Оценка смещения и дисперсии для задачи классификации:\n", + "Model: Logistic Regression\n", + "Accuracy (Cross-Validation): Mean = 0.8906956776270857, Std = 0.011756347754179863\n", + "Precision (Cross-Validation): Mean = 0.9965558019216555, Std = 0.0042291925480556145\n", + "Recall (Cross-Validation): Mean = 0.6516534480440919, Std = 0.038303791687037965\n", + "F1-score (Cross-Validation): Mean = 0.7873345301431043, Std = 0.027701698921697982\n", + "\n", + "Model: Random Forest Classification\n", + "Accuracy (Cross-Validation): Mean = 0.9978352359579796, Std = 0.001767524034697101\n", + "Precision (Cross-Validation): Mean = 0.9976878612716764, Std = 0.002831780049460347\n", + "Recall (Cross-Validation): Mean = 0.9953757225433526, Std = 0.004325615476039242\n", + "F1-score (Cross-Validation): Mean = 0.9965250705740019, Std = 0.002837294532624193\n", + "\n", + "Model: Gradient Boosting Classification\n", + "Accuracy (Cross-Validation): Mean = 0.9354219923895014, Std = 0.005560116809131367\n", + "Precision (Cross-Validation): Mean = 0.9873539623899337, Std = 0.011266123317032629\n", + "Recall (Cross-Validation): Mean = 0.803226240086033, Std = 0.017698107137353723\n", + "F1-score (Cross-Validation): Mean = 0.8856692810850337, Std = 0.01067664691021022\n", + "\n" + ] + } + ], + "source": [ + "import pandas as pd\n", + "from sklearn.model_selection import cross_val_score\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression, LogisticRegression\n", + "from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier\n", + "from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df[categorical_cols + numerical_cols]\n", + "y_reg = df['charges']\n", + "\n", + "# Список моделей для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": LinearRegression(),\n", + " \"Random Forest Regression\": RandomForestRegressor(),\n", + " \"Gradient Boosting Regression\": GradientBoostingRegressor()\n", + "}\n", + "\n", + "# Оценка смещения и дисперсии для задачи регрессии\n", + "print(\"Оценка смещения и дисперсии для задачи регрессии:\")\n", + "for name, model in models_reg.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " mae_scores = -cross_val_score(pipeline, X_reg, y_reg, cv=5, scoring='neg_mean_absolute_error')\n", + " r2_scores = cross_val_score(pipeline, X_reg, y_reg, cv=5, scoring='r2')\n", + " print(f\"Model: {name}\")\n", + " print(f\"MAE (Cross-Validation): Mean = {mae_scores.mean()}, Std = {mae_scores.std()}\")\n", + " print(f\"R² (Cross-Validation): Mean = {r2_scores.mean()}, Std = {r2_scores.std()}\")\n", + " print()\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df[categorical_cols + numerical_cols]\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Список моделей для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": LogisticRegression(),\n", + " \"Random Forest Classification\": RandomForestClassifier(),\n", + " \"Gradient Boosting Classification\": GradientBoostingClassifier()\n", + "}\n", + "\n", + "# Оценка смещения и дисперсии для задачи классификации\n", + "print(\"Оценка смещения и дисперсии для задачи классификации:\")\n", + "for name, model in models_class.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " accuracy_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='accuracy')\n", + " precision_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='precision')\n", + " recall_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='recall')\n", + " f1_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='f1')\n", + " print(f\"Model: {name}\")\n", + " print(f\"Accuracy (Cross-Validation): Mean = {accuracy_scores.mean()}, Std = {accuracy_scores.std()}\")\n", + " print(f\"Precision (Cross-Validation): Mean = {precision_scores.mean()}, Std = {precision_scores.std()}\")\n", + " print(f\"Recall (Cross-Validation): Mean = {recall_scores.mean()}, Std = {recall_scores.std()}\")\n", + " print(f\"F1-score (Cross-Validation): Mean = {f1_scores.mean()}, Std = {f1_scores.std()}\")\n", + " print()" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import pandas as pd\n", + "import matplotlib.pyplot as plt\n", + "from sklearn.model_selection import cross_val_score\n", + "from sklearn.preprocessing import StandardScaler\n", + "from sklearn.linear_model import LinearRegression, LogisticRegression\n", + "from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier\n", + "from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier\n", + "from sklearn.pipeline import Pipeline\n", + "from sklearn.compose import ColumnTransformer\n", + "from sklearn.preprocessing import OneHotEncoder\n", + "\n", + "# Загружаем набор данных\n", + "df = pd.read_csv(\"..//static//csv//Medical_insurance.csv\")\n", + "\n", + "# Определяем категориальные и числовые столбцы\n", + "categorical_cols = ['sex', 'smoker', 'region']\n", + "numerical_cols = ['age', 'bmi', 'children']\n", + "\n", + "# Создаем преобразователь для категориальных и числовых столбцов\n", + "preprocessor = ColumnTransformer(\n", + " transformers=[\n", + " ('cat', OneHotEncoder(), categorical_cols),\n", + " ('num', StandardScaler(), numerical_cols)\n", + " ])\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи регрессии\n", + "X_reg = df[categorical_cols + numerical_cols]\n", + "y_reg = df['charges']\n", + "\n", + "# Список моделей для задачи регрессии\n", + "models_reg = {\n", + " \"Linear Regression\": LinearRegression(),\n", + " \"Random Forest Regression\": RandomForestRegressor(),\n", + " \"Gradient Boosting Regression\": GradientBoostingRegressor()\n", + "}\n", + "\n", + "# Оценка смещения и дисперсии для задачи регрессии\n", + "mae_means = []\n", + "mae_stds = []\n", + "r2_means = []\n", + "r2_stds = []\n", + "\n", + "for name, model in models_reg.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " mae_scores = -cross_val_score(pipeline, X_reg, y_reg, cv=5, scoring='neg_mean_absolute_error')\n", + " r2_scores = cross_val_score(pipeline, X_reg, y_reg, cv=5, scoring='r2')\n", + " mae_means.append(mae_scores.mean())\n", + " mae_stds.append(mae_scores.std())\n", + " r2_means.append(r2_scores.mean())\n", + " r2_stds.append(r2_scores.std())\n", + "\n", + "# Визуализация результатов для задачи регрессии\n", + "fig, ax = plt.subplots(1, 2, figsize=(12, 6))\n", + "\n", + "ax[0].bar(models_reg.keys(), mae_means, yerr=mae_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[0].set_ylabel('MAE')\n", + "ax[0].set_title('Mean Absolute Error (MAE) for Regression Models')\n", + "ax[0].yaxis.grid(True)\n", + "\n", + "ax[1].bar(models_reg.keys(), r2_means, yerr=r2_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[1].set_ylabel('R²')\n", + "ax[1].set_title('R-squared (R²) for Regression Models')\n", + "ax[1].yaxis.grid(True)\n", + "\n", + "plt.tight_layout()\n", + "plt.show()\n", + "\n", + "# Разделяем данные на признаки (X) и целевую переменную (y) для задачи классификации\n", + "X_class = df[categorical_cols + numerical_cols]\n", + "y_class = (df['charges'] > df['charges'].mean()).astype(int)\n", + "\n", + "# Список моделей для задачи классификации\n", + "models_class = {\n", + " \"Logistic Regression\": LogisticRegression(),\n", + " \"Random Forest Classification\": RandomForestClassifier(),\n", + " \"Gradient Boosting Classification\": GradientBoostingClassifier()\n", + "}\n", + "\n", + "# Оценка смещения и дисперсии для задачи классификации\n", + "accuracy_means = []\n", + "accuracy_stds = []\n", + "precision_means = []\n", + "precision_stds = []\n", + "recall_means = []\n", + "recall_stds = []\n", + "f1_means = []\n", + "f1_stds = []\n", + "\n", + "for name, model in models_class.items():\n", + " pipeline = Pipeline(steps=[\n", + " ('preprocessor', preprocessor),\n", + " ('model', model)\n", + " ])\n", + " accuracy_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='accuracy')\n", + " precision_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='precision')\n", + " recall_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='recall')\n", + " f1_scores = cross_val_score(pipeline, X_class, y_class, cv=5, scoring='f1')\n", + " accuracy_means.append(accuracy_scores.mean())\n", + " accuracy_stds.append(accuracy_scores.std())\n", + " precision_means.append(precision_scores.mean())\n", + " precision_stds.append(precision_scores.std())\n", + " recall_means.append(recall_scores.mean())\n", + " recall_stds.append(recall_scores.std())\n", + " f1_means.append(f1_scores.mean())\n", + " f1_stds.append(f1_scores.std())\n", + "\n", + "# Визуализация результатов для задачи классификации\n", + "fig, ax = plt.subplots(2, 2, figsize=(12, 12))\n", + "\n", + "ax[0, 0].bar(models_class.keys(), accuracy_means, yerr=accuracy_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[0, 0].set_ylabel('Accuracy')\n", + "ax[0, 0].set_title('Accuracy for Classification Models')\n", + "ax[0, 0].yaxis.grid(True)\n", + "\n", + "ax[0, 1].bar(models_class.keys(), precision_means, yerr=precision_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[0, 1].set_ylabel('Precision')\n", + "ax[0, 1].set_title('Precision for Classification Models')\n", + "ax[0, 1].yaxis.grid(True)\n", + "\n", + "ax[1, 0].bar(models_class.keys(), recall_means, yerr=recall_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[1, 0].set_ylabel('Recall')\n", + "ax[1, 0].set_title('Recall for Classification Models')\n", + "ax[1, 0].yaxis.grid(True)\n", + "\n", + "ax[1, 1].bar(models_class.keys(), f1_means, yerr=f1_stds, align='center', alpha=0.5, ecolor='black', capsize=10)\n", + "ax[1, 1].set_ylabel('F1-score')\n", + "ax[1, 1].set_title('F1-score for Classification Models')\n", + "ax[1, 1].yaxis.grid(True)\n", + "\n", + "plt.tight_layout()\n", + "plt.show()" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "aimenv", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.12.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +}