lab_2 #2

Merged
Arutunyan-Dmitry merged 5 commits from lab_2 into main 2024-10-19 09:11:48 +04:00
Showing only changes of commit 37a0cdc425 - Show all commits

View File

@ -1681,7 +1681,7 @@
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 25, "execution_count": 26,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
@ -1700,12 +1700,12 @@
"Процент объектов класса \"medium\": 33.33%\n", "Процент объектов класса \"medium\": 33.33%\n",
"Процент объектов класса \"high\": 33.33%\n", "Процент объектов класса \"high\": 33.33%\n",
"\n", "\n",
"Контрольная выборка: (1119, 157)\n", "Контрольная выборка: (561, 157)\n",
"Распределение выборки данных по классам \"salary_category\":\n", "Распределение выборки данных по классам \"salary_category\":\n",
" salary_category\n", " salary_category\n",
"low 373\n", "low 187\n",
"medium 373\n", "medium 187\n",
"high 373\n", "high 187\n",
"Name: count, dtype: int64\n", "Name: count, dtype: int64\n",
"Процент объектов класса \"low\": 33.33%\n", "Процент объектов класса \"low\": 33.33%\n",
"Процент объектов класса \"medium\": 33.33%\n", "Процент объектов класса \"medium\": 33.33%\n",
@ -1741,7 +1741,7 @@
"source": [ "source": [
"# Приращение данных (undersampling)\n", "# Приращение данных (undersampling)\n",
"df_train_undersampled: DataFrame = undersample(df_train, 'salary_category')\n", "df_train_undersampled: DataFrame = undersample(df_train, 'salary_category')\n",
"df_val_undersampled: DataFrame = oversample(df_val, 'salary_category')\n", "df_val_undersampled: DataFrame = undersample(df_val, 'salary_category')\n",
"df_test_undersampled: DataFrame = undersample(df_test, 'salary_category')\n", "df_test_undersampled: DataFrame = undersample(df_test, 'salary_category')\n",
"\n", "\n",
"# Проверка сбалансированности\n", "# Проверка сбалансированности\n",