From 3691f9ca3706dd8cd23f53686257ec7b84ebaa64 Mon Sep 17 00:00:00 2001 From: Anton Date: Sat, 24 May 2025 15:06:24 +0400 Subject: [PATCH] ready --- .gitignore | 2 + lab_10/lab10.ipynb | 579 ++++++++++++--------------------------------- 2 files changed, 150 insertions(+), 431 deletions(-) diff --git a/.gitignore b/.gitignore index 207d123..79746f5 100644 --- a/.gitignore +++ b/.gitignore @@ -12,3 +12,5 @@ ipython_config.py # Remove previous ipynb_checkpoints # git rm -r .ipynb_checkpoints/ +aimvenv +Static \ No newline at end of file diff --git a/lab_10/lab10.ipynb b/lab_10/lab10.ipynb index 2fc93ec..0c4dc5a 100644 --- a/lab_10/lab10.ipynb +++ b/lab_10/lab10.ipynb @@ -13,53 +13,51 @@ "id": "fbcde77d", "metadata": {}, "source": [ - "### 1. Определение задачи оптимизации\n", + "## 1. Определение задачи оптимизации\n", "\n", - "**Цель оптимизации** — найти такую цену товара, при которой общая выручка от продаж будет наибольшей.\n", - "Для этого мы используем исторические данные, на их основе строим зависимость между ценой и объёмом продаж, а затем с помощью алгоритма определяем оптимальное значение.\n", + "Цель — определить оптимальную розничную цену на товар, при которой прибыль будет максимальной, учитывая переменные из датасета:\n", + "- закупочную стоимость (`unit_price`),\n", + "- стоимость логистики (`freight_price`),\n", + "- объём продаж (`qty`).\n", "\n", - "Целевая функция: **revenue(x) = x ⋅ D(x)**\n", - "где:\n", - "- **x** — цена товара (оптимизируемый параметр),\n", - "- **D(x)** — функция спроса, отражающая прогнозируемый объём продаж при данной цене.\n", + "Тип задачи — **максимизация** функции прибыли:\n" + ] + }, + { + "cell_type": "markdown", + "id": "92e9e640", + "metadata": {}, + "source": [ + "## 2. Набор данных\n", "\n", - "**Характеристики задачи:**\n", - "- Тип: одномерная непрерывная оптимизация\n", - "- Цель: максимизация функции\n", + "Датасет: `retail_price.csv` \n", + "Отфильтрованы значения по конкретному товару — `bed1`.\n", "\n", - "Оптимизация — это раздел математики, направленный на поиск экстремумов функции (максимума или минимума).\n", - "В данной задаче оптимизация выполняется по одному параметру — цене.\n", - "Так как у нас отсутствует точная аналитическая форма зависимости выручки от цены, мы применяем линейную регрессию для приближённого моделирования этой связи.\n", - "Поскольку функция может быть сложной и включать локальные максимумы и минимумы, используется генетический алгоритм — метод эволюционной оптимизации, эффективный в задачах с труднопредсказуемым ландшафтом.\n" + "Выделены поля:\n", + "- `unit_price` — закупочная цена,\n", + "- `freight_price` — доставка,\n", + "- `qty` — проданное количество,\n", + "- `total_price` — общая выручка,\n", + "- `lag_price` — цена продажи в предыдущем месяце (ориентир).\n" ] }, { "cell_type": "code", - "execution_count": 14, - "id": "80dcedd6", + "execution_count": 3, + "id": "6c041d79", "metadata": {}, "outputs": [ { - "name": "stderr", + "name": "stdout", "output_type": "stream", "text": [ - "C:\\Users\\Natalia\\AppData\\Local\\Temp\\ipykernel_936\\24853934.py:11: SettingWithCopyWarning: \n", - "A value is trying to be set on a copy of a slice from a DataFrame.\n", - "Try using .loc[row_indexer,col_indexer] = value instead\n", - "\n", - "See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy\n", - " product_data['revenue'] = product_data['unit_price'] * product_data['qty']\n" + " lag_price cost qty profit\n", + "0 45.90 61.050000 1 -15.10\n", + "1 45.95 58.883333 3 -38.80\n", + "2 45.95 60.790000 6 -89.04\n", + "3 45.95 60.237500 4 -57.15\n", + "4 45.95 61.050000 2 -30.20\n" ] - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" } ], "source": [ @@ -67,64 +65,13 @@ "import numpy as np\n", "import pandas as pd\n", "\n", - "df = pd.read_csv('../../static/retail_price.csv')\n", - "product_data = df[df['product_id'] == 'bed1']\n", + "df = pd.read_csv('../static/retail_price.csv')\n", + "product_data = df[df[\"product_id\"] == \"bed1\"].copy()\n", "\n", - "product_data['revenue'] = product_data['unit_price'] * product_data['qty']\n", + "product_data[\"cost\"] = product_data[\"unit_price\"] + product_data[\"freight_price\"]\n", + "product_data[\"profit\"] = product_data[\"total_price\"] - product_data[\"cost\"] * product_data[\"qty\"]\n", "\n", - "plt.figure(figsize=(10, 6))\n", - "plt.scatter(product_data['unit_price'], product_data['revenue'], alpha=0.7)\n", - "plt.title('Зависимость выручки от цены для товара bed1')\n", - "plt.xlabel('Цена за единицу (unit_price)')\n", - "plt.ylabel('Выручка (unit_price × qty)')\n", - "plt.grid(True)\n", - "plt.tight_layout()\n", - "plt.show()\n" - ] - }, - { - "cell_type": "markdown", - "id": "fdedd9b0", - "metadata": {}, - "source": [ - "Из графика видно, что зависимость выручки от цены является нелинейной, что делает задачу подходящей для решения с использованием генетического алгоритма. Такой метод хорошо справляется с поиском экстремумов в сложных и нелинейных функциях.\n", - "\n", - "### 2. Структура хромосомы и тип данных гена\n", - "\n", - "На этом этапе мы описываем, как будет представлено одно возможное решение задачи в рамках генетического алгоритма.\n", - "Это важно для понимания, что именно подвергается эволюционным операциям — мутациям и скрещиванию.\n", - "\n", - "**Хромосома** — это предполагаемое решение, то есть конкретная цена товара.\n", - "**Ген** — отдельное значение внутри хромосомы, в нашем случае — одна цена.\n", - "Поскольку задача оптимизируется по одному параметру, каждая хромосома содержит всего один ген.\n", - "\n", - "**Тип данных гена:** `float`.\n", - "\n", - "Таким образом, каждая хромосома представляет собой одно вещественное число — цену товара.\n", - "\n", - "**Обоснование:**\n", - "Минимально необходимая структура, точно соответствующая задаче поиска оптимального значения одной переменной.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 15, - "id": "22fe0bbd", - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Пример хромосомы: [Цена] ∈ (39.24, 45.95)\n" - ] - } - ], - "source": [ - "min_price = product_data['unit_price'].min()\n", - "max_price = product_data['unit_price'].max()\n", - "\n", - "print(f\"Пример хромосомы: [Цена] ∈ ({min_price:.2f}, {max_price:.2f})\")\n" + "print(product_data[[\"lag_price\", \"cost\", \"qty\", \"profit\"]].head())\n" ] }, { @@ -132,62 +79,57 @@ "id": "be42a431", "metadata": {}, "source": [ - "Весь диапазон, в котором работает генетический алгоритм, ограничен значениями от 39.24 до 45.95.\n", - "Алгоритм будет искать наилучшее значение цены в этих пределах, чтобы достичь максимальной выручки.\n", + "## 3. Структура хромосомы\n", "\n", - "### 3. Генерация начальной популяции\n", + "Хромосома — возможная цена продажи.\n", "\n", - "Этот шаг запускает процесс эволюции.\n", - "Формируется начальный набор возможных решений — популяция, с которой начнёт работу алгоритм.\n", - "Каждое решение (индивид) — это случайным образом выбранная цена товара, находящаяся в допустимых пределах, определённых ранее.\n", - "\n", - "**Диапазон допустимых цен:**\n", - "- Нижняя граница: `≈ {min_price:.2f}`\n", - "- Верхняя граница: `≈ {max_price:.2f}`\n", - "\n", - "**Количество особей в популяции:** 10\n", - "\n", - "**Обоснование:**\n", - "- Популяция начальных решений создаёт разнообразие, необходимое для качественного поиска.\n", - "- Границы диапазона исключают нереалистичные значения и сужают пространство поиска, что ускоряет процесс оптимизации.\n", - "\n", - "Пример сгенерированных значений цен:\n" + "Ген — число с плавающей точкой (тип `float`) в диапазоне от 50 до 250 (на основе наблюдаемых цен конкурентов).\n" ] }, { "cell_type": "code", - "execution_count": 16, + "execution_count": 4, "id": "a0fbbea3", "metadata": {}, + "outputs": [], + "source": [ + "price_min = 50\n", + "price_max = 250\n" + ] + }, + { + "cell_type": "markdown", + "id": "c64b3159", + "metadata": {}, + "source": [ + "## 4. Генерация начальной популяции\n", + "\n", + "Популяция — набор возможных цен.\n" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "id": "28313ddf", + "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ - "Начальная популяция (цены):\n", - "[[45.67003515]\n", - " [40.87201011]\n", - " [40.05529638]\n", - " [41.93519615]\n", - " [40.91820001]\n", - " [42.33300812]\n", - " [39.46643525]\n", - " [43.37890575]\n", - " [45.88634421]\n", - " [44.99696928]]\n" + "Пример популяции: [ 50.41371951 50.48087187 148.54284113 106.27111405 179.03501848\n", + " 134.91448339 113.71686216 140.57834704 106.41741383 193.22289117]\n" ] } ], "source": [ + "import numpy as np\n", "\n", - "def generate_initial_population(pop_size, price_range):\n", - " return np.random.uniform(price_range[0], price_range[1], (pop_size, 1))\n", + "def generate_population(pop_size, price_min=50, price_max=250):\n", + " return np.random.uniform(price_min, price_max, size=pop_size)\n", "\n", - "population_size = 10\n", - "initial_population = generate_initial_population(population_size, (min_price, max_price))\n", - "\n", - "print(\"Начальная популяция (цены):\")\n", - "print(initial_population)\n" + "population = generate_population(10)\n", + "print(\"Пример популяции:\", population)\n" ] }, { @@ -195,34 +137,14 @@ "id": "a05d507e", "metadata": {}, "source": [ - "Мы сгенерировали 10 начальных особей — потенциальных вариантов оптимальной цены.\n", - "Каждая строка соответствует отдельной особи, представленной одной переменной — ценой товара.\n", - "Значения равномерно распределены в пределах ≈ (39.24, 45.95), что соответствует заданному диапазону.\n", + "## 5. Фитнес-функция\n", "\n", - "### 5. Фитнес-функция\n", - "\n", - "Фитнес-функция — это функция оценки, определяющая, насколько хорошо конкретное решение (цена) справляется с задачей максимизации выручки.\n", - "Целевая метрика — прогнозируемая выручка, которая рассчитывается по формуле: **выручка = цена × спрос**.\n", - "\n", - "- Цена — это значение, генерируемое генетическим алгоритмом (значение хромосомы).\n", - "- Спрос — прогноз, полученный с помощью линейной регрессии, обученной на исторических данных.\n", - "\n", - "Таким образом, спрос моделируется простой линейной регрессией, построенной на предыдущих наблюдениях.\n", - "\n", - "**Примеры расчётов:**\n", - "- Цена: 42.84 → Прогноз спроса: ≈ 7.99 → Выручка: ≈ 342\n", - "- Цена: 40.29 → Прогноз спроса: ≈ 11.84 → Выручка: ≈ 477\n", - "\n", - "Это означает, что в рамках текущей модели наибольшую выручку обеспечивает цена около **40.29**.\n", - "\n", - "**Обоснование:**\n", - "Позволяет оценивать каждую особь без необходимости в точной аналитической функции спроса.\n", - "Интерпретируется интуитивно: выручка равна произведению цены и объёма продаж.\n" + "Фитнес — средняя прибыль при заданной цене:" ] }, { "cell_type": "code", - "execution_count": 17, + "execution_count": 6, "id": "14ba56f8", "metadata": {}, "outputs": [ @@ -230,24 +152,19 @@ "name": "stdout", "output_type": "stream", "text": [ - "Цена: 42.0, Предсказанная выручка: 388.87\n" + "Фитнес для 100.0: 396.354375006875\n" ] } ], "source": [ - "from sklearn.linear_model import LinearRegression\n", + "def fitness(price, cost, qty):\n", + " profit = (price - cost) * qty\n", + " return profit.mean()\n", "\n", - "X = product_data[['unit_price']].values\n", - "y = product_data['qty'].values\n", - "reg = LinearRegression().fit(X, y)\n", + "cost = product_data[\"cost\"].values\n", + "qty = product_data[\"qty\"].values\n", "\n", - "def fitness_function(price_value):\n", - " predicted_qty = reg.predict(np.array([[price_value]]))[0]\n", - " revenue = price_value * max(predicted_qty, 0)\n", - " return revenue\n", - "\n", - "test_price = 42.0\n", - "print(f\"Цена: {test_price}, Предсказанная выручка: {fitness_function(test_price):.2f}\")\n" + "print(\"Фитнес для 100.0:\", fitness(100.0, cost, qty))\n" ] }, { @@ -255,36 +172,14 @@ "id": "843f11f8", "metadata": {}, "source": [ - "Если установить цену на уровне 42.00, модель прогнозирует соответствующий спрос, при котором ожидаемая выручка составит 388.87.\n", - "Это позволяет сравнивать различные ценовые значения между собой и выбирать ту цену, при которой выручка будет максимальной.\n", + "## 6. Оператор кроссинговера\n", "\n", - "### 6. Оператор кроссинговера\n", - "\n", - "**Кроссинговер (скрещивание)** — это процесс обмена «генетической информацией» между двумя родительскими решениями с целью генерации нового потомка.\n", - "Он играет важную роль в расширении пространства поиска и способствует появлению новых потенциально успешных комбинаций параметров.\n", - "\n", - "В данной задаче для скрещивания мы используем **усреднение двух цен**.\n", - "Это оправдано, так как цена — непрерывная величина, и среднее значение даёт логичный результат между двумя родителями.\n", - "\n", - "**Конкретно в нашем случае:**\n", - "- Каждое решение — это одна цена.\n", - "- Родители: два числовых значения.\n", - "- Потомок: арифметическое среднее между этими значениями.\n", - "\n", - "**Пример:**\n", - "- Родитель 1: 45.35\n", - "- Родитель 2: 44.23\n", - "- Потомок: (45.35 + 44.23) / 2 = **44.79**\n", - "\n", - "Такой способ скрещивания позволяет плавно и последовательно исследовать возможные варианты в рамках допустимого диапазона.\n", - "\n", - "**Обоснование:**\n", - "Поскольку цена — непрерывный параметр, использование среднего значения является естественным и эффективным способом комбинирования родительских решений.\n" + "Простой арифметический кроссовер:\n" ] }, { "cell_type": "code", - "execution_count": 18, + "execution_count": 9, "id": "42170c5c", "metadata": {}, "outputs": [ @@ -292,20 +187,17 @@ "name": "stdout", "output_type": "stream", "text": [ - "Родитель 1: 41.5, Родитель 2: 43.0, Потомок: 42.25\n" + "Пример кроссовера: 140.17469125275707\n" ] } ], "source": [ + "def crossover(parent1, parent2):\n", + " alpha = np.random.rand()\n", + " child = alpha * parent1 + (1 - alpha) * parent2\n", + " return child\n", "\n", - "def crossover_operator(parent1, parent2):\n", - " return np.array([(parent1[0] + parent2[0]) / 2.0])\n", - "\n", - "p1 = np.array([41.5])\n", - "p2 = np.array([43.0])\n", - "offspring = crossover_operator(p1, p2)\n", - "\n", - "print(f\"Родитель 1: {p1[0]}, Родитель 2: {p2[0]}, Потомок: {offspring[0]}\")\n" + "print(\"Пример кроссовера:\", crossover(100, 150))\n" ] }, { @@ -323,32 +215,15 @@ "id": "7e94e0c9", "metadata": {}, "source": [ - "### 7. Операторы мутации\n", + "## 7. Операторы мутации\n", "\n", - "Мутация — это механизм случайных изменений в хромосомах (решениях), который служит для:\n", - "- поддержания разнообразия в популяции,\n", - "- предотвращения преждевременной стабилизации на одном решении,\n", - "- возможности выхода из локального максимума.\n", - "\n", - "В нашем случае каждая хромосома представляет собой одно значение — цену.\n", - "Мы реализуем два типа мутаций:\n", - "\n", - "1. **Локальное случайное изменение** (`mutation_func_small`):\n", - " - Вносит небольшое случайное смещение в пределах от -0.5 до +0.5.\n", - " - Эффективно для точечной настройки и локального поиска.\n", - " - **Обоснование:** снижает риск ранней сходимости, позволяя изучать близкие значения.\n", - "\n", - "2. **Случайный скачок по диапазону** (`mutation_func_jump`):\n", - " - Заменяет текущую цену на случайное значение из всего допустимого диапазона.\n", - " - Полезен для глобального поиска и выхода из локальных экстремумов.\n", - " - **Обоснование:** обеспечивает баланс между улучшением текущих решений и поиском новых направлений.\n", - "\n", - "Комбинирование этих двух операторов позволяет гибко управлять соотношением между **эксплуатацией** (углублённая работа с хорошими решениями) и **исследованием** (поиск новых областей в пространстве решений).\n" + "- Мутация 1: добавление случайного смещения.\n", + "- Мутация 2: замена на случайное значение.\n" ] }, { "cell_type": "code", - "execution_count": 19, + "execution_count": 10, "id": "b16fd3c9", "metadata": {}, "outputs": [ @@ -356,22 +231,20 @@ "name": "stdout", "output_type": "stream", "text": [ - "Оригинал: 42.0, Мелкая мутация: 41.87, Прыжок: 44.98\n" + "Мутация 1: 100.00798577997959\n", + "Мутация 2: 123.77219890881597\n" ] } ], "source": [ - "def mutation_operator_small(price_value):\n", - " return price_value + np.random.uniform(-0.5, 0.5)\n", + "def mutation_1(price):\n", + " return price + np.random.uniform(-5, 5)\n", "\n", - "def mutation_operator_jump():\n", - " return np.random.uniform(min_price, max_price)\n", + "def mutation_2(price, price_min=50, price_max=250):\n", + " return np.random.uniform(price_min, price_max)\n", "\n", - "original = 42.0\n", - "mutated_small = mutation_operator_small(original)\n", - "mutated_jump = mutation_operator_jump()\n", - "\n", - "print(f\"Оригинал: {original}, Мелкая мутация: {mutated_small:.2f}, Прыжок: {mutated_jump:.2f}\")\n" + "print(\"Мутация 1:\", mutation_1(100.0))\n", + "print(\"Мутация 2:\", mutation_2(100.0))\n" ] }, { @@ -379,115 +252,40 @@ "id": "a803c415", "metadata": {}, "source": [ - "Исходная цена: 42.00 \n", - "После применения малой мутации → 41.87: незначительное изменение — хорошо подходит для уточнения результата.\n", - "После случайного скачка → 44.98: новое значение — помогает выйти из локального застоя.\n", + "## 8. Генетический алгоритм\n", "\n", - "### 8. Реализация базового генетического алгоритма\n", - "\n", - "**Генетический алгоритм (ГА)** — это метод поиска оптимума, вдохновлённый механизмами естественного отбора.\n", - "Популяция решений проходит через отбор, кроссинговер и мутации, постепенно приближаясь к наилучшему решению.\n", - "\n", - "Так как точная зависимость между ценой и выручкой неизвестна и, скорее всего, является сложной и нелинейной, мы используем генетический алгоритм — метод, не требующий аналитического выражения функции.\n", - "\n", - "1. Сначала обучается модель линейной регрессии, которая предсказывает спрос в зависимости от цены: D(x), где x — это цена.\n", - "2. Для каждой предложенной алгоритмом цены выполняются шаги:\n", - " - прогнозируется значение спроса;\n", - " - вычисляется соответствующая выручка;\n", - " - результат используется как значение фитнес-функции.\n", - "3. Из двух родительских решений формируется новое — путём усреднения цен.\n", - "4. Затем применяется мутация — небольшое случайное изменение цены, чтобы сохранить разнообразие в популяции.\n", - "\n", - "Процесс запускает эволюцию: из текущих решений отбираются лучшие, формируются потомки, применяется мутация.\n", - "Эти шаги повторяются в течение 50 поколений.\n" + "Реализация основного ГА:\n" ] }, { "cell_type": "code", - "execution_count": 20, + "execution_count": 11, "id": "f62d5f8d", "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "c:\\Users\\Natalia\\Desktop\\6 семестр\\МИИ\\AIM-PIbd-32-Katysheva-N-E\\aimvenv\\Lib\\site-packages\\pygad\\visualize\\plot.py:120: UserWarning: No artists with labels found to put in legend. Note that artists whose label start with an underscore are ignored when legend() is called with no argument.\n", - " matplt.legend()\n" - ] - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - }, - { - "name": "stdout", - "output_type": "stream", - "text": [ - "💡 Оптимальная цена: 40.14\n", - "📈 Максимальная предсказанная выручка: 484.84\n" - ] - } - ], + "outputs": [], "source": [ - "from sklearn.linear_model import LinearRegression\n", - "import pygad\n", + "def genetic_algorithm(cost, qty, generations=20, pop_size=10):\n", + " population = generate_population(pop_size)\n", + " best_scores = []\n", "\n", - "min_price = product_data['unit_price'].min()\n", - "max_price = product_data['unit_price'].max()\n", + " for gen in range(generations):\n", + " scores = [fitness(p, cost, qty) for p in population]\n", + " best_scores.append(max(scores))\n", + " parents = sorted(zip(scores, population), reverse=True)[:2]\n", + " new_population = []\n", "\n", - "X = product_data[['unit_price']].values\n", - "y = product_data['qty'].values\n", - "reg = LinearRegression()\n", - "reg.fit(X, y)\n", + " for _ in range(pop_size):\n", + " child = crossover(parents[0][1], parents[1][1])\n", + " if np.random.rand() < 0.5:\n", + " child = mutation_1(child)\n", + " else:\n", + " child = mutation_2(child)\n", + " child = np.clip(child, price_min, price_max)\n", + " new_population.append(child)\n", "\n", - "def fitness_func(ga_instance, sol, sol_idx):\n", - " price = sol[0]\n", - " predicted_qty = reg.predict(np.array([[price]]))[0]\n", - " return price * max(predicted_qty, 0)\n", + " population = new_population\n", "\n", - "def crossover_func(parents, offspring_size, ga_instance):\n", - " offspring = np.empty(offspring_size)\n", - " for k in range(offspring_size[0]):\n", - " parent1_idx = k % parents.shape[0]\n", - " parent2_idx = (k + 1) % parents.shape[0]\n", - " offspring[k, 0] = (parents[parent1_idx, 0] + parents[parent2_idx, 0]) / 2.0\n", - " return offspring\n", - "\n", - "def mutation_func(offspring, ga_instance):\n", - " for idx in range(offspring.shape[0]):\n", - " if np.random.rand() < 0.5:\n", - " offset = np.random.uniform(-0.5, 0.5)\n", - " offspring[idx, 0] += offset\n", - " return offspring\n", - "\n", - "ga_instance = pygad.GA(\n", - " num_generations=50,\n", - " num_parents_mating=4,\n", - " fitness_func=fitness_func,\n", - " sol_per_pop=10,\n", - " num_genes=1,\n", - " gene_space={'low': float(min_price), 'high': float(max_price)},\n", - " parent_selection_type=\"rank\",\n", - " keep_parents=2,\n", - " crossover_type=crossover_func,\n", - " mutation_type=mutation_func,\n", - " mutation_probability=0.2\n", - ")\n", - "\n", - "ga_instance.run()\n", - "ga_instance.plot_fitness()\n", - "\n", - "best_solution, best_fitness, _ = ga_instance.best_solution()\n", - "print(f\"💡 Оптимальная цена: {best_solution[0]:.2f}\")\n", - "print(f\"📈 Максимальная предсказанная выручка: {best_fitness:.2f}\")\n", - "\n" + " return population, best_scores\n" ] }, { @@ -495,119 +293,38 @@ "id": "76941121", "metadata": {}, "source": [ - "На графике показано, как менялось значение лучшего решения (fitness) на протяжении поколений.\n", + "## 9. Влияние параметров на сходимость\n", "\n", - "Замечаем горизонтальную линию — это означает, что уже в первом поколении было найдено хорошее решение, которое затем не улучшалось. Такая ситуация может быть вызвана:\n", - "- недостаточным разнообразием стартовой популяции;\n", - "- слишком низкой вероятностью мутации;\n", - "- почти линейной зависимостью в модели регрессии с явно выраженным максимумом.\n", - "\n", - "При цене 40.14 модель предсказывает максимальную выручку в размере 484.84.\n", - "Если модель предсказания достаточно точна, именно эту цену можно использовать для увеличения прибыли.\n", - "\n", - "### 9. Эксперименты с параметрами\n", - "\n", - "Мы проводим серию экспериментов по варьированию параметров генетического алгоритма. Это важно для оценки устойчивости модели и эффективности её настройки.\n", - "\n", - "В эволюционных алгоритмах параметры сильно влияют на итоговый результат, поэтому важно понимать их роль:\n", - "- **Размер популяции** влияет на охват пространства решений. Чем он больше — тем выше разнообразие, но дольше время выполнения.\n", - "- **Размер брачного пула** определяет степень селективности. Малый пул может ускорить сходимость, но повышает риск локального застревания. Большой — повышает вариативность, но снижает скорость.\n", - "- **Вероятность мутации** регулирует уровень случайности. Слишком низкое значение ведёт к застою, слишком высокое — к хаотичному поиску.\n", - "\n", - "Такой эксперимент помогает понять:\n", - "- При каких настройках достигается максимальный результат?\n", - "- Какие комбинации обеспечивают оптимальное соотношение качества и времени выполнения?\n", - "\n", - "Мы многократно запускаем генетический алгоритм, перебирая разные значения трёх ключевых параметров:\n", - "- `pop_size` — число особей в популяции,\n", - "- `mating_pool` — количество родителей для скрещивания,\n", - "- `mutation_prob` — вероятность мутации.\n", - "\n", - "Фиксируем следующие показатели:\n", - "- `best_fitness` — наилучшую достигнутую выручку,\n", - "- `time_sec` — затраченное время (в секундах).\n", - "\n", - "Все результаты записываются в датафрейс `df_results`.\n", - "\n", - "**Обоснование:**\n", - "Были протестированы различные конфигурации параметров с целью найти наиболее эффективные настройки с точки зрения производительности и точности (см. пункт 9).\n" + "Визуализируем, как меняется фитнес по поколениям.\n" ] }, { "cell_type": "code", - "execution_count": 21, + "execution_count": 12, "id": "3b4aa232", "metadata": {}, "outputs": [ { - "name": "stdout", - "output_type": "stream", - "text": [ - " pop_size mating_pool mutation_prob best_fitness time_sec\n", - "0 10 2 0.1 523.703232 0.02\n", - "1 10 2 0.2 508.416818 0.02\n", - "2 10 2 0.4 509.445109 0.02\n", - "3 10 4 0.1 450.753100 0.02\n", - "4 10 4 0.2 470.501994 0.02\n", - "5 10 4 0.4 503.517669 0.02\n", - "6 10 6 0.1 526.646992 0.02\n", - "7 10 6 0.2 516.680176 0.02\n", - "8 10 6 0.4 515.247424 0.02\n", - "9 20 2 0.1 526.962671 0.03\n", - "10 20 2 0.2 527.295935 0.03\n", - "11 20 2 0.4 514.346601 0.03\n", - "12 20 4 0.1 520.256511 0.03\n", - "13 20 4 0.2 504.030835 0.03\n", - "14 20 4 0.4 509.056689 0.03\n", - "15 20 6 0.1 523.256770 0.03\n", - "16 20 6 0.2 524.230935 0.03\n", - "17 20 6 0.4 524.004429 0.03\n", - "18 50 2 0.1 523.806662 0.07\n", - "19 50 2 0.2 527.310583 0.07\n", - "20 50 2 0.4 524.661809 0.07\n", - "21 50 4 0.1 526.488434 0.08\n", - "22 50 4 0.2 521.091870 0.08\n", - "23 50 4 0.4 509.458550 0.08\n", - "24 50 6 0.1 520.995407 0.08\n", - "25 50 6 0.2 517.040176 0.09\n", - "26 50 6 0.4 510.612420 0.08\n" - ] + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" } ], "source": [ - "import time\n", + "_, scores = genetic_algorithm(cost, qty, generations=50, pop_size=20)\n", "\n", - "results = []\n", - "for pop_size in [10, 20, 50]:\n", - " for mating_size in [2, 4, 6]:\n", - " for mut_prob in [0.1, 0.2, 0.4]:\n", - " start = time.time()\n", - " ga = pygad.GA(\n", - " num_generations=30,\n", - " num_parents_mating=mating_size,\n", - " fitness_func=fitness_func,\n", - " sol_per_pop=pop_size,\n", - " num_genes=1,\n", - " gene_space={'low': float(min_price), 'high': float(max_price)},\n", - " parent_selection_type=\"rank\",\n", - " keep_parents=2,\n", - " crossover_type=crossover_func,\n", - " mutation_type=mutation_func,\n", - " mutation_probability=mut_prob\n", - " )\n", - " ga.run()\n", - " best, fit, _ = ga.best_solution()\n", - " duration = time.time() - start\n", - " results.append({\n", - " \"pop_size\": pop_size,\n", - " \"mating_pool\": mating_size,\n", - " \"mutation_prob\": mut_prob,\n", - " \"best_fitness\": fit,\n", - " \"time_sec\": round(duration, 2)\n", - " })\n", - "\n", - "df_results = pd.DataFrame(results)\n", - "print(df_results)\n" + "import matplotlib.pyplot as plt\n", + "plt.plot(scores)\n", + "plt.xlabel(\"Поколение\")\n", + "plt.ylabel(\"Макс. прибыль\")\n", + "plt.title(\"Сходимость генетического алгоритма\")\n", + "plt.grid()\n", + "plt.show()\n" ] }, { @@ -615,14 +332,14 @@ "id": "2f79ae03", "metadata": {}, "source": [ - "- Самые высокие значения best_fitness достигаются при pop_size=50 и mutation_prob=0.1–0.2.\n", - "- Увеличение популяции с 10 → 50 приводит к улучшению результата, но также увеличивает время выполнения (0.02 → 0.08 сек).\n", - "- Слишком высокая мутация (0.4) даёт не лучшие результаты — например, строка 4: best_fitness=470.50.\n", + "## 10. Обоснование выбора функций\n", "\n", - "Общие рекомендации по результатам:\n", - "- pop_size=50\t- Даёт лучшие результаты, особенно если нужно точное решение\n", - "- mutation_prob=0.1–0.2\t- Оптимально для баланса между устойчивостью и разнообразием\n", - "- mating_pool=4–6\t- Лучше, чем 2 — больше комбинаций, выше качество" + "- Хромосома — цена: естественно моделируется как `float`.\n", + "- Кроссовер: обеспечивает плавное смешение стратегий (цен).\n", + "- Мутации: имитируют как локальный шум, так и случайный сбой.\n", + "- Фитнес — прибыль, что напрямую отражает цель бизнеса.\n", + "\n", + "Генетический алгоритм эффективен, так как перебор всех цен — ресурсоёмок, а градиент невозможен из-за дискретных qty.\n" ] } ], @@ -642,7 +359,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.12.6" + "version": "3.12.10" } }, "nbformat": 4,