From ba67c32ccff357a5b8ed2eee14f941739006b0d1 Mon Sep 17 00:00:00 2001 From: ChaZIR Date: Sat, 7 Dec 2024 00:32:06 +0400 Subject: [PATCH] lab66 --- lab_6/lab6.ipynb | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/lab_6/lab6.ipynb b/lab_6/lab6.ipynb index 9d262fe..b83ea98 100644 --- a/lab_6/lab6.ipynb +++ b/lab_6/lab6.ipynb @@ -19,8 +19,8 @@ "\n", "1. **Перевести проект на библиотеку Gymnasium и современную версию Python.** Gymnasium — это современная альтернатива библиотеке Gym, предоставляющая удобные инструменты для создания и тестирования моделей обучения с подкреплением.\n", "2. **Реализовать агента для игры \"Крестики-нолики\" в виде отдельного класса.** Следуя примеру из лекции, создайте класс агента, который будет отвечать за принятие решений и обучение.\n", - "3. **Переписать основной цикл обучения для работы с отдельным классом агента.** Измените существующий код так, чтобы обучение происходило через взаимодействие с классом агента.\n", - "4. **Протестировать новую версию программы.** Убедитесь, что переписанная программа работает корректно и агент успешно обучается играть в \"Крестики-нолики\".\n", + "3. **Основной цикл обучения для работы с отдельным классом агента.** Обучение происходит через взаимодействие с классом агента.\n", + "4. **Протестировать новую версию программы.** Убедиться, что программа работает корректно и агент успешно обучается играть в \"Крестики-нолики\".\n", "\n", "**Обучение с подкреплением (Reinforcement Learning, RL)** — это подход машинного обучения, при котором агент учится принимать решения, взаимодействуя с окружающей средой. Цель агента — выбирать действия, которые максимизируют накопленную награду в долгосрочной перспективе.\n", "\n",