lab66
This commit is contained in:
parent
64440ead99
commit
ba67c32ccf
@ -19,8 +19,8 @@
|
||||
"\n",
|
||||
"1. **Перевести проект на библиотеку Gymnasium и современную версию Python.** Gymnasium — это современная альтернатива библиотеке Gym, предоставляющая удобные инструменты для создания и тестирования моделей обучения с подкреплением.\n",
|
||||
"2. **Реализовать агента для игры \"Крестики-нолики\" в виде отдельного класса.** Следуя примеру из лекции, создайте класс агента, который будет отвечать за принятие решений и обучение.\n",
|
||||
"3. **Переписать основной цикл обучения для работы с отдельным классом агента.** Измените существующий код так, чтобы обучение происходило через взаимодействие с классом агента.\n",
|
||||
"4. **Протестировать новую версию программы.** Убедитесь, что переписанная программа работает корректно и агент успешно обучается играть в \"Крестики-нолики\".\n",
|
||||
"3. **Основной цикл обучения для работы с отдельным классом агента.** Обучение происходит через взаимодействие с классом агента.\n",
|
||||
"4. **Протестировать новую версию программы.** Убедиться, что программа работает корректно и агент успешно обучается играть в \"Крестики-нолики\".\n",
|
||||
"\n",
|
||||
"**Обучение с подкреплением (Reinforcement Learning, RL)** — это подход машинного обучения, при котором агент учится принимать решения, взаимодействуя с окружающей средой. Цель агента — выбирать действия, которые максимизируют накопленную награду в долгосрочной перспективе.\n",
|
||||
"\n",
|
||||
|
Loading…
x
Reference in New Issue
Block a user