IIS_2023_1/arzamaskina_milana_lab_7/README.md

2.2 KiB
Raw Blame History

Лабораторная работа №7

Рекуррентная нейронная сеть и задача генерации текста

ПИбд-41 Арзамаскина Милана

Вариант №2

Какие технологии использовались:

Используемые библиотеки:

  • numpy
  • keras
  • tensorflow

Как запустить:

  • установить python, numpy, keras, tensorflow
  • запустить проект (стартовая точка - main.py)

Что делает программа:

На основе выбранных художественных текстов происходит обучение рекуррентной нейронной сети для решения задачи генерации. Необходимо подобрать архитектуру и параметры так, чтобы приблизиться к максимально осмысленному результату.

  • Читает текст из файлов (english.txt, russian.txt)
  • Получает входные, выходные данные (X, y), размер словаря и токенайзер. Используем Tokenizer с настройкой char_level=True
  • Создаёт объект Sequential (последовательная рекуррентная нейронная сеть) и добавление двух слоёв LSTM. Dropout — это метод регуляризации для нейронных сетей и моделей глубокого обучения, решение проблемы переобучения. Слой Dense с функцией активации softmax используется для предсказания следующего слова
  • Компилирует модель
  • Обучает модель
  • Генерирует текст

Сгенерированные тексты:

Генерация на русском языке:

Result

Генерация на английском языке:

Result

Вывод:

Программа способна сгенерировать осмысленный текст в каждом из случаев.