IIS_2023_1/gordeeva_anna_lab_7
Meowweasy e88d1e7fcd itog
2024-01-09 16:55:23 +04:00
..
laba7.py itog 2024-01-09 16:55:23 +04:00
README.md itog 2024-01-09 16:55:23 +04:00
texten.txt itog 2024-01-09 16:55:23 +04:00
textru.txt itog 2024-01-09 16:55:23 +04:00

Задание

Выбрать художественный текст и обучить на нем рекуррентную нейронную сеть для решения задачи генерации.

Зависимости

Для работы этого приложения необходимы следующие библиотеки Python:

  • NumPy
  • TensorFlow
  • Streamlit

Запуск

streamlit laba7.py

Описание кода

  1. Импорт библиотек:

    Импортируются необходимые библиотеки, такие как docx для чтения текстов из файлов Word, streamlit для создания веб-приложения, numpy, tensorflow и keras для обучения нейронных сетей.

  2. Извлечение текста из файлов Word:

    Функция extract_text_from_docx используется для извлечения текста из двух файлов Word на русском (textru) и английском (texten). Это делается с помощью библиотеки docx.

  3. Подготовка данных для обучения моделей:

    Текст из файлов разбивается на последовательности для обучения рекуррентных нейронных сетей (LSTM). Текст разбивается на последовательности определенной длины (maxlen) и используется для обучения моделей на русском и английском текстах.

  4. Создание и обучение моделей:

    Два отдельных экземпляра модели (model_russian и model_english) создаются и обучаются на соответствующих данных русского и английского текстов.

  5. Генерация текста на основе обученных моделей:

    Функция generate_text используется для генерации текста на основе обученных моделей. Этот текст выводится с помощью streamlit в веб-приложении.

Результат

Сгенерированный русский текст:

Ты к моему несчастью верь как в святыню верит монах как в чудо чудо верит дева как верят в вечернюю печальные странники в пути

Сгенерированный английский текст:

In the to my distress as the monk believes in a shrine as the maiden believes in a miracle as weary travelers believe in the evening star on their journey