.. | ||
laba7.py | ||
README.md | ||
texten.txt | ||
textru.txt |
Задание
Выбрать художественный текст и обучить на нем рекуррентную нейронную сеть для решения задачи генерации.
Зависимости
Для работы этого приложения необходимы следующие библиотеки Python:
- NumPy
- TensorFlow
- Streamlit
Запуск
streamlit laba7.py
Описание кода
-
Импорт библиотек:
Импортируются необходимые библиотеки, такие как docx для чтения текстов из файлов Word, streamlit для создания веб-приложения, numpy, tensorflow и keras для обучения нейронных сетей.
-
Извлечение текста из файлов Word:
Функция extract_text_from_docx используется для извлечения текста из двух файлов Word на русском (textru) и английском (texten). Это делается с помощью библиотеки docx.
-
Подготовка данных для обучения моделей:
Текст из файлов разбивается на последовательности для обучения рекуррентных нейронных сетей (LSTM). Текст разбивается на последовательности определенной длины (maxlen) и используется для обучения моделей на русском и английском текстах.
-
Создание и обучение моделей:
Два отдельных экземпляра модели (model_russian и model_english) создаются и обучаются на соответствующих данных русского и английского текстов.
-
Генерация текста на основе обученных моделей:
Функция generate_text используется для генерации текста на основе обученных моделей. Этот текст выводится с помощью streamlit в веб-приложении.
Результат
Сгенерированный русский текст:
Ты к моему несчастью верь как в святыню верит монах как в чудо чудо верит дева как верят в вечернюю печальные странники в пути
Сгенерированный английский текст:
In the to my distress as the monk believes in a shrine as the maiden believes in a miracle as weary travelers believe in the evening star on their journey