IIS_2023_1/gordeeva_anna_lab_7/README.md

44 lines
2.8 KiB
Markdown
Raw Normal View History

2024-01-09 16:55:23 +04:00
## Задание
Выбрать художественный текст и обучить на нем рекуррентную нейронную сеть для решения задачи генерации.
## Зависимости
Для работы этого приложения необходимы следующие библиотеки Python:
* NumPy
* TensorFlow
* Streamlit
## Запуск
```bash
streamlit laba7.py
```
## Описание кода
1. Импорт библиотек:
Импортируются необходимые библиотеки, такие как docx для чтения текстов из файлов Word, streamlit для создания веб-приложения, numpy, tensorflow и keras для обучения нейронных сетей.
2. Извлечение текста из файлов Word:
Функция extract_text_from_docx используется для извлечения текста из двух файлов Word на русском (textru) и английском (texten). Это делается с помощью библиотеки docx.
3. Подготовка данных для обучения моделей:
Текст из файлов разбивается на последовательности для обучения рекуррентных нейронных сетей (LSTM). Текст разбивается на последовательности определенной длины (maxlen) и используется для обучения моделей на русском и английском текстах.
4. Создание и обучение моделей:
Два отдельных экземпляра модели (model_russian и model_english) создаются и обучаются на соответствующих данных русского и английского текстов.
5. Генерация текста на основе обученных моделей:
Функция generate_text используется для генерации текста на основе обученных моделей. Этот текст выводится с помощью streamlit в веб-приложении.
## Результат
Сгенерированный русский текст:
Ты к моему несчастью верь как в святыню верит монах как в чудо чудо верит дева как верят в вечернюю печальные странники в пути
Сгенерированный английский текст:
In the to my distress as the monk believes in a shrine as the maiden believes in a miracle as weary travelers believe in the evening star on their journey