IIS_2023_1/martysheva_tamara_lab_7
2023-11-19 17:51:13 +04:00
..
lab7.py martysheva lab7 done 2023-11-19 17:51:13 +04:00
README.md martysheva lab7 done 2023-11-19 17:51:13 +04:00
text_eng.txt martysheva lab7 done 2023-11-19 17:51:13 +04:00
text_rus.txt martysheva lab7 done 2023-11-19 17:51:13 +04:00

Лабораторная работа 7. Рекуррентная нейронная сеть и задача генерациитекста

Вариант № 18(четный)

Выбрать художественный текст (четные варианты –русскоязычный, нечетные –англоязычный) и обучить на нем рекуррентную нейронную сеть для решения задачи генерации. Подобрать архитектуру и параметры так, чтобы приблизиться к максимально осмысленному результату. Далее разбиться на пары четный-нечетный вариант, обменяться разработанными сетями ипроверить, как архитектура товарища справляется с вашим текстом. В завершении подобрать компромиссную архитектуру, справляющуюся достаточно хорошо с обоими видами текстов.


Как запустить лабораторную работу:

Чтобы запустить программу, открываем файл lab7 в PyCharm и нажимаем на зеленый треугольник в правом верхнем углу.


Использованные технологии:

Keras — это библиотека с открытым исходным кодом, предоставляющая интерфейс Python для искусственных нейронных сетей. Keras выступает в качестве интерфейса для библиотеки TensorFlow.

TensorFlow — это бесплатная библиотека программного обеспечения с открытым исходным кодом для машинного обучения и искусственного интеллекта. Его можно использовать для решения широкого спектра задач, но особое внимание уделяется обучению и выводу глубоких нейронных сетей.

NumPy — это фундаментальный пакет для научных вычислений на Python.


Что делает ЛР:

В данной работе анализируется работа рекуррентных нейронных сетей и решается задача генерации текстов на русском и английском языках. Имеются 2 файла: text_rus.txt - отрывок из книги на русском языке и text_eng.txt - на английском.

Метод tokenize готовит текстовые данные для обучения модели, преобразуя текст в числовые последовательности и подготавливая их в формат, пригодный для использования в нейронной сети.

При вызове метода train_model создается, компилируется и обучается рекуррентная нейонная сеть со следующими слоями:

  • Embedding - слой, преобразующий целочисленные последовательности в плотные векторы.
  • LSTM - слой с блоками долгой краткосрочной памятью.
  • Dropout - обработчик разрыва.
  • Dense - одномерный слой обычных нейронов. В ходе экспериментов были подобраны оптимальные настройки для слоев сети, а также необходимое кол-во эпох для обучения сети.

При вызове метода generate_text генерируется текст с использованием необходимых переменных.

Результатом работы программы являются: сгенерированные тексты на русском и английском языках на основе исходных текстов (в консоли).


Пример выходных данных:

Русский текст:

Вывод в консоли для русского текста (140 эпох обучения):

. . .

Исходный текст:

Кофе со специями сдобрен изрядным количеством меда, и все равно обжигает мне язык. Крессентия всегда заказывает именно такой кофе. Мы сидим в павильоне, как и тысячу раз до этого, в руках у нас дымящиеся фарфоровые чашки — холодным вечером о них так приятно греть ладони. Какое-то мгновение мне кажется, что все как прежде, мы мирно сидим в полумраке и молчим. Мне не хватало наших бесед, но еще я скучала по этому уютному молчанию: мы всегда могли просто посидеть вот так, не испытывая потребности заполнять тишину глупой светской болтовней. Но это же бессмысленно. С чего мне скучать по Крессентии, если она сидит напротив меня?

Сгенерированный текст:

Rus: Кофе со специями сдобрен изрядным количеством меда и все равно обжигает мне язык крессентия всегда заказывает именно такой кофе мы сидим в павильоне как и тысячу раз до этого в руках у нас дымящиеся фарфоровые чашки — холодным вечером о них так приятно греть ладони какое то мгновение мне кажется что все как прежде мы мирно сидим в полумраке и молчим мне не хватало наших бесед но еще я скучала по этому уютному молчанию мы всегда могли просто посидеть вот так не испытывая потребности заполнять тишину глупой светской болтовней но это же бессмысленно с чего мне скучать по крессентии если она сидит напротив

Английский текст:

Вывод в консоли для английского текста (140 эпох обучения):

. . .

Исходный текст:

The spiced coffee is sweet on my tongue, made with a generous dollop of honey. The way Crescentia always orders it. We sit on the pavilion like we have a thousand times before, steaming porcelain mugs cradled in our hands to ward off the chill in the evening air. For a moment, it feels just like every time before, a comfortable silence hanging in the dark air around us. Ive missed talking to her, but Ive missed this, too—how we could sit together and not feel the need to fill the silence with meaningless small talk. But thats silly. How can I miss Cress when shes sitting right in front of me?

Сгенерированный текст:

Eng: The spiced coffee is sweet on my tongue made with a generous dollop of honey the way crescentia always orders it we sit on the pavilion like we have a thousand times before steaming porcelain mugs cradled in our hands to ward off the chill in the evening air for a moment it feels just like every time before a comfortable silence hanging in the dark air around us ive missed talking to her but ive missed this too—how we could sit together and not feel the need to fill the silence with meaningless small talk but thats silly how can i miss


Вывод: Сгенерированные тексты получились в точности похожими на оригинал (за исключением некоторых моментов), что говорит о правильно подобранной структуре рекуррентной нейронной сети и количестве эпох для обучения сети. Русский текст получился практически дословным как и английский, только в английском немного съелся конец последнего предложения.

Для обеих моделей (для русского и английского текста) под конец обучения метрика точности модели достигла 1, а потери доведены до минимума.