DAS_2024_1/chernyshov_nikita_lab_5/README.md
Никита Чернышов 36dfe3c47a chernyshov_nikita_lab_5 is ready
2024-12-15 17:10:21 +04:00

6.9 KiB
Raw Permalink Blame History

Лабораторная работа 5: Умножение матриц

Описание

Цель работы реализовать и сравнить производительность последовательного и параллельного алгоритмов умножения матриц на больших массивах данных.

Задачи:

  1. Разработать последовательный алгоритм умножения матриц.
  2. Реализовать параллельный алгоритм с возможностью настройки числа потоков.
  3. Провести тестирование обоих подходов на матрицах размером 100x100, 300x300 и 500x500.
  4. Выполнить анализ производительности, изучив зависимость времени выполнения от размера матриц и количества потоков, и сформулировать выводы.

Теоретическое обоснование

Операция умножения матриц широко применяется в задачах вычислительного характера, таких как обработка изображений, машинное обучение и физическое моделирование. Сложность умножения матриц размером N×N составляет O(N^3), что приводит к резкому росту времени вычислений с увеличением размера матриц. Для ускорения работы можно использовать параллельные алгоритмы, распределяющие вычисления между несколькими потоками.

Реализация

  1. Последовательный алгоритм: Реализован в модуле sequential.py. Алгоритм вычисляет каждый элемент результирующей матрицы поэлементно, складывая произведения соответствующих элементов строк и столбцов исходных матриц.

  2. Параллельный алгоритм: Представлен в модуле parallel.py. Он использует многопоточность, разделяя вычисления на несколько потоков, где каждый поток обрабатывает определённый блок строк результирующей матрицы. Пользователь может задавать количество потоков для оптимизации производительности с учётом размера матриц и доступных ресурсов.

Результаты тестирования

Тестирование проводилось на матрицах размером 100x100, 300x300 и 500x500 с различным числом потоков. Было проанализировано влияние количества потоков на производительность алгоритма.

Скриншоты результатов

Результат бенчамарка при 1 потоке:

img1.png

Результат бенчамарка при 2 потоках:

img2.png

Результат бенчамарка при 4 потоках:

img3.png

Результат бенчамарка при 8 потоках:

img4.png

Выводы

  1. Эффективность параллельного алгоритма: Использование многопоточности в параллельном алгоритме показало значительное ускорение по сравнению с последовательным методом, особенно на матрицах больших размеров. Например, для матриц размером 500x500 параллельный алгоритм с 4 потоками оказался более чем вдвое быстрее последовательного.

  2. Влияние количества потоков: Увеличение числа потоков сокращает время выполнения, но этот эффект ограничен. Для небольших матриц (100x100) использование более 2 потоков практически не улучшает производительность. На матрицах среднего и большого размера (300x300 и 500x500) оптимальный результат достигался при использовании 4 потоков, так как это позволяло равномерно распределить вычислительную нагрузку.

  3. Закономерности и ограничения: Эффективность параллельного умножения матриц ограничена накладными расходами на управление потоками. Для небольших задач эти расходы могут нивелировать преимущества параллелизации. Однако на больших данных задача лучше масштабируется, что делает параллельный подход значительно более выгодным.

  4. Рекомендации по использованию: Для работы с большими матрицами в реальных задачах рекомендуется использовать параллельные алгоритмы, подбирая оптимальное число потоков в зависимости от объёма задачи и доступных вычислительных ресурсов.

Заключение

Выполнение лабораторной работы показало, что параллельные алгоритмы значительно ускоряют умножение матриц на больших данных. Однако для достижения максимальной эффективности важно учитывать размер задачи и оптимально выбирать количество потоков. Полученные результаты подтверждают, что параллельный подход предпочтителен для работы с крупными матрицами, тогда как для небольших задач затраты на управление потоками могут свести его преимущества на нет.

Видео

https://vkvideo.ru/video286865610_456239228?list=ln-RciNpMoyWby0uMIZoa