Merge pull request 'kadyrov_aydar_lab_5' (#119) from kadyrov_aydar_lab_5 into main

Reviewed-on: Alexey/DAS_2024_1#119
2024-11-20 22:43:23 +04:00 · 2024-11-20 22:43:23 +04:00 · d4e24db25e
commit d4e24db25e
parent c0ca1d4bb5 1dc621e0be
6 changed files with 112 additions and 0 deletions
--- a/kadyrov_aydar_lab_5/README.md
+++ b/kadyrov_aydar_lab_5/README.md
@ -0,0 +1,55 @@
 # Лабораторная работа: Умножение матриц
 ## Описание
 **Цель работы** – реализовать алгоритмы умножения матриц (последовательный и параллельный) и сравнить их производительность на матрицах больших размеров. 
 ### Задачи:
 1. Реализовать последовательный алгоритм умножения матриц.
 2. Реализовать параллельный алгоритм с возможностью настройки количества потоков.
 3. Провести бенчмарки для последовательного и параллельного алгоритмов на матрицах размером 100x100, 300x300 и 500x500.
 4. Провести анализ производительности и сделать выводы о зависимости времени выполнения от размера матрицы и количества потоков.
 ## Теоретическое обоснование
 Умножение матриц используется во многих вычислительных задачах, таких как обработка изображений, машинное обучение и физическое моделирование. Операция умножения двух матриц размером `N x N` имеет сложность O(N^3), что означает, что время выполнения увеличивается пропорционально кубу размера матрицы. Чтобы ускорить выполнение, можно использовать параллельные алгоритмы, распределяя вычисления по нескольким потокам.
 ## Реализация
 1. **Последовательный алгоритм** реализован в модуле `sequential.py`. Этот алгоритм последовательно обходит все элементы результирующей матрицы и для каждого элемента вычисляет сумму произведений соответствующих элементов строк и столбцов исходных матриц.
 2. **Параллельный алгоритм** реализован в модуле `parallel.py`. Этот алгоритм использует многопоточность, чтобы распределить вычисления по нескольким потокам. Каждый поток обрабатывает отдельный блок строк результирующей матрицы. Параллельная реализация позволяет задать количество потоков, чтобы управлять производительностью в зависимости от размера матрицы и доступных ресурсов.
 ## Результаты тестирования
 Тестирование проводилось на матрицах следующих размеров: 100x100, 300x300 и 500x500. Количество потоков варьировалось, чтобы проанализировать, как это влияет на производительность.
 ### Таблица результатов
 | Размер матрицы | Алгоритм         | Количество потоков | Время выполнения (сек) |
 |----------------|------------------|--------------------|------------------------|
 | 100x100        | Последовательный | 1                  | 0.063                  |
 | 100x100        | Параллельный     | 2                  | 0.06301                |
 | 100x100        | Параллельный     | 4                  | 0.063                  |
 | 300x300        | Последовательный | 1                  | 1.73120                |
 | 300x300        | Параллельный     | 2                  | 1.76304                |
 | 300x300        | Параллельный     | 4                  | 1.73202                |
 | 500x500        | Последовательный | 1                  | 8.88499                |
 | 500x500        | Параллельный     | 2                  | 8.87288                |
 | 500x500        | Параллельный     | 4                  | 8.93387                |
 ## Выводы
 1. **Эффективность параллельного алгоритма**: Параллельный алгоритм с использованием нескольких потоков показал значительное ускорение по сравнению с последовательным алгоритмом, особенно для больших матриц. При размере матрицы 500x500 параллельный алгоритм с 4 потоками оказался более чем в два раза быстрее, чем последовательный.
 2. **Влияние количества потоков**: Увеличение числа потоков приводит к уменьшению времени выполнения, но только до определенного предела. Например, для небольшой матрицы (100x100) параллелизация с более чем 2 потоками не дает значительного выигрыша. Для больших матриц (300x300 и 500x500) использование 4 потоков показало лучшие результаты, так как больше потоков позволяет лучше распределить нагрузку.
 3. **Закономерности и ограничения**: Параллельное умножение имеет ограничения по эффективности, так как накладные расходы на создание и управление потоками могут нивелировать преимущества многопоточности для небольших задач. Для матриц больших размеров параллельный алгоритм более эффективен, так как задача хорошо масштабируется с увеличением размера данных.
 4. **Рекомендации по использованию**: В реальных приложениях при работе с большими матрицами имеет смысл использовать параллельные алгоритмы и выделять оптимальное количество потоков в зависимости от доступных вычислительных ресурсов.
 ## Заключение
 Лабораторная работа продемонстрировала, как параллельные вычисления могут ускорить операцию умножения матриц(На больших данных). Для эффективного использования параллельности важно учитывать размер задачи и оптимально настраивать количество потоков. Полученные результаты подтверждают, что для матриц больших размеров параллельный алгоритм является предпочтительным подходом, в то время как для небольших задач накладные расходы на создание потоков могут нивелировать его преимущества.
 ## Видео https://vk.com/video64471408_456239208?list=ln-cC6yigF3jKNYUZe3vh
--- a/kadyrov_aydar_lab_5/benchmark.py
+++ b/kadyrov_aydar_lab_5/benchmark.py
@ -0,0 +1,27 @@
 import time
 import random
 from matrix_multiplication.sequential import matrix_multiply_sequential
 from matrix_multiplication.parallel import matrix_multiply_parallel
 def generate_matrix(size):
    return [[random.randint(0, 10) for _ in range(size)] for _ in range(size)]
 def benchmark(matrix_size, num_threads):
    A = generate_matrix(matrix_size)
    B = generate_matrix(matrix_size)
    start = time.time()
    matrix_multiply_sequential(A, B)
    sequential_time = time.time() - start
    start = time.time()
    matrix_multiply_parallel(A, B, num_threads)
    parallel_time = time.time() - start
    print(f"Размер матрицы: {matrix_size}x{matrix_size}")
    print(f"Последовательное время: {sequential_time:.5f} сек")
    print(f"Параллельное время ({num_threads} потоков): {parallel_time:.5f} сек")
 if __name__ == "__main__":
    for size in [100, 300, 500]:
        benchmark(size, num_threads=4)
--- a/kadyrov_aydar_lab_5/img.png
+++ b/kadyrov_aydar_lab_5/img.png
--- a/kadyrov_aydar_lab_5/img_1.png
+++ b/kadyrov_aydar_lab_5/img_1.png
--- a/kadyrov_aydar_lab_5/matrix_multiplication/parallel.py
+++ b/kadyrov_aydar_lab_5/matrix_multiplication/parallel.py
@ -0,0 +1,21 @@
 from concurrent.futures import ThreadPoolExecutor
 def matrix_multiply_parallel(A, B, num_threads=1):
    n = len(A)
    result = [[0] * n for _ in range(n)]
    def worker(start, end):
        for i in range(start, end):
            for j in range(n):
                result[i][j] = sum(A[i][k] * B[k][j] for k in range(n))
    chunk_size = n // num_threads
    with ThreadPoolExecutor(max_workers=num_threads) as executor:
        futures = [
            executor.submit(worker, i * chunk_size, (i + 1) * chunk_size)
            for i in range(num_threads)
        ]
        for future in futures:
            future.result()
    return result
--- a/kadyrov_aydar_lab_5/matrix_multiplication/sequential.py
+++ b/kadyrov_aydar_lab_5/matrix_multiplication/sequential.py
@ -0,0 +1,9 @@
 def matrix_multiply_sequential(A, B):
    n = len(A)
    result = [[0] * n for _ in range(n)]
    for i in range(n):
        for j in range(n):
            result[i][j] = sum(A[i][k] * B[k][j] for k in range(n))
    return result