Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский Государственный Технический Университет

Предмет:

Методы вычислений

Файл:

Лекции по методам параллельных вычислений / Лекция 10.ppt

Скачиваний:

Добавлен:

28.03.2016

Размер:

1.04 Mб

Скачать

☆

1 / 51 2 3 4 5 > Следующая >>>

Самарский государственный технический университет филиал в г. Сызрани

Электротехнический Факультет

Дисциплина

Методы параллельных

вычислений

Лекция 10.

Параллельные методы матричного умножения

Тараканов А.В., доцент, к.п.н. Кафедра Информатики и систем управления

Содержание

Постановка задачи

Последовательный алгоритм

Алгоритм 1 – ленточная схема

Алгоритм 2 – метод Фокса

Алгоритм 3 – метод Кэннона

Заключение

2 из 45

Постановка задачи

Умножение матриц:

C A B

или

	c ,		c		,		...,	c				a		0,0	,	a		0,1	,	...,	a		0,n 1			b		,		b ,	...,	a	0,l 1
		0,0		0,1			...		0,l 1					0,0				0,1		...			0,n 1			0,0				0,1	...		0,l 1
							...													...											...

c		m 1,0	, c	m 1,1		,	...,	c	m 1,l	1	a		m 1,0			, a	m 1,1			, ...,	a	m 1,n		1	b		1,0		,	b	, ...,	b
		m 1,0		m 1,1					m 1,l	1			m 1,0				m 1,1					m 1,n		1		n	1,0			n 1,1		n 1,l 1

Задача умножения матрицы на вектор может быть сведена к выполнению m·n независимых операций умножения строк матрицы A на столбцы матрицы B

n 1

cij ai ,bTj aik bkj , 0 i m, 0 j l

Воснову организации параллельных вычислений может

быть положен принцип распараллеливания по данным

3 из 45

Последовательный алгоритм…

//Алгоритм 8.1

//Последовательный алгоритм матричного умножения double MatrixA[Size][Size];

double MatrixB[Size][Size]; double MatrixC[Size][Size]; int i,j,k;

...

for (i=0; i<Size; i++){ for (j=0; j<Size; j++){

MatrixC[i][j] = 0;

for (k=0; k<Size; k++){

MatrixC[i][j] = MatrixC[i][j] + MatrixA[i][k]*MatrixB[k][j];

}

4 из 45

Последовательный алгоритм

Алгоритм осущесвляет последовательное вычисление строк матрицы С

На одной итерации цикла по переменной i используется первая строка матрицы A и все столбцы матрицы B

Для выполнения матрично-векторного умножения необходимо выполнить m·n операций вычисления скалярного произведения

Трудоемкость вычислений имеет порядок O(mnl).

5 из 45

Параллельный алгоритм 1: ленточная схема…

Возможный подход – в качестве базовой

подзадачи процедура вычисления одного из элементов матрицы С

cij ai ,bTj , ai ai0,ai1,...,ain 1 , bTj b0 j ,b1 j ,...,bn 1 j T

Достигнутый уровень параллелизма - количество базовых подзадач равно n2 – является избыточным!

Как правило p<n2 и необходимым является масштабирование параллельных вычислений

6 из 45

Параллельный алгоритм 1: ленточная схема…

Базовая подзадача (агрегация) - процедура

вычисления всех элементов одной из строк матрицы С (количество подзадач равно n)

Распределение данных – ленточная схема (разбиение матрицы A по строкам и матрицы B

по столбцам) A

7 из 45

Параллельный алгоритм 1: ленточная схема…

Выделение информационных зависимостей

–Каждая подзадача содержит по одной строке матрицы А и одному столбцу матрицы В,

–На каждой итерации проводится скалярное умножение содержащихся в подзадачах строк и столбцов, что

приводит к получению соответствующих элементов результирующей матрицы С,

–На каждой итерации каждая подзадача i, 0 i<n, передает свой столбец матрицы В подзадаче с номером (i+1) mod n.

После выполнения всех итераций алгоритма в каждой подзадаче поочередно окажутся все столбцы матрицы В.

8 из 45

Параллельный алгоритм 1: ленточная схема…

Схема информационного взаимодействия

9 из 45

Параллельный алгоритм 1: ленточная схема…

Масштабирование и распределение подзадач по процессорам

–Если число процессоров p меньше числа базовых подзадач n (p<n), базовые подзадачи могут быть укрупнены с тем, чтобы

каждый процессор вычислял несколько строк результирующей матрицы С,

–В этом случае, исходная матрица A разбивается на ряд горизонтальных полос, а матрица B представляется в виде набора вертикальных полос,

–Для распределения подзадач между процессорами может быть использован любой способ, обеспечивающий эффективное представление кольцевой структуры информационного взаимодействия подзадач.

10 из 45

1 / 51 2 3 4 5 > Следующая >>>

Соседние файлы в папке Лекции по методам параллельных вычислений

#
28.03.2016281.09 Кб28Лекция 1.ppt
#
28.03.20161.04 Mб34Лекция 10.ppt
#
28.03.2016749.57 Кб31Лекция 11.ppt
#
28.03.20161.23 Mб36Лекция 12.ppt
#
28.03.20161.03 Mб36Лекция 13.ppt
#
28.03.20161.4 Mб28Лекция 14.ppt
#
28.03.2016704 Кб23Лекция 15.ppt