Документация

x = bicg(A,b) попытки решить систему линейных уравнений A*x = b для x с использованием метода градиентов биконъюгата. При успешной попытке bicg отображает сообщение для подтверждения сходимости. Если bicg не сходится после максимального количества итераций или останавливается по какой-либо причине, отображается диагностическое сообщение, включающее относительный остаток norm(b-A*x)/norm(b) и номер итерации, на котором остановился метод.

x = bicg(A,b,tol) задает допуск для метода. Допуск по умолчанию: 1e-6.

x = bicg(A,b,tol,maxit) указывает максимальное количество используемых итераций. bicg отображает диагностическое сообщение, если оно не сходится внутри maxit итерации.

x = bicg(A,b,tol,maxit,M) задает матрицу предварительного условия M и вычисляет x путем эффективного решения системы $M^{−} {1Ax}^{=}$ M − 1b. Использование матрицы предварительного кондиционирования может улучшить числовые свойства задачи и эффективность вычисления.

x = bicg(A,b,tol,maxit,M1,M2) определяет коэффициенты матрицы предварительного условия M такой, что M = M1*M2.

x = bicg(A,b,tol,maxit,M1,M2,x0) задает начальное предположение для вектора решения x. По умолчанию используется вектор нулей.

[x,flag] = bicg(___) возвращает флаг, указывающий, успешно ли сходился алгоритм. Когда flag = 0, конвергенция была успешной. Этот синтаксис вывода можно использовать с любой из предыдущих комбинаций входных аргументов. При указании flag вывод, bicg не отображает диагностические сообщения.

[x,flag,relres] = bicg(___) также возвращает относительный остаток norm(b-A*x)/norm(b). Если flag является 0, то relres <= tol.

[x,flag,relres,iter] = bicg(___) также возвращает номер итерации iter при котором x был вычислен.

[x,flag,relres,iter,resvec] = bicg(___) также возвращает вектор остаточных норм в каждой итерации, включая первый остаточный norm(b-A*x0).

Примеры

Итеративное решение для линейной системы

Решение квадратной линейной системы с помощью bicg с настройками по умолчанию, а затем скорректировать допуск и количество итераций, используемых в процессе решения.

Создание случайной разреженной матрицы A с плотностью 50%. Также создать случайный вектор b для правой стороны $Ax =$ b.

rng default
A = sprand(400,400,.5);
A = A'*A;
b = rand(400,1);

Решить $Ax =$ b с помощьюbicg. Выходной дисплей включает в себя значение относительной остаточной ошибки $\frac{‖ b-Ax}{‖}$ ‖ b ‖.

x = bicg(A,b);

bicg stopped at iteration 20 without converging to the desired tolerance 1e-06
because the maximum number of iterations was reached.
The iterate returned (number 7) has relative residual 0.45.

По умолчанию bicg использует 20 итераций и допуск 1e-6и алгоритм не может сойтись в этих 20 итерациях для этой матрицы. Поскольку остаток все еще велик, это хороший показатель того, что требуется больше итераций (или матрица предварительного условия). Можно также использовать больший допуск, чтобы упростить сходимость алгоритма.

Повторное решение системы с использованием допуска 1e-4 и 100 итераций.

x = bicg(A,b,1e-4,100);

bicg stopped at iteration 100 without converging to the desired tolerance 0.0001
because the maximum number of iterations was reached.
The iterate returned (number 7) has relative residual 0.45.

Даже при меньшем допуске и большем количестве итераций остаточная ошибка не сильно улучшается. Когда итеративный алгоритм останавливается таким образом, это является хорошим показателем того, что необходима матрица предварительного условия.

Рассчитать неполную факторизацию Холеского Aи используйте L' фактор в качестве предварительного условия ввода в bicg.

L = ichol(A);
x = bicg(A,b,1e-4,100,L');

bicg converged at iteration 58 to a solution with relative residual 7.8e-05.

Использование предварительного условия улучшает численные свойства проблемы настолько, что bicg способен сходиться.

Используя `bicg` с предварительным условием

Анализ влияния использования матрицы предварительного кондиционирования с помощью bicg для решения линейной системы.

Загрузка west0479, вещественная несимметричная разреженная матрица 479 на 479.

load west0479
A = west0479;

Определить b так что истинное решение $Ax =$ b является вектором всех.

b = sum(A,2);

Задайте допуск и максимальное количество итераций.

tol = 1e-12;
maxit = 20;

Использовать bicg для поиска решения по требуемому допуску и количеству итераций. Укажите пять выходов для возврата информации о процессе решения:

x является вычисленным решением для A*x = b.
fl0 - флаг, указывающий, сходился ли алгоритм.
rr0 - относительный остаток вычисленного ответа x.
it0 - номер итерации, когда x был вычислен.
rv0 является вектором остаточной истории для $‖ b-Ax$ ‖.

[x,fl0,rr0,it0,rv0] = bicg(A,b,tol,maxit);
fl0

fl0 = 1

rr0

rr0 = 1

it0

it0 = 0

fl0 равно 1, потому что bicg не сходится с требуемым допуском 1e-12 в пределах запрошенных 20 итераций. На самом деле, поведение bicg настолько беден, что первоначальное предположение x0 = zeros(size(A,2),1) является лучшим решением и возвращается, как указано it0 = 0.

Чтобы помочь с медленной сходимостью, можно указать матрицу предварительного условия. С тех пор A несимметричен, используется ilu для создания устройства предварительного кондиционирования $M = L$ U. Задание допуска перетаскивания для игнорирования недиагональных записей со значениями меньше 1e-6. Определите предварительно кондиционированную систему $^{M-1} A x =^{} M-1$ b путем указанияL и U в качестве входных данных для bicg.

setup = struct('type','ilutp','droptol',1e-6);
[L,U] = ilu(A,setup);
[x1,fl1,rr1,it1,rv1] = bicg(A,b,tol,maxit,L,U);
fl1

fl1 = 0

rr1

rr1 = 4.1336e-14

it1

it1 = 6

Использование ilu средство предварительного кондиционирования производит относительный остаток, меньший, чем предписанный допуск 1e-12 на шестой итерации. Продукция rv1(1) является norm(b)и выходные данные rv1(end) является norm(b-A*x1).

Вы можете следить за ходом выполнения bicg путем построения графика относительных остатков в каждой итерации. Постройте график остаточной истории каждого решения со строкой для заданного допуска.

semilogy(0:length(rv0)-1,rv0/norm(b),'-o')
hold on
semilogy(0:length(rv1)-1,rv1/norm(b),'-o')
yline(tol,'r--');
legend('No preconditioner','ILU preconditioner','Tolerance','Location','East')
xlabel('Iteration number')
ylabel('Relative residual')

Figure contains an axes. The axes contains 3 objects of type line, constantline. These objects represent No preconditioner, ILU preconditioner, Tolerance.

Предоставление начального предположения

Проверить влияние подачи bicg с первоначальным предположением решения.

Создайте тридиагональную разреженную матрицу. Используйте сумму каждой строки в качестве вектора для правой стороны $Ax =$ b, чтобы ожидаемое решение $для$ x было вектором единиц.

n = 900;
e = ones(n,1);
A = spdiags([e 2*e e],-1:1,n,n);
b = sum(A,2);

Использовать bicg для решения $Ax =$ b дважды: один раз с начальным предположением по умолчанию и один раз с хорошим начальным предположением решения. Используйте 200 итераций и допуск по умолчанию для обоих решений. Укажите начальное предположение во втором решении как вектор со всеми элементами, равными 0.99.

maxit = 200;
x1 = bicg(A,b,[],maxit);

bicg converged at iteration 35 to a solution with relative residual 9.5e-07.

x0 = 0.99*e;
x2 = bicg(A,b,[],maxit,[],[],x0);

bicg converged at iteration 7 to a solution with relative residual 8.7e-07.

В этом случае предоставление начального предположения позволяет bicg для более быстрого сближения.

Возврат промежуточных результатов

Вы также можете использовать начальное предположение для получения промежуточных результатов путем вызова bicg в цикле for. Каждый вызов решателя выполняет несколько итераций и сохраняет вычисленное решение. Затем это решение используется в качестве начального вектора для следующего пакета итераций.

Например, этот код выполняет 100 итераций четыре раза и сохраняет вектор решения после каждого прохода в цикле for:

x0 = zeros(size(A,2),1);
tol = 1e-8;
maxit = 100;
for k = 1:4
    [x,flag,relres] = bicg(A,b,tol,maxit,[],[],x0);
    X(:,k) = x;
    R(k) = relres;
    x0 = x;
end

X(:,k) - вектор решения, вычисленный при итерации k цикла for, и R(k) - относительный остаток этого решения.

Использование дескриптора функции вместо числовой матрицы

Решение линейной системы путем предоставления bicg с дескриптором функции, который вычисляет A*x и A'*x вместо матрицы коэффициентов A.

Создайте несимметричную тридиагональную матрицу. Предварительный просмотр матрицы.

A = gallery('wilk',21) + diag(ones(20,1),1)

A = 21×21

    10     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     1     9     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     1     8     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     1     7     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     1     6     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     1     5     2     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     1     4     2     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     1     3     2     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     1     2     2     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     0     1     1     2     0     0     0     0     0     0     0     0     0     0
      ⋮

Поскольку эта тридиагональная матрица имеет специальную структуру, можно представить операцию A*x с дескриптором функции. Когда A умножает вектор, большинство элементов в полученном векторе равны нулю. Ненулевые элементы в результате соответствуют ненулевым тридиагональным элементам A.

Выражение $A x$ становится следующим:

$A \begin{array}{c} x=[1020⋯⋯01920⋮01⋱20⋮010⋱⋱⋮0⋱1⋱0⋮⋱⋱⋱20⋯⋯0110 \end{array}] \begin{array}{c} [_{} \\ _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{}_{} \\ _{}_{}_{} \\ _{}_{}_{} \\ _{}_{} \end{array} x1x2x3⋮⋮x21]=[10x1+2x2x1+9x2+2x3⋮⋮x19+9x20+2x21x20+10x21$ ].

Результирующий вектор можно записать как сумму трех векторов:

$A \begin{array}{c} _{}_{} \\ _{}_{}_{} \\ _{}_{}_{} \\ _{}_{} \end{array}$ x=[10x1+2x2x1+9x2+2x3⋮⋮x19+9x20+2x21x20+10x21]=[0x1x2⋮x20]+[10x19x2⋮9x2010x21]+2⋅[x2x3⋮x210 $\begin{array}{c} _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{} \\ _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{} \\ _{} \\ _{} \end{array}$ ].

Аналогично, выражение для $^{AT} x$ становится следующим:

$^{AT} \begin{array}{c} x=[1010⋯⋯02910⋮02⋱10⋮020⋱⋱⋮0⋱1⋱0⋮⋱⋱⋱10⋯⋯0210 \end{array}] \begin{array}{c} [_{} \\ _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{}_{} \\ _{}_{}_{} \\ _{}_{}_{} \\ _{}_{} \end{array} x1x2x3⋮⋮x21]=[10x1+x22x1+9x2+x3⋮⋮2x19+9x20+x212x20+10x21$ ].

$^{AT} \begin{array}{c} _{}_{} \\ _{}_{}_{} \\ _{}_{}_{} \\ _{}_{} \end{array} \begin{array}{c} _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{} \\ _{} \\ _{} \\ _{} \end{array} \begin{array}{c} _{} \\ _{} \\ _{} \\ x=[10x1+x22x1+9x2+x3⋮⋮2x19+9x20+x212x20+10x21]=2⋅[0x1x2⋮x20]+[10x19x2⋮9x2010x21]+[x2x3⋮x210 \end{array}$ ].

В MATLAB ® запишите функцию, которая создает эти векторы и добавляет их вместе, давая значение A*x или A'*x, в зависимости от ввода флага:

function y = afun(x,flag)
if strcmp(flag,'notransp') % Compute A*x
    y = [0; x(1:20)] ...
        + [(10:-1:0)'; (1:10)'].*x ...
        + 2*[x(2:end); 0];
elseif strcmp(flag,'transp') % Compute A'*x
    y = 2*[0; x(1:20)] ...
        + [(10:-1:0)'; (1:10)'].*x ...
        + [x(2:end); 0];
end
end

(Эта функция сохраняется как локальная функция в конце примера.)

Теперь решите линейную систему $Ax =$ b, предоставивbicg с дескриптором функции, который вычисляет A*x и A'*x. Использовать допуск 1e-6 и 25 итераций. Укажите $b$ в качестве сумм строк $A$ так, чтобы истинное решение для $x$ было вектором единиц.

b = full(sum(A,2));
tol = 1e-6;  
maxit = 25;
x1 = bicg(@afun,b,tol,maxit)

bicg converged at iteration 19 to a solution with relative residual 4.8e-07.

Локальные функции

function y = afun(x,flag)
if strcmp(flag,'notransp') % Compute A*x
    y = [0; x(1:20)] ...
        + [(10:-1:0)'; (1:10)'].*x ...
        + 2*[x(2:end); 0];
elseif strcmp(flag,'transp') % Compute A'*x
    y = 2*[0; x(1:20)] ...
        + [(10:-1:0)'; (1:10)'].*x ...
        + [x(2:end); 0];
end
end

Входные аргументы

`A` - Матрица коэффициентов
матрица | дескриптор функции

Матрица коэффициентов, заданная как квадратная матрица или дескриптор функции. Эта матрица является матрицей коэффициентов в линейной системе A*x = b. Как правило, A - большая разреженная матрица или дескриптор функции, возвращающий произведение большой разреженной матрицы и вектора столбца.

Определение `A` как дескриптор функции

При необходимости можно указать матрицу коэффициентов в качестве дескриптора функции вместо матрицы. Дескриптор функции возвращает матрично-векторные произведения вместо формирования всей матрицы коэффициентов, делая вычисление более эффективным.

Для использования дескриптора функции используйте сигнатуру функции. function y = afun(x,opt). Параметризация функций объясняет, как предоставить дополнительные параметры функции afun, при необходимости. Функция afun должны удовлетворять следующим условиям:

afun(x,'notransp') возвращает продукт A*x.
afun(x,'transp') возвращает продукт A'*x.

Примером приемлемой функции является:

function y = afun(x,opt,B,C,n)
if strcmp(opt,'notransp')
    y = [B*x(n+1:end); C*x(1:n)];
else
    y = [C'*x(n+1:end); B'*x(1:n)];
end

Функция afun использует значения в B и C для вычисления A*x или A'*x (в зависимости от указанного флага) без фактического формирования всей матрицы.

Типы данных: double | function_handle
Поддержка комплексного номера: Да

`b` - Правая часть линейного уравнения
вектор столбца

Правая часть линейного уравнения, заданная как вектор-столбец. Длина b должно быть равно size(A,1).

Типы данных: double
Поддержка комплексного номера: Да

`tol` - Допуск метода
`[]` или `1e-6` (по умолчанию) | положительный скаляр

Допуск метода, заданный как положительный скаляр. Этот ввод используется для согласования точности и времени выполнения в расчете. bicg должен соответствовать допуску в пределах числа разрешенных итераций для успешного выполнения. Меньшее значение tol означает, что для успешного выполнения расчета ответ должен быть более точным.

Типы данных: double

`maxit` - Максимальное число итераций
`[]` или `min(size(A,1),20)` (по умолчанию) | положительное скалярное целое

Максимальное число итераций, указанное как положительное скалярное целое число. Увеличение значения maxit разрешить больше итераций для bicg для соответствия допуску tol. Как правило, меньшее значение tol означает, что для успешного завершения вычисления требуется больше итераций.

`M`, `M1`, `M2` - Матрицы предварительного условия (как отдельные аргументы)
`eye(size(A))` (по умолчанию) | матрицы | дескрипторы функций

Матрицы предварительного условия, определенные как отдельные аргументы матриц или дескрипторов функций. Можно указать матрицу предварительного условия. M или его матричные коэффициенты M = M1*M2 улучшить численные аспекты линейной системы и упростить ее bicg чтобы быстро сойтись. Для матриц с квадратными коэффициентами можно использовать неполные функции факторизации матриц ilu и ichol для формирования матриц предварительного условия. Вы также можете использовать equilibrate перед факторизацией для улучшения номера условия матрицы коэффициентов. Дополнительные сведения о предварительных кондиционирующих устройствах см. в разделе Итерационные методы для линейных систем.

bicg рассматривает неопределенные предварительные условия как матрицы идентичности.

Определение `M` как дескриптор функции

При необходимости можно указать любой из M, M1, или M2 в качестве дескрипторов функции вместо матриц. Дескриптор функции выполняет операции матрица-вектор вместо формирования всей матрицы предварительного условия, делая вычисление более эффективным.

Чтобы использовать дескриптор функции, сначала создайте функцию с сигнатурой function y = mfun(x,opt). Параметризация функций объясняет, как предоставить дополнительные параметры функции mfun, при необходимости. Функция mfun должны удовлетворять следующим условиям:

mfun(x,'notransp') возвращает значение M\x или M2\(M1\x).
mfun(x,'transp') возвращает значение M'\x или M1'\(M2'\x).

Примером приемлемой функции является:

function y = mfun(x,opt,a,b)  
if strcmp(opt,'notransp')
    y = x.*a;
else
    y = x.*b;
end
end

В этом примере функция mfun использование a и b для вычисления M\x = x*a или M'\x = x*b (в зависимости от указанного флага) без фактического формирования всей матрицы M.

Типы данных: double | function_handle
Поддержка комплексного номера: Да

`x0` - Начальное предположение
`[]` или вектор столбца с нулями (по умолчанию) | вектор столбца

Начальное предположение, указанное как вектор столбца с длиной, равной size(A,2). Если вы можете предоставить bicg с более разумным начальным предположением x0 чем вектор нулей по умолчанию, то он может сэкономить время вычислений и помочь алгоритму быстрее сойтись.

Типы данных: double
Поддержка комплексного номера: Да

Выходные аргументы

`x` - Линейное системное решение
вектор столбца

Решение линейной системы, возвращаемое в виде вектора столбца. Этот выход дает приблизительное решение для линейной системы A*x = b. Если расчет выполнен успешно (flag = 0), то relres меньше или равно tol.

При неудачном выполнении расчета (flag ~= 0), решение x возвращено bicg - это норма с минимальной остаточной нормой, вычисленной по всем итерациям.

`flag` - Флаг сходимости
скаляр

Флаг сходимости, возвращаемый как одно из скалярных значений в этой таблице. Флаг сходимости указывает, было ли вычисление успешным, и различает несколько различных форм отказа.

Значение флага	Сходимость
`0`	Успех - `bicg` сходится к требуемому допуску `tol` в `maxit` итерации.
`1`	Отказ - `bicg` повторенный `maxit` итерации, но не сходились.
`2`	Отказ - матрица предварительного кондиционирования `M` или `M = M1*M2` плохо кондиционирован.
`3`	Отказ - `bicg` стагнация после двух последовательных итераций была одинаковой.
`4`	Сбой - одна из скалярных величин, вычисленных `bicg` алгоритм стал слишком маленьким или слишком большим для продолжения вычислений.

`relres` - Относительная остаточная ошибка
скаляр

Относительная остаточная ошибка, возвращаемая как скаляр. Относительная остаточная ошибка relres = norm(b-A*x)/norm(b) является показателем того, насколько точен ответ. Если расчет сходится к допуску tol в maxit итерации, затем relres <= tol.

Типы данных: double

`iter` - Номер итерации
скаляр

Номер итерации, возвращаемый как скаляр. Этот вывод указывает номер итерации, при котором вычисленный ответ для x был рассчитан.

Типы данных: double

`resvec` - Остаточная ошибка
вектор

Остаточная ошибка, возвращенная в виде вектора. Остаточная ошибка norm(b-A*x) показывает, насколько близок алгоритм к сходимости для данного значения x. Количество элементов в resvec равно числу итераций. Вы можете изучить содержимое resvec чтобы помочь решить, изменять ли значения tol или maxit.

Типы данных: double

Подробнее