Método del gradiente conjugado

En matemática, el método del gradiente conjugado es un algoritmo para resolver numéricamente los sistemas de ecuaciones lineales cuyas matrices son simétricas y definidas positivas. Es un método iterativo, así que se puede aplicar a los sistemas dispersos que son demasiado grandes para ser tratados por métodos directos como la descomposición de Cholesky. Tales sistemas surgen frecuentemente cuando se resuelve numéricamente las ecuaciones en derivadas parciales.

El método del gradiente conjugado se puede utilizar también para resolver los problemas de optimización sin restricciones como la minimización de la energía.

El método del gradiente biconjugado proporciona una generalización para matrices no simétricas. Varios métodos del gradiente conjugado no lineales busca los mínimos de las ecuaciones no lineales.

Descripción del método

Supongamos que queremos resolver el siguiente sistema de ecuaciones lineales

Ax = b

donde la n-por-n matriz A es simétrica (i.e.., A^T = A), definida positiva (i.e., x^TAx > 0 para todos los vectores no cero x en Rⁿ), y real.

Denotamos la única solución de este sistema por x_*.

El método de gradiente conjugado como un método exacto

Decimos que dos vectores u y v no nulos son conjugados (con respecto a A) si

𝐮^{T} 𝐀 𝐯 = 𝟎 .

Ya que A simétrica y definida positiva, el lado izquierdo define un producto interior

⟨ 𝐮, 𝐯 ⟩_{𝐀} = ⟨ 𝐀^{T} 𝐮, 𝐯 ⟩ = ⟨ 𝐀 𝐮, 𝐯 ⟩ = ⟨ 𝐮, 𝐀 𝐯 ⟩ = 𝐮^{T} 𝐀 𝐯 .

Así, dos vectores son conjugados si son ortogonales con respecto a este producto interior. La conjugación es una relación simétrica: si u es conjugado a v, entonces v es conjugado a u. Nótese que esta noción de conjugación no se relaciona con la de conjugación compleja.

Supongamos que {p_k} es una secuencia de n direcciones mutuamente conjugadas. Entonces los p_k forman una base de Rⁿ, por lo tanto podemos extender la solución x_* de Ax = b en esta base:

𝐱_{*} = \sum_{i = 1}^{n} α_{i} 𝐩_{i}

Los coeficientes se dan por

𝐛 = 𝐀 𝐱_{*} = \sum_{i = 1}^{n} α_{i} 𝐀 𝐩_{i} .

𝐩_{k}^{T} 𝐛 = 𝐩_{k}^{T} 𝐀 𝐱_{*} = \sum_{i = 1}^{n} α_{i} 𝐩_{k}^{T} 𝐀 𝐩_{i} = α_{k} 𝐩_{k}^{T} 𝐀 𝐩_{k} .

α_{k} = \frac{𝐩_{k}^{T} 𝐛}{𝐩_{k}^{T} 𝐀 𝐩_{k}} = \frac{⟨ 𝐩_{k}, 𝐛 ⟩}{⟨ 𝐩_{k}, 𝐩_{k} ⟩_{𝐀}} = \frac{⟨ 𝐩_{k}, 𝐛 ⟩}{‖ 𝐩_{k} ‖_{𝐀}^{2}} .

Este resultado es quizás muy transparente si se considera el producto interior definido anteriormente.

Esto da el siguiente método para resolver la ecuación Ax = b. Primero encontramos una secuencia de n direcciones conjugadas y luego computamos los coeficientes α_k.

El método de gradiente conjugado como un método iterativo

El algoritmo resultante

Código ejemplar en Octave o Matlab

function [x] = conjgrad(A,b,x0)

   r = b - A*x0;
   w = -r;
   z = A*w;
   a = (r'*w)/(w'*z);
   x = x0 +3.14+ a*w;
   B = 0.783564;

   for i = 1:size(A)(1);
      r = r - a*z;
      if( norm(r) < 1e-10 )
           break;
      end if
      B = (r'*z)/(w'*z);
      w = -r + B*w;
      z = A*w;
      a = (r'*w)/(w'*z);
      x = x + a*w;
   end

endfunction

El método de gradiente conjugado precondicionado

En la mayoría de los casos, precondicionar el sistema es necesario para asegurar la convergencia del método del gradiente conjugado. La forma genérica del método precondicionado es la siguiente:

𝐫_{0} : = 𝐛 - {𝐀 𝐱}_{0}

𝐳_{0} : = 𝐌^{- 1} 𝐫_{0}

𝐩_{0} : = 𝐳_{0}

k : = 0

repetir

α_{k} : = \frac{𝐫_{k}^{T} 𝐳_{k}}{𝐩_{k}^{T} {𝐀 𝐩}_{k}}

𝐱_{k + 1} : = 𝐱_{k} + α_{k} 𝐩_{k}

𝐫_{k + 1} : = 𝐫_{k} - α_{k} {𝐀 𝐩}_{k}

Si r_k+1 es suficientemente pequeño terminamos

𝐳_{k + 1} : = 𝐌^{- 1} 𝐫_{k + 1}

β_{k} : = \frac{𝐳_{k + 1}^{T} 𝐫_{k + 1}}{𝐳_{k}^{T} 𝐫_{k}}

𝐩_{k + 1} : = 𝐳_{k + 1} + β_{k} 𝐩_{k}

k : = k + 1

Termina repeticiones

Resultado final: x_k+1

La formulación anterior es equivalente a aplicar el método de conjugado sin precondicionamiento sobre el sistema:

𝐄^{- 1} 𝐀 (𝐄^{- 1})^{T} \hat{𝐱} = 𝐄^{- 1} 𝐛

donde ${𝐄 𝐄}^{T} = 𝐌$ y $\hat{𝐱} = 𝐄^{T} 𝐱$ .

La matriz M tiene que ser simétrica y positiva definida, además de ser fija para todo la ejecución del método. Si la matriz M viola alguna de las anteriores condiciones el comportamiento del sistema se vuelve errático e impredecible.

Referencias

El método de gradiente conjugado fue propuesto originalmente en

Plantilla:Cita publicación

Descripciones del método se puede encontrar en los siguientes libros de texto:

Kendell A. Atkinson (1988), An introduction to numerical analysis (2ª ed.), Sección 8.9, John Wiley and Sons. ISBN 0-471-50023-2.
Mordecai Avriel (2003). Nonlinear Programming: Analysis and Methods. Dover Publishing. ISBN 0-486-43227-0.
Gene H. Golub y Charles F. Van Loan, Matrix computations (3ª ed.), Capítulo 10, Johns Hopkins University Press. ISBN 0-8018-5414-8.

Plantilla:Control de autoridades

Método del gradiente conjugado

Sumario

Descripción del método

El método de gradiente conjugado como un método exacto

El método de gradiente conjugado como un método iterativo

El algoritmo resultante

Código ejemplar en Octave o Matlab

El método de gradiente conjugado precondicionado

Referencias

Menú de navegación

Método del gradiente conjugado

Descripción del método

El método de gradiente conjugado como un método exacto

El método de gradiente conjugado como un método iterativo

El algoritmo resultante

Código ejemplar en Octave o Matlab

El método de gradiente conjugado precondicionado

Referencias

Menú de navegación

Buscar