Operador de proyección

De testwiki
Ir a la navegación Ir a la búsqueda
La transformación P es la proyección ortogonal sobre una recta m

En matemáticas, un operador de proyección P en un espacio vectorial es una transformación lineal idempotente, es decir, que satisface la igualdad P2 = P.[1]

Introducción

Dichas transformaciones proyectan cualquier punto x del espacio vectorial a un punto del subespacio imagen de la transformación. En caso de que x pertenezca al subespacio imagen, la proyección no tiene efecto, dejando el punto x fijo.[2]

Por ejemplo, el operador P definido en R3 de la forma siguiente Plantilla:Ecuación es un operador que "proyecta" el espacio R3 sobre el espacio de dimensión 2 que consiste de los vectores cuya coordenada y es cero.

Esta definición abstracta, de "proyector" o "proyección" generaliza la idea gráfica intuitiva de proyección extendiéndola a cualquier tipo de espacio vectorial, incluyendo el caso de dimensión infinita donde no resulta posible una aproximación gráfica.

Descomposición de un vector mediante una proyección

Sea V un espacio vectorial, P:VV una proyección e I:VV la aplicación identidad. Se verifica que Q=I-P es una proyección. Además, dado que P+Q=I todo vector puede ser descompuesto de la siguiente forma: 𝒙=𝑷(𝒙)+𝑸(𝒙)=𝒙1+𝒙2.[3]

Proyectores ortogonales o autoadjuntos

Plantilla:AP Para pasar del concepto de «proyección» al de «proyección ortogonal» es preciso que exista un instrumento que nos diga si dos vectores son ortogonales, es decir, perpendiculares. Este instrumento es un producto interior definido en el espacio vectorial. Todo producto interior define una norma. El espacio vectorial puede ser o no completo respecto a ella. Si lo es, pasamos a hablar de un espacio de Hilbert. En este espacio, los conceptos «ortogonal» y «proyección ortogonal» están dotados plenamente de sentido.

En general, dado un subespacio vectorial W de un espacio V, existen muchas proyecciones sobre V. Si el espacio es un espacio de Hilbert y se exige además que el operador P sea un autoadjunto, es decir Plantilla:Ecuación entonces la proyección sobre V es única. El término «operador de proyección ortogonal» significa «operador de proyección autoadjunto».

En física, el término «operador de proyección» es sinónimo con proyección ortogonal.

En álgebra lineal y análisis funcional, una proyección es un aplicación lineal P de un espacio vectorial sobre sí mismo (un endomorfismo) tal que PP=P. Es decir, siempre que P se aplica dos veces a cualquier vector, se obtiene el mismo resultado que si se aplicara una vez (es decir, P es idempotente). Expresado de otra manera, la imagen resultante queda sin cambios tras sucesivas aplicaciones.[2] Esta definición de proyección formaliza y generaliza la idea de proyección tridimensional. También se puede considerar el efecto de una proyección sobre un objeto geométrico examinando el efecto de la proyección sobre sus puntos.

Definiciones

Una proyección sobre un espacio vectorial V es un operador lineal P:VV tal que P2=P.

Cuando V posee un producto interior y es completo, es decir, cuando V es un espacio de Hilbert, se puede utilizar el concepto de ortogonalidad. Una proyección P en un espacio de Hilbert V se denomina proyección ortogonal si satisface P𝐱,𝐲=𝐱,P𝐲 para todo 𝐱,𝐲V. Una proyección sobre un espacio de Hilbert que no es ortogonal se denomina proyección oblicua.

Matriz de proyección

Los autovalores de una matriz de proyección deben ser 0 o 1.

Ejemplos

Proyección ortogonal

Plantilla:AP

Por ejemplo, la función que asigna el punto (x,y,z) en el espacio tridimensional 3 al punto (x,y,0) es una proyección ortogonal sobre el plano xy. Esta función está representada por la matriz.

P=[100010000].

La acción de esta matriz sobre un vector arbitrario es

P[xyz]=[xy0].

Para ver que P es de hecho una proyección, es decir, P=P2, se calcula

P2[xyz]=P[xy0]=[xy0]=P[xyz].

Debe observarse que PT=P muestra que la proyección es una proyección ortogonal.

Proyección oblicua

Un ejemplo simple de una proyección no ortogonal (oblicua) es

P=[00α1].

A través de multiplicación de matrices, se ve que

P2=[00α1][00α1]=[00α1]=P.

mostrando que P es de hecho una proyección.

La proyección P es ortogonal si y solo si α=0 porque solo entonces PT=P.

Propiedades y clasificación

La transformación T es la proyección a lo largo de k sobre m. El rango de T es m y el núcleo es k

Idempotencia

Por definición, una proyección P es idempotente (es decir, P2=P).

Aplicación abierta

Cada proyección es una aplicación abierta, lo que significa que asigna cada conjunto abierto de su dominio a un conjunto abierto en el subespacio topológico de la imagen. Es decir, para cualquier vector 𝐱 y cualquier bola B𝐱 (con radio positivo) centrada en 𝐱, existe una bola BP𝐱 (con radio positivo) centrada en P𝐱 que está totalmente contenida en la imagen P(B𝐱).

Complementariedad de imagen y kernel

Sea W un espacio vectorial de dimensión finita y sea P una proyección sobre W. Supóngase que los subespacios U y V son imagen y núcleo de P respectivamente. Entonces, P tiene las siguientes propiedades:

  1. P es la función identidad I en U:
𝐱U:P𝐱=𝐱.
  1. Existe la suma directa W=UV. Cada vector 𝐱W puede descomponerse únicamente como 𝐱=𝐮+𝐯 con 𝐮=P𝐱 y 𝐯=𝐱P𝐱=(IP)𝐱, y donde 𝐮U,𝐯V.

La imagen y el núcleo de una proyección son complementarios, al igual que P y Q=IP. El operador Q también es una proyección, ya que la imagen y el núcleo de P se convierten en el núcleo y la imagen de Q y viceversa. Se dice que P es una proyección en V sobre U (núcleo/imagen) y Q es una proyección en U sobre V.

Espectro

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en {0,1} como

(λIP)1=1λI+1λ(λ1)P.

Sólo 0 o 1 puede ser los valores propios de una proyección. Esto implica que una proyección ortogonal P es siempre una matriz semidefinida positiva. En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio V, puede haber muchas proyecciones cuyo rango (o núcleo) sea V.

Si una proyección no es trivial, tiene como polinomio mínimo x2x=x(x1), que se descompone en distintos factores lineales y, por lo tanto, P es diagonalizable.

Producto de proyecciones

El producto de proyecciones no es en general una proyección, aunque sean ortogonales. Si dos proyecciones conmutan entonces su producto es una proyección, pero el enunciado inverso es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales conmutan, entonces su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (de manera más general: dos endomorfismo autoadjuntos conmutan si y solo si su producto es autoadjunto).

Proyecciones ortogonales

Plantilla:AP

Cuando el espacio vectorial W tiene un espacio prehilbertiano y está completo (es decir, es un espacio de Hilbert) se puede utilizar el concepto de ortogonalidad. Una proyección ortogonal se caracteriza porque el rango U y el núcleo V son subespacios ortogonales. Así, por cada 𝐱 y 𝐲 en W, P𝐱,(𝐲P𝐲)=(𝐱P𝐱),P𝐲=0.

Equivalentemente:

𝐱,P𝐲=P𝐱,P𝐲=P𝐱,𝐲.

Una proyección es ortogonal si y solo si es autoadjunta. Usando las propiedades de ser autoadjunta e idempotente de P, para cualquier 𝐱 y 𝐲 en W se tiene que P𝐱U, 𝐲P𝐲V y

P𝐱,𝐲P𝐲=𝐱,(PP2)𝐲=0

donde , es el producto interno asociado con W. Por tanto, P y IP son proyecciones ortogonales.[5] La relación en sentido contrario, es decir, que si P es ortogonal, entonces es autoadjunta; se sigue de la implicación de (𝐱P𝐱),P𝐲=P𝐱,(𝐲P𝐲)=0 a

𝐱,P𝐲=P𝐱,P𝐲=P𝐱,𝐲=𝐱,P*𝐲

para cada x y y en W; y por lo tanto P=P*.

La existencia de una proyección ortogonal sobre un subespacio cerrado se desprende del teorema de proyección de Hilbert.

Propiedades y casos especiales

Una proyección ortogonal es un operador lineal acotado. Esto se debe a que para cada 𝐯 en el espacio vectorial se tiene que, por la desigualdad de Cauchy-Bunyakovsky-Schwarz:

P𝐯2=P𝐯,P𝐯=P𝐯,𝐯P𝐯𝐯

Así, P𝐯𝐯.

Para espacios vectoriales reales o complejos de dimensión finita, el producto escalar se puede sustituir por ,.

Fórmulas

Un caso simple ocurre cuando la proyección ortogonal es sobre una recta. Si 𝐮 es un vector unitario en la recta, entonces la proyección viene dada por el producto exterior

P𝐮=𝐮𝐮𝖳.

(si 𝐮 tiene un valor complejo, la traspuesta en la ecuación anterior se reemplaza por una transpuesta hermítica). Este operador deja invariante u y anula todos los vectores ortogonales a 𝐮, lo que demuestra que de hecho es la proyección ortogonal sobre la línea recta que contiene a u.[6] Una forma sencilla de ver esto es considerar un vector arbitrario 𝐱 como la suma de una componente de la recta (es decir, el vector proyectado que buscamos) y otra perpendicular a ella, 𝐱=𝐱+𝐱. Aplicando la proyección se obtiene

P𝐮𝐱=𝐮𝐮𝖳𝐱+𝐮𝐮𝖳𝐱=𝐮(sgn(𝐮𝖳𝐱)𝐱)+𝐮𝟎=𝐱

por las propiedades del producto escalar de vectores paralelos y perpendiculares.

Esta fórmula se puede generalizar a proyecciones ortogonales en un subespacio de dimensión arbitraria. Sea 𝐮1,,𝐮k una base ortonormal del subespacio U, asumiendo que el número entero k1, y sea A la matriz n×k cuyas columnas son 𝐮1,,𝐮k, es decir, A=[𝐮1𝐮k]. Entonces, la proyección viene dada por:[7]

PA=AA𝖳

que se puede reescribir como

PA=i𝐮i,𝐮i.

La matriz A𝖳 es la isometria parcial que desaparece en el complemento ortogonal de U, y A es la isometría que embebe a U en el espacio vectorial subyacente. Por tanto, el rango de PA es el espacio final de A. También está claro que AA𝖳 es el operador de identidad en U.

También se puede eliminar la condición de ortonormalidad. Si 𝐮1,,𝐮k es una base (no necesariamente ortonormal) con k1, y A es la matriz con estos vectores como columnas, entonces la proyección es:[8][9]

PA=A(A𝖳A)1A𝖳.

La matriz A todavía incorpora U en el espacio vectorial subyacente pero ya no es una isometría en general. La matriz (A𝖳A)1 es un factor normalizador que recupera la norma. Por ejemplo, el operador 𝐮𝐮𝖳 de rango-1 no es una proyección si 𝐮1.. Después de dividir por 𝐮𝖳𝐮=𝐮2, se obtiene la proyección 𝐮(𝐮𝖳𝐮)1𝐮𝖳 sobre el subespacio abarcado por u.

En el caso general, se puede tener una matriz positiva definida arbitraria D que define un producto interno x,yD=yDx, y la proyección PA viene dada por PAx=argminyrange(A)xyD2. Entonces

PA=A(A𝖳DA)1A𝖳D.

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma: PA=AA+. Aquí A+ represnta la matriz pseudoinversa de Moore-Penrose. Esta es solo una de las muchas formas de construir el operador de proyección.

Si [AB] es una matriz no singular y A𝖳B=0 (es decir, B es la matriz núcleo de A),[10] se cumple lo siguiente:

I=[AB][AB]1[A𝖳B𝖳]1[A𝖳B𝖳]=[AB]([A𝖳B𝖳][AB])1[A𝖳B𝖳]=[AB][A𝖳AOOB𝖳B]1[A𝖳B𝖳]=A(A𝖳A)1A𝖳+B(B𝖳B)1B𝖳

Si la condición ortogonal se mejora a A𝖳WB=A𝖳W𝖳B=0 con W no singular, se cumple lo siguiente:

I=[AB][(A𝖳WA)1A𝖳(B𝖳WB)1B𝖳]W.

Todas estas fórmulas también son válidas para espacios con productos internos complejos, siempre que se utilice la matriz traspuesta conjugada en lugar de la traspuesta. Se pueden encontrar más detalles sobre las sumas de las proyecciones en Banerjee y Roy (2014).[8] Véase también Banerjee (2004)[11] para la aplicación de sumas de proyecciones en trigonometría esférica básica.

Proyecciones oblicuas

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (véase proyección oblicua), aunque no con tanta frecuencia como las proyecciones ortogonales. Mientras que calcular el valor ajustado de una regresión mínimos cuadrados ordinarios requiere una proyección ortogonal, calcular el valor ajustado de una regresión variable instrumental requiere una proyección oblicua.

Una proyección se define por su núcleo y los vectores base utilizados para caracterizar su rango (que es un complemento del núcleo). Cuando estos vectores base son ortogonales al núcleo, entonces la proyección es ortogonal. Cuando estos vectores base no son ortogonales al núcleo, la proyección es una proyección oblicua, o simplemente una proyección.

Fórmula de representación matricial para un operador de proyección distinto de cero

Sea P un operador lineal, P:VV, tal que P2=P y supóngase que P:VV no es el operador cero. Ahora, se considera que los vectores 𝐮1,,𝐮k forman una base para el rango de P, que se representan en la matriz A de orden n×k. Por lo tanto, el número entero k1; de lo contrario, k=0 y P es el operador cero. El rango y el núcleo son espacios complementarios, por lo que el núcleo tiene dimensión nk. De ello se deduce que el complemento ortogonal del núcleo tiene la dimensión k. Sea 𝐯1,,𝐯k una base para el complemento ortogonal del núcleo de la proyección, represéntesen estos vectores en la matriz B. Entonces, la proyección P (con la condición k1) viene dada por

P=A(B𝖳A)1B𝖳.

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente.[8][12] Una prueba estándar de esta expresión es la siguiente. Para cualquier vector 𝐱 en el espacio vectorial V, se puede descomponer 𝐱=𝐱1+𝐱2, donde el vector 𝐱1=P(𝐱) está en la imagen de P y el vector 𝐱2=𝐱P(𝐱). Entonces P(𝐱2)=P(𝐱)P2(𝐱)=𝟎, y entonces 𝐱2 está en el núcleo de P, que es el espacio nulo de A. En otras palabras, el vector 𝐱1 está en el espacio de columnas de A,, por lo que 𝐱1=A𝐰 para algún vector de dimensión k 𝐰 y el vector 𝐱2 satisface B𝖳𝐱2=𝟎 mediante la construcción de B. Uniendo estas condiciones se encuentra un vector 𝐰 tal que B𝖳(𝐱A𝐰)=𝟎. Dado que las matrices A y B tienen el rango completo k por su construcción, la matriz k×k B𝖳A es invertible. Entonces la ecuación B𝖳(𝐱A𝐰)=𝟎 da el vector 𝐰=(B𝖳A)1B𝖳𝐱.. De esta manera, P𝐱=𝐱1=A𝐰=A(B𝖳A)1B𝖳𝐱 para cualquier vector 𝐱V y por lo tanto P=A(B𝖳A)1B𝖳.

En el caso de que P sea una proyección ortogonal, se puede tomar A=B, y se deduce que P=A(A𝖳A)1A𝖳. Al utilizar esta fórmula, se puede comprobar fácilmente que P=P𝖳. En general, si el espacio vectorial está definido sobre el cuerpo de los números complejos, se usa la matriz traspuesta conjugada A*, y se obtiene la fórmula P=A(A*A)1A*. Recuérdese que se puede definir la matriz pseudoinversa de Moore-Penrose de la matriz A por A+=(A*A)1A*, ya que A tiene rango de columna completo, y por lo tanto P=AA+.

Valores singulares

Téngase en cuenta que IP también es una proyección oblicua. Los valores singulares de P e IP se pueden calcular mediante una base ortonormal de A.

Sea QA una base ortonormal de A y sea QA el complemento ortogonal de QA. Ahora, se denotan los valores singulares de la matriz QATA(BTA)1BTQA mediante los valores positivos γ1γ2γk. Con esto, los valores singulares para P son:[13]

σi={1+γi21ik0en caso contrario

y los valores singulares para IP son

σi={1+γi21ik1k+1ink0en caso contrario

Esto implica que los valores singulares más grandes de P e (IP) son iguales y, por lo tanto, que la norma matricial de las proyecciones oblicuas es la misma. Sin embargo, su número de condición satisface la relación κ(IP)=σ11σ1σk=κ(P) y, por lo tanto, no es necesariamente igual.

Determinar una proyección con un producto interno

Sea V un espacio vectorial (en este caso un plano) abarcado por vectores ortogonales 𝐮1,𝐮2,,𝐮p. Sea y un vector. Se puede definir una proyección de 𝐲 sobre V como

projV𝐲=𝐲𝐮i𝐮i𝐮i𝐮i

donde los índices repetidos se suman (de acuerdo con el convenio de suma de Einstein). El vector 𝐲 se puede escribir como una suma ortogonal tal que 𝐲=projV𝐲+𝐳. projV𝐲 a veces se denomina 𝐲^. Hay un teorema en álgebra lineal que establece que este 𝐳 es la distancia más pequeña (la distancia ortogonal) de 𝐲 a V y se usa comúnmente en áreas como el aprendizaje automático.

y proyectado en el espacio vectorial V

Formas canónicas

Cualquier proyección P=P2 sobre un espacio vectorial de dimensión d sobre un cuerpo es una matriz diagonalizable, ya que su polinomio mínimo divide a x2x, que se divide en distintos factores lineales. Por lo tanto, existe una base en la que P tiene la forma

P=Ir0dr

donde r es el rango de P. Aquí, Ir es la matriz identidad de tamaño r, 0dr es la matriz cero de tamaño dr y es el operador suma directa. Si el espacio vectorial es complejo y está equipado con un espacio prehilbertiano, entonces existe una base ortonormal en la que la matriz de P es[14]

P=[1σ100][1σk00]Im0s.

donde σ1σ2σk>0. Los números enteros k,s,m y los números reales σi están determinados de forma única. Téngase en cuenta que 2k+s+m=d. El factor Im0s corresponde al subespacio invariante máximo en el que P actúa como una proyección ortogonal (de modo que P es ortogonal si y solo si k=0) y los bloques σi corresponden a las componentes oblicuas.

Proyecciones sobre espacios vectoriales normados

Cuando el espacio vectorial subyacente X es un espacio vectorial normado (no necesariamente de dimensión finita), es necesario considerar cuestiones analíticas, irrelevantes en el caso de dimensión finita. Supóngase ahora que X es un espacio de Banach.

Muchos de los resultados algebraicos discutidos anteriormente se conservan en este nuevo contexto. Una descomposición de suma directa dada de X en subespacios complementarios todavía especifica una proyección, y viceversa. Si X es la suma directa X=UV, entonces el operador definido por P(u+v)=u sigue siendo una proyección con rango U y núcleo V. También está claro que P2=P. Por el contrario, si P es una proyección sobre X, es decir, P2=P, entonces se verifica fácilmente que (1P)2=(1P). En otras palabras, 1P también es una proyección. La relación P2=P implica que 1=P+(1P) y X es la suma directa rg(P)rg(1P).

Sin embargo, a diferencia del caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio U de X no está cerrado en la topología normal, entonces la proyección sobre U no es continua. En otras palabras, el rango de una proyección continua P debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) es cerrado. Así, una proyección continua P da una descomposición de X en dos subespacios cerrados complementarios: X=rg(P)ker(P)=ker(1P)ker(P).

Lo contrario también es válido, con un supuesto adicional. Supóngase que U es un subespacio cerrado de X. Si existe un subespacio cerrado V tal que Plantilla:Nowrap, entonces la proyección P con rango U y núcleo V es continua. Esto se desprende del teorema de la gráfica cerrada. Supóngase también que Plantilla:Nowrap y Plantilla:Nowrap. Es necesario demostrar que Px=y. Dado que U es cerrado y Plantilla:Nowrap, y se encuentra en U, es decir, Plantilla:Nowrap. Además, Plantilla:Nowrap. Debido a que V está cerrado y Plantilla:Nowrap, se tiene que xyV, es decir, P(xy)=PxPy=Pxy=0, lo que prueba la afirmación.

El argumento anterior hace uso del supuesto de que tanto U como V están cerrados. En general, dado un subespacio cerrado U, no es necesario que exista un subespacio cerrado complementario V, aunque para un espacio de Hilbert esto siempre se puede hacer tomando el complemento ortogonal. Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Esta es una consecuencia inmediata del teorema de Hahn–Banach. Sea U el tramo lineal de u. Por el mencionado teorema de Hahn-Banach, existe una funcional lineal φ acotada tal que Plantilla:Nowrap. El operador P(x)=φ(x)u satisface que P2=P, es decir, es una proyección. La acotación de φ implica continuidad de P y, por lo tanto, ker(P)=rg(IP) es un subespacio complementario cerrado de U.

Aplicaciones y consideraciones adicionales

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en la algoritmia para ciertos problemas de álgebra lineal:

Como se indicó anteriormente, las proyecciones son un caso especial de idempotencia. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características. La idempotencia se utiliza para clasificar, por ejemplo, álgebras semisimples, mientras que la teoría de medida comienza considerando las funciones características de los conjuntos mdibles. Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto del álgebra de operadores. En particular, un álgebra de von Neumann se genera por su retículo completo de proyecciones.

Generalizaciones

De manera más general, dada una aplicación entre espacios vectoriales normados T:VW,, se puede pedir de manera análoga que esta aplicación sea una isometría en el complemento ortogonal del núcleo: que (kerT)W sea una isometría (compárese con una isometría parcial); y en particular debe ser sobreyectiva. El caso de una proyección ortogonal es cuando W es un subespacio de V. En la geometría de Riemann, esto se utiliza en la definición de submersión riemanniana.

Véase también

Referencias

Plantilla:Listaref

Bibliografía

Enlaces externos

Plantilla:Control de autoridades

  1. "Basic methods of linear Functional Analysis" J.D. Pryce. Hutchinson University Library. Página 150
  2. 2,0 2,1 Meyer, pp 386+387
  3. "Basic methods of linear functional analysis" J.D. Pryce. Hutchinson University Library. Página 150.
  4. 4,0 4,1 Plantilla:Cite book
  5. Meyer, p. 433
  6. Meyer, p. 431
  7. Meyer, equation (5.13.4)
  8. 8,0 8,1 8,2 Plantilla:Citation
  9. Meyer, equation (5.13.3)
  10. Véase también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados.
  11. Plantilla:Citation
  12. Meyer, equation (7.10.39)
  13. Plantilla:Citation
  14. Plantilla:Cite journal