Fórmula de proyección de un vector
Introducción
Ya nos hemos familiarizado con proyectar vectores sobre vectores, lo que se conoce como la fórmula de proyección. En esta nota de la conferencia, no solo cubriremos el teorema de proyección más general, sino también el interesante problema de proyectar un vector en un subespacio de , utilizado para Gram-Schmidt. Esta es una generalización de la proyección sobre un solo vector, ya que el vector individual genera una línea en , que de hecho es un subespacio de .
Fórmula de proyección para un vector
Entonces, conocemos la fórmula de proyección para un vector sobre una línea que está generada por el vector como:
donde el numerador es equivalente al producto escalar utilizado cuando la fórmula se introdujo originalmente.
Un vector siempre tiene dimensiones mientras que su transpuesta tiene sus dimensiones opuestas, es decir, .
La fórmula de proyección se puede reducir si el vector ya está normalizado, porque el denominador se convierte en 1 ya que :
Hacer la conexión de las proyecciones con la transformación lineal plantea la pregunta, ¿cuál es la matriz de transformación para proyectar un vector sobre una línea generada por ? La derivación se puede generalizar para el vector no normalizado, pero procederemos con el caso especial con normalizado y luego afirmamos el caso general como un teorema. ¡Recuerde mantener intacto el requisito de dimensión para la multiplicación de vectores y matrices! Tenemos que:
donde resulta en una matriz , que es nuestra matriz de transformación de la aplicación lineal para proyectar sobre con norma igual a 1. Tenemos el caso general como el siguiente teorema:
Sea un vector no nulo en expresado en forma de columna, lo que significa que tiene las dimensiones . Entonces tenemos la matriz de transformación para la aplicación lineal de proyectar un vector sobre como:
de modo que:
La matriz es simétrica y tiene rango 1.
Los vectores columna de una matriz de transformación para una aplicación lineal son las imágenes de los vectores de la base estándar bajo :
Apoyados por la fórmula de proyección, y el hecho de que el vector de la base estándar solo tiene el componente k como no cero (que es 1), tenemos que la k-ésima columna de nuestra matriz de transformación será:
Aplicando esta información útil, tenemos la derivación para :
Fórmula de proyección para un subespacio
Después de un resumen riguroso y la derivación de la fórmula de proyección en un vector , ahora hacemos las cosas breves para la fórmula de proyección en un subespacio. El problema que enfrentamos es cómo proyectar el vector en un subespacio de ? Estamos interesados en:
Este es el caso general de proyección de en un vector , que es el caso especial de proyección para un subespacio, cuando el subespacio es una línea generada por el vector . Hay dos maneras de resolver esta pregunta, una es determinar una base para y la otra es determinar una base ortonormal para . Este último es solo un caso especial del primero, pero reduce considerablemente el problema. Comenzamos introduciendo el teorema para el caso general, donde no tenemos más requisitos para la base de .
Sea un subespacio de generado por la base
Entonces tenemos la matriz de transformación para la proyección de un vector en el subespacio definida como:
donde es la matriz con columnas que consisten en los vectores base de :
Por lo tanto, tenemos que:
Para el caso especial de cuando forma una base ortonormal, tenemos que es una matriz ortonormal (simplemente llamada ortogonal en la mayoría de la literatura) y que:
Este resultado reduce la matriz de transformación en el teorema anterior a:
Si observamos más detenidamente , podemos extender la expresión a algo que da un significado intuitivo:
De la última línea recordamos la matriz de transformación para proyectar en un vector normalizado , lo que lleva al significado intuitivo de reescribir la proyección en el subespacio a:
Entonces, si es una base ortonormal para el subespacio , podemos proyectar un vector en ya sea produciendo la matriz de transformación con vectores de columna de la base o produciendo la combinación lineal de proyecciones en cada vector base .
Teorema de proyección para subespacios
Antes de adentrarnos en el teorema de proyección, comencemos con un calentamiento. Supongamos que tenemos un vector y una línea generada por el vector . Esto significa que podemos expresar de manera única por el vector de proyección en y su complemento ortogonal , que es un vector ortogonal a la línea .
Tenemos que:
Este ejemplo es intuitivo, pero ¿qué sucede cuando en lugar de trabajar con una línea en consideramos el subespacio en con dimensión ? Resulta que la relación para este caso especial se mantiene para dimensiones superiores. Tenemos el siguiente teorema conocido como el teorema de proyección para subespacios:
El teorema de proyección para subespacios
Sea un subespacio de . Entonces tenemos que cada vector se puede expresar de manera única como:
donde y , llamado el complemento ortogonal a .
Reconocemos y podemos usar la fórmula de proyección para un subespacio para calcular . El vector se sigue simplemente restando con , como sugiere el teorema.