Forma cuadrática
Introducción
Un curso de álgebra lineal más o menos agota las siguientes expresiones
en el estudio de ecuaciones lineales y sistemas lineales. Solo hemos considerado variables a su primera potencia, lo que significa que no tenemos ninguna variable elevada a dos o más. A diferencia de las formas lineales, ahora estamos considerando formas cuadráticas;
donde son todos los posibles términos de producto cruzado en los que y son distintos. Considere los siguientes ejemplos para y respectivamente para una aclaración de los términos de producto cruzado;
Una forma cuadrática general en se ve así
mientras que la forma cuadrática en se ve así
Ambos ejemplos pueden reescribirse en forma de matriz como;
Observe que las matrices utilizadas arriba son simétricas, con sus elementos diagonales correspondientes a los coeficientes de los términos cuadrados. Llamamos a la función
la forma cuadrática asociada con , que también puede expresarse en notación de producto escalar como;
Tres problemas
Hablando de formas cuadráticas, hay tres problemas importantes, o preguntas, que uno encuentra sobre ellas. Cuando estudiamos la función cuadrática
consideramos las siguientes tres preguntas;
¿Asume solo valores positivos, solo negativos, o ambos? dado que
¿Qué tipo de curva o superficie estamos tratando? dado que está definida en , o en
¿Cuáles son los valores máximos y mínimos para en ? dado que está restringido a satisfacer
La primera y segunda pregunta se abordan aquí, mientras que la tercera se considera parte de la rama matemática de la Teoría de la Optimización, y por lo tanto no se trata en esta sección. Comenzamos compartiendo un enfoque práctico para la pregunta número uno, seguido de introducir los nombres de las superficies y vincularlas a las propiedades de la matriz .
Teorema de los ejes principales
El teorema de los ejes principales se utiliza para responder al siguiente problema que está conectado con las funciones cuadráticas;
¿Asume la forma cuadrática solo valores positivos, solo negativos, o ambos?
La pregunta es difícil de digerir cuando se trata de una función cuadrática debido a sus términos de producto cruzado. Por lo tanto, es mucho más fácil de responder cuando no hay términos de producto cruzado que considerar. ¡Empezamos simple!
Introducción sin términos de producto cruzado
Primero, revisemos la forma cuadrática en sin ningún término de producto cruzado;
Tenga en cuenta que nombramos la matriz para esta forma cuadrática , ya que la matriz es diagonal siempre que no haya términos de producto cruzado. Así;
Dado que todas las variables están al cuadrado, convirtiendo todos los componentes negativos de en positivos, el signo de está determinado por el signo de los coeficientes. Tenemos los siguientes tres casos para la suma ;
solo asume valores positivos si, y solo si, todos los coeficientes son positivos.
solo asume valores negativos si, y solo si, todos los coeficientes son negativos.
asume valores positivos y negativos si, y solo si, los coeficientes asumen valores positivos y negativos.
Esto está bien, pero cuando consideramos la forma cuadrática general en ,
nos encontramos con términos de producto cruzado, y hacen que sea complicado deducir qué valores asume . Sin embargo, ¿y si pudiéramos transformar en sin términos de producto cruzado? ¿no sería genial? La clave es que la matriz es simétrica, lo que significa que es diagonalizable ortogonalmente. ¿Quizás esto encienda una chispa?
Deshaciéndonos de los términos de producto cruzado
Primero, ¡un repaso!
Recuerde que todas las matrices simétricas son diagonalizables ortogonalmente. Se deduce que existe una matriz ortogonal de vectores propios y una matriz diagonal de valores propios, por lo que podemos reescribir como;
donde ya que es una matriz ortogonal.
Ahora, nuestro enfoque es deducir qué valores asume mediante la siguiente línea de pensamiento para deshacernos de los términos de producto cruzado;
Hacer un cambio de variables para que
podamos utilizar la diagonalización ortogonal
para deshacernos de los términos de producto cruzado.
¡Bastante fácil, verdad? ¡hagámoslo! Tenemos;
Hagamos un cambio de variables donde es una matriz ortogonal con vectores propios de
y ahora nos hemos deshecho de los términos de producto cruzado de
Ahora podemos deducir fácilmente los valores de inspeccionando (sin términos de producto cruzado) y aplicando nuestros tres casos mencionados anteriormente para la suma de . Este resultado constituye el siguiente teorema;
Teorema de los ejes principales
Sea
una función cuadrática, donde es una matriz simétrica . Entonces existe un cambio de variable
que transforma en la función cuadrática que no tiene términos de producto cruzado. es una matriz ortogonal que diagonaliza ortogonalmente . Hacer la sustitución de variable de da como resultado la forma cuadrática
donde son valores propios de correspondientes al mismo orden sucesivo de las columnas de , que son los vectores propios de .
Matriz definida positiva
Hablando de funciones cuadráticas, se pregunta si solo asumen valores positivos, solo negativos o ambos. Para determinar el caso de una función cuadrática específica , nos deshacemos de los términos de producto vectorial aplicando el teorema de los ejes principales para transformarla en la función cuadrática . Luego deducimos fácilmente el caso actual para la dada inspeccionando . Cada caso está naturalmente asociado con un nombre, y los nombres son definida positiva, definida negativa e indefinida respectivamente.
Supongamos que es una función cuadrática y la transformamos en
donde los valores propios de la matriz nos dicen qué valores asume . Tenemos que;
solo asume valores positivos si, y solo si, todos los valores propios son positivos.
solo asume valores negativos si, y solo si todos los valores propios son negativos.
asume valores positivos y negativos si, solo si los valores propios asumen valores positivos y negativos.
Note que en los tres casos anteriores nos referimos a los coeficientes como valores propios de , ya que eso es lo que nos proporciona el teorema de los ejes principales. Ahora, cómo llamamos a la función (y a su correspondiente matriz , para el caso) para cada uno de los casos;
Se dice que y son definidas positivas si todos los valores propios de son positivos.
Se dice que y son definidas negativas si todos los valores propios de son negativos.
Se dice que y son indefinidas si los valores propios de asumen valores positivos y negativos.
Sin embargo, se requieren dos casos más, semidefinida positiva y semidefinida negativa, para completar todos los resultados posibles, lo que lleva a un total de cinco casos. Resumimos los cinco aquí, con los requisitos correspondientes en los valores propios de .
Se dice que para es definida positiva y solo ocurre cuando todos los valores propios son positivos, es decir, .
Se dice que para es semidefinida positiva y solo ocurre cuando todos los valores propios son no negativos, es decir,
Se dice que para es definida negativa y solo ocurre cuando todos los valores propios son negativos, es decir,
Se dice que para es semidefinida negativa y solo ocurre cuando todos los valores propios son no positivos, es decir,
Se dice que que asume valores positivos y negativos es indefinida y solo ocurre cuando los valores propios asumen valores positivos y negativos.
Superficies y curvas
La segunda pregunta que surge al hablar de funciones cuadráticas es gráfica y por lo tanto está conectada al caso de o . La pregunta es
¿Con qué tipo de curva o superficie estamos tratando?
Para responder a la pregunta, necesitamos introducir el concepto de sección cónica, a veces simplemente llamada cónica. La sección cónica es el resultado de cortar un cono de doble vertiente con un plano. Las secciones cónicas más importantes se ilustran a continuación: círculo (arriba a la izquierda), elipse (arriba a la derecha), parábola (abajo a la izquierda) e hipérbola (abajo a la derecha).
No estamos discutiendo la geometría analítica aquí, sino dando una idea de cómo la forma cuadrática está relacionada con las secciones cónicas.
Entonces, supongamos que tenemos una ecuación cuadrática en para resolver, como en
donde es una constante. Si la ecuación es la ecuación de una cónica, y si , podemos dividir fácilmente ambos lados por para lograr
donde
Al rotar los ejes de coordenadas para eliminar los posibles términos de producto cruzado (según el teorema de los ejes principales), hemos reducido la ecuación original a
donde y son valores propios de la matriz , y ellos determinan qué tipo de cónica representa esta ecuación mediante los siguientes tres casos si es una matriz de ;
representa una elipse si, y solo si, ambos valores propios son positivos, es decir, es definida positiva
no tiene gráfico si, y solo si, ambos valores propios son negativos, es decir, es definida negativa
representa una hipérbola si, y solo si, los valores propios son tanto positivos como negativos, es decir, es indefinida.
En el caso del elipse, la ecuación anterior se puede reescribir como
la cual talvez reconoces como un elipse con logitud de ejes
respectivamente. El caso especial del círculo ocurre cuando
.