Kvadratisk form

Ekvationer av formen $$a_1x_1^2 + a_2x_2^2 + ... + a_nx_n^2$$ + alla möjliga korstermer $a_kx_ix_j$ med distinkta $x_ix_j$ kallas kvadratiska former och kan uttryckas med en unik matris $A$ $$x^TAx$$ och dess geometriska form kan bestämmas genom att studera egenvärdena för matrisen $A$.

Innehållsförteckning

    Intro

    Kvadratiska former används i stödvektormaskiner, en klass av metoder inom maskininlärning som används för att skilja en kategori av data från en annan.

    De har gett upphov till ett helt programmeringsfält: kvadratisk programmering. Dessa metoder har använts för att klassificera cancertyper och proteiner.

    Så även om kvadratiska former kan verka ganska slumpmässiga, har de många verkliga tillämpningar!

    Koncept

    När den introduceras till funktioner i en variabel är utgångspunkten ekvationen för en linje:

    där parametrarna och bestämmer lutningen, respektive avskärningen till -axeln.

    Inte förrän begreppen linjära ekvationer har förståtts ordentligt är en elev redo att gå vidare till nästa steg, andragradsekvationen:

    Det faktum att en term innehåller den oberoende variabeln upphöjd till andra potens leder till en funktion vars beteende är lite mer komplext.

    Detsamma gäller när vi går från linjära system till sådana av kvadratisk form , där komponenter i vektorer tillåts multipliceras med sig själva eller andra komponenter i vektorn.

    Summering

    Den allmänna kvadratisk form i innehåller alla möjliga termer multiplicerat med någon faktor, där . Till exempel, i är den allmänna kvadratisk form :

    där vi har kombinerat de två termerna under samma faktor .

    Vi kan sedan uttrycka den kvadratiska formen som en multiplikation med en symmetrisk matris :

    Vi säger att en funktion av denna typ, i valfri dimension , är den kvadratiska formen associerad med , betecknad med , där:

    Kvadratiska formen

    Introduktion

    En kurs i linjär algebra utmattar mer eller mindre följande uttryck

    i studiet av linjära ekvationer och linjära system. Vi har bara övervägt variabler i första potens, vilket betyder att vi inte har några variabler som drivs av två eller högre. I motsats till linjära former, överväger vi nu kvadratiska former:

    där är alla möjliga korsprodukttermer där och är distinkta. Betrakta följande exempel för respektive för ett förtydligande av produkttermerna:

    En allmän kvadratisk form för ser ut som:

    medan kvadratiska formen för ser ut som

    Båda exemplen kan skrivas om till matrisform:

    Observera att matriserna som används ovan är symmetriska, med deras diagonala element som motsvarar koefficienterna för de kvadratiska termerna. Vi kallar funktionen

    den kvadratiska formen för , som också kan uttryckas med hjälp av en skalärprodukt:

    Tre problem

    På tal om kvadratiska former, det finns tre stora problem, eller frågor, som man snubblar över om dem. När vi studerar den kvadratiska funktionen

    beaktar vi följande tre frågeställningar:

    1. Antar endast positiva värden, endast negativa värden, eller båda? givet att

    2. Vilken typ av kurva, eller yta, är det? givet att är definierat för , eller för

    3. Vilka är maximum- och minimum-värden för i ? givet att är begränsad för att uppfylla att

    De två första frågorna behandlas här, medan den tredje anses vara en del av den matematiska grenen Optimeringsteori, och behandlas därför inte i detta avsnitt. Vi börjar med att dela ett praktiskt förhållningssätt till fråga nummer ett, följt av att introducera namnen på ytorna och koppla dem till egenskaperna hos matrisen .

    Satsen om huvudaxelform

    Huvudaxelform kommer att användas för att besvara följande problem relaterade till kvadratiska funktioner:

    Antar den kvadratiska formen endast positiva värden, endast negativa värden, eller båda?

    Frågeställningen är inte uppenbar att besvara när man hanterar kvadratiska funktioner på grund av dess korstermer. Den är därför mycket mer lättbesvarad när det inte finns några korstermer att beakta. Låt oss börja enkelt!

    Introduktion utan korstermer

    Först återbesöker vi kvadratiska formen för utan några korstermer:

    Notera att vi döper matrisen för denna kvadratiska form till , eftersom att matrisen är diagonal när korstermer saknas. Som följande:

    Eftersom att alla variabler kvadreras, och gör därmed eventuellt negativa komponenter i till positiva, så bestäms tecknet för av koefficienternas tecken. Vi har följande tre fall för summan :

    • antar endast positiva värden om, och endast om, alla koefficienterna är positiva.

    • antar endast negativa värden om, och endast om, alla koefficienterna är negativa.

    • antar både positiva och negativa värden om, och endast om, koefficienterna antar både positiva och negativa värden.

    Detta är väl bra, men när man betraktar den allmänna kvadratiska formen för ,

    så stöter vi på korstermer, och de gör det komplicerat att avgöra vilka värden antar. Men tänk om vi kunde överföra till utan korstermer? skulle inte det vara trevligt? Nyckeln är att matrisen är symmetrisk, vilket betyder att är ortogonalt diagonaliserbar. Kanske tänder detta en gnista?

    Att bli av med korstermerna

    Först en sammanfattning!

    Kom ihåg att alla symmetriska matriser är ortogonalt diagonaliserbara. Det följer att det finns en ortogonal matris av egenvektorer, och en diagonal matris av egenvärden, så vi kan skriva om till:

    där eftersom att är en ortogonal matris.

    Nu är vårt tillvägagångssätt att härleda vilka värden antar genom följande tankesätt för att bli av med korstermer:

    1. Gör ett variabelbyte så att

    2. vi kan utnyttja ortogonala diagonaliseringen

    3. för att bli av med korstermerna.

    Enkelt nog va? Låt oss göra just det! Vi har att:

    1. Låt oss göra ett variabelbyte där är en ortogonalmatris med egenvektorerna till

    2. och vi har nu blivit av med korstermerna till

    Vi kan nu enkelt avgöra vilka värden antar via inspektion av (utan korstermer) och applicera våra tidigare tre fall för summan av . Detta resultat utgörs av följande sats:

    Huvudaxelform

    Låt

    vara en kvadratisk funktion, där är en symmetrisk matris. Då finns ett variabelbyte

    som transformerar till en kvadratisk funktion som saknar korstermer. är en ortogonalmatris som ortgoonalt diagonaliserar . Utföring av variabelbytet resulterar i kvadratiska formen

    där är egenvärden till och motsvarar samma successiva ordning som kolonnerna till , vilka är egenvektorerna till .

    Definit matris

    På tal om en kvadratisk funktion, frågas man om den endast antar positiva värden, endast negativa värden eller båda. För att bestämma fallet för en specifik kvadratisk funktion blir vi av med korstermerna genom att tillämpa satsen för huvudaxelform för att omvandla den till den kvadratiska funktionen . Sedan härleder vi enkelt det aktuella fallet för den givna genom inspektion av . Varje fall är naturligt förknippat med ett namn, och namnen är positiv definit, negativ definit respektive indefinit.

    Låt vara en kvadratisk funktion och vi transformerar den till

    där egenvärdena till matris berättar vilka värden antar. Vi har att:

    • endast antar positiva värden om, och endast om, alla egenvärden är positiva.

    • endast antar negativa värden om, och endast om, alla egenvärden är negativa.

    • antar både positiva och negativa värden om, och endast om, egenvärdena antar både positiva och negativa värden.

    Observera att vi i ovanstående tre fall referear till koefficienterna som egenvärden till , eftersom det är vad satsen om huvudaxelform ger oss. Nu till vad vi kallar funktionen (och dess motsvarande matris , för den delen) för vart och ett av fallen:

    • och sägs vara positiv definit om alla egenvärden till är positiva.

    • och sägs vara negativ definit om alla egenvärden till är negativa.

    • och sägs vara indefinit om egenvärden till antar både positiva och negativa värden.

    Dock krävs ytterligare två fall, positiv semidefinit och negativ semidefinit, för att slutföra alla möjliga utfall, vilket leder till totalt fem fall. Vi sammanfattar alla fem här, med motsvarande krav på egenvärdena för .

    • för sägs vara positiv definit och händer endast när alla egenvärden är positiva, i.e. .

    • för sägs vara positiv semidefinit och händer endast när alla egenvärden är icke-negativa, i.e.

    • för sägs vara negativ definit och händer endast när alla egenvärden är negativa, i.e.

    • för sägs vara negativ semidefinit och händer endast när alla egenvärden är icke-positiva, i.e.

    • som antar både positiva och negativa värden sägs vara indefinit och händer endast när egenvärden antar både positiva och negativa värden.

    Ytor och kurvor

    Den andra frågan som man kommer att tänka på när man talar om kvadratiska funktioner är grafisk och därför kopplad till fallet eller . Frågan är:

    Vilken typ av kurva, eller yta, har vi att göra med?

    För att svara på frågan måste vi introducera begreppet kägelsnitt. Kägelsnitt är resultatet av att skära en dubbelkon med ett plan. De viktigaste kägelsnitten är illustrerade nedan: cirkel (vänstra översta), ellips (högra översta), parabel (vänstra nedersta) och hyperbel (högra nedersta).

    Vi diskuterar inte den analytiska geometrin här, utan ger ett smakprov på hur den kvadratiska formen är relaterad till kägelsnitt.

    Så låt oss säga att vi har en andragradsekvation i att lösa, som i

    där är en konstant. Om ekvationen är för ett kägelsnitt, och om , så kan vi enkelt dividera bägge led med för att uppnå

    där

    Genom att rotera koordinataxlarna för att eliminera möjliga korstermer (enligt satsen om huvudaxelform) har vi reducerat den ursprungliga ekvationen till

    där och är egenvärden till matrisen , och de bestämmer vilket typ av kägelsnitt som representeras av denna ekvation i följande tre fall om är en matris:

    • representerar en ellips om, och endast om, båda egenvärden är positiva, alltså om är positiv definit

    • har ingen graf om, och endast om, båda egenvärden är negativa, alltså om är negativ definit

    • representerar en hyperbel om, och endast om, båda egenvärden är positiva och negativa, alltså om är indefinit.

    I fallet med ellipsen kan ekvationen ovan skrivas om som

    vilket kan bli igenkänt av läsaren som en ellips med respektive axellängder:

    Specialfallet för en cirkel sker när:

    Innehållsförteckning
      Gillar du det vi gör? Hjälp oss och dela detta avsnitt.

      Bra översikt för linjär algebra och kort att-göra-lista

      Vi jobbar hårt för ge dig kunskap kort, koncist och pedagogiskt. Tvärtom till vad amerikanska böcker gör.

      Få uppgifter till gamla tentor för linjär algebra indelade i kapitel

      Trixet är att både lära sig teorin och öva på extentor. Vi har kategoriserat dem som gör det extra enkelt.

      Apple logo
      Google logo
      © 2024 Elevri. All rights reserved.