Norma macierzy - Matrix norm

W matematyce , A normą matryca jest norma wektorowa z przestrzeni wektorowej którego elementy (wektory) są macierzami (o podanych wymiarach).

Czynności wstępne

Biorąc pod uwagę pole z zarówno rzeczywistych lub liczb zespolonych , niech będzie K - przestrzeń liniowa macierzy z wierszy i kolumn oraz wpisy w tej dziedzinie . Norma macierzowa jest normą dotyczącą

W tym artykule zawsze będziemy pisać takie normy z podwójnymi pionowymi kreskami (tak jak: ). Zatem norma macierzowa jest funkcją, która musi spełniać następujące właściwości:

Dla wszystkich skalarów i macierzy ,
  • ( o wartości dodatniej )
  • ( określone )
  • ( absolutnie jednorodny )
  • ( subaddycja lub spełnienie nierówności trójkąta )

Jedyną cechą odróżniającą macierze od uporządkowanych wektorów jest mnożenie . Normy macierzowe są szczególnie przydatne, jeśli są również submultiplikatywne :

Każdą normę na K n × n można przeskalować tak, aby była submultiplikatywna; w niektórych książkach norma matrycy terminologii jest zarezerwowana dla norm submultiplikatywnych.

Normy macierzowe indukowane przez normy wektorowe

Załóżmy, że podano normę wektorową on . Dowolna macierz A indukuje operator liniowy od do w stosunku do bazy standardowej i definiuje się odpowiednią indukowaną normę lub normę operatora na przestrzeni wszystkich macierzy w następujący sposób:

W szczególności, jeśli p -normę dla wektorów ( 1 ≤ p ≤ ∞ ) stosuje się dla obu przestrzeni i , to odpowiednia indukowana norma operatora to:

Te indukowane normy różnią się od „wejściowych” norm p i norm p Schattena dla macierzy traktowanych poniżej, które są również zwykle oznaczane przez

Uwaga: Powyższy opis dotyczy indukowanej normy operatora, gdy ta sama norma wektora została użyta w „przestrzeni odlotu” i „przestrzeni przybycia” operatora . Nie jest to konieczne ograniczenie. Bardziej ogólnie, mając na uwadze normę na i normę na , można zdefiniować normę macierzową na indukowaną przez te normy:
Norma macierzowa jest czasami nazywana normą podrzędną. Normy podrzędne są zgodne z normami, które je indukują, dając

Każda indukowana norma operatora jest submultiplikatywną normą macierzy: wynika to z

oraz

Co więcej, każda indukowana norma zaspokaja nierówność

( 1 )

dla dodatnich liczb całkowitych r , gdzie ρ ( ) jest promień spektralny z A . Dla symetrycznego lub hermitowskiego A mamy równość w ( 1 ) dla 2-normy, ponieważ w tym przypadku 2-norma jest dokładnie promieniem widmowym A . W przypadku arbitralnej macierzy możemy nie mieć równości dla żadnej normy; kontrprzykładem byłoby:

który ma znikający promień widmowy. W każdym razie dla macierzy kwadratowych mamy wzór na promień widmowy :

Kompatybilne i spójne normy

Normę macierzową on nazywamy zgodną z normą wektorową on i normą wektorową on , jeżeli:

dla wszystkich . W szczególnym przypadku m = n i a = b , może być również nazwany zgodny z . Wszystkie indukowane normy są z definicji spójne. Ponadto każda submultiplikatywna norma macierzy on (uznawana za ) indukuje kompatybilną normę wektorową on przez zdefiniowanie .

Przypadki specjalne

W szczególnych przypadkach indukowanej macierzy normy można obliczyć lub oszacować przez

co jest po prostu maksymalną bezwzględną sumą kolumn macierzy;

co jest po prostu maksymalną bezwzględną sumą wierszy macierzy.

W szczególnym przypadku ( norma euklidesowa lub norma dla wektorów) indukowaną normą macierzy jest norma spektralna . Normą widmową macierzy jest największa wartość osobliwa z (tj. pierwiastek kwadratowy z największej wartości własnej macierzy , gdzie oznacza transpozycję sprzężoną z ):

gdzie reprezentuje największą wartość osobliwą macierzy . Także,

od i podobnie przez rozkład według wartości osobliwych (SVD). Jest jeszcze jedna ważna nierówność:

gdzie jest norma Frobeniusa . Równość obowiązuje wtedy i tylko wtedy, gdy macierz jest macierzą pierwszego rzędu lub macierzą zerową. Nierówność tę można wyprowadzić z faktu, że ślad macierzy jest równy sumie jej wartości własnych.

Kiedy mamy równoważną definicję dla as . Można wykazać, że jest równoważny powyższym definicjom, wykorzystując nierówność Cauchy'ego-Schwarza .

Na przykład dla

mamy to

„Entry-wise” macierzowe normy

Normy te traktują macierz jako wektor wielkości i wykorzystują jedną ze znanych norm wektorowych. Na przykład, używając normy p dla wektorów, p ≥ 1 , otrzymujemy:

Jest to inna norma od indukowanej p -normy (patrz wyżej) i p -normy Schattena (patrz poniżej), ale notacja jest taka sama.

Szczególnym przypadkiem p = 2 jest norma Frobeniusa, a p = ∞ daje normę maksymalną.

L 2,1 i L p,q normy

Niech będą kolumny macierzy . Normą jest sumą euklidesowych norm kolumn macierzy:

Normą jako funkcja błędu jest bardziej solidny, ponieważ błąd dla każdego punktu danych (kolumna) nie są obrobione. Jest używany do solidnej analizy danych i kodowania rzadkiego .

Dla p , q ≥ 1 , normę można uogólnić na normę w następujący sposób:

Norma Frobeniusa

Gdy p = q = 2 dla normy, nazywa się to normą Frobeniusa lub normą Hilberta-Schmidta , chociaż ten ostatni termin jest częściej używany w kontekście operatorów na (być może nieskończenie wymiarowej) przestrzeni Hilberta . Normę tę można definiować na różne sposoby:

gdzie są pojedyncze wartości z . Przypomnijmy, że funkcja trace zwraca sumę wpisów diagonalnych macierzy kwadratowej.

Norma Frobeniusa jest rozszerzeniem normy euklidesowej do i pochodzi z iloczynu skalarnego Frobeniusa na przestrzeni wszystkich macierzy.

Norma Frobeniusa jest submultiplikatywna i jest bardzo użyteczna w numerycznej algebrze liniowej . Submultiplikatywność normy Frobeniusa można udowodnić za pomocą nierówności Cauchy'ego-Schwarza .

Norma Frobeniusa jest często łatwiejsza do obliczenia niż normy indukowane i ma przydatną właściwość bycia niezmienną przy obrotach (i ogólnie operacjach unitarnych ). Oznacza to, że dla dowolnej macierzy unitarnej . Własność ta wynika z cyklicznego charakteru śladu ( ):

i analogicznie:

gdzie użyliśmy unitarnego charakteru (czyli ).

Spełnia również

oraz

gdzie jest produkt wewnętrzny Frobeniusa .

Maksymalna norma

Maksymalna norma jest normą elementwise z p = q = ∞:

Ta norma nie jest submultiplikatywna .

Zauważ, że w niektórych publikacjach (takich jak Złożoność komunikacji ) alternatywna definicja max-normy, zwana także -normą, odnosi się do normy faktoryzacji:

Normy Schattena

P -normy Schattena powstają przy zastosowaniu p -normy do wektora wartości osobliwych macierzy. Jeżeli wartości osobliwe macierzy są oznaczone przez σ i , to norma p Schattena jest zdefiniowana przez

Normy te ponownie dzielą notację z indukowanymi i wejściowymi normami p , ale są one różne.

Wszystkie normy Schatten są submultiplikatywne. Są również unitarnie niezmiennikami, co oznacza, że dla wszystkich macierzy i wszystkich macierzy unitarnych i .

Najbardziej znane przypadki to p = 1, 2, ∞. Przypadek p = 2 daje wprowadzoną wcześniej normę Frobeniusa. Przypadek p = ∞ daje normę widmową, która jest normą operatora indukowaną przez wektor 2-norm (patrz wyżej). Wreszcie, p = 1 daje normę jądrową (znaną również jako norma śladowa lub norma Ky Fan 'n'), zdefiniowaną jako

gdzie oznacza dodatnią półokreśloną macierz taką, że . Dokładniej, ponieważ jest dodatnią półokreśloną macierzą , jej pierwiastek kwadratowy jest dobrze zdefiniowany. Norma jądrowa jest wypukłą obwiednią funkcji rang , dlatego jest często wykorzystywana w optymalizacji matematycznej do wyszukiwania macierzy niskich rang.

Normy monotonne

Norma macierzowa nazywana jest monotoniczną, jeśli jest monotoniczna względem rzędu Loewnera . Zatem norma macierzowa rośnie, jeśli

Norma Frobeniusa i norma spektralna są przykładami norm monotonicznych.

Normy cięcia

Innym źródłem inspiracji norm matrycy, jeżeli uzna się matrycę jako matrycy przylegania z ważonego , skierowanej wykresie . Tak zwana „norma cięcia” mierzy, jak blisko powiązany wykres jest dwuczęściowy :

gdzie K m x n . Równoważne definicje (do stałego współczynnika) nakładają warunki 2| S |> n & 2| T |> m , S = T lub ST =∅ .

Norma odcięcia jest równoważna indukowanej normie operatora ‖·‖ ∞→1 , która sama jest równoważna innej normie, zwanej normą Grothendiecka .

Aby zdefiniować normę Grothendiecka, najpierw zauważ, że operator liniowy K 1K 1 jest po prostu skalarem, a zatem rozciąga się na operator liniowy na dowolnym K kK k . Ponadto, mając dowolny wybór bazy dla K n i K m , każdy operator liniowy K nK m rozszerza się na operator liniowy ( K k ) n → ( K k ) m , pozwalając każdemu elementowi macierzy na elementach K k przez mnożenie przez skalar. Norma Grothendiecka jest normą tego rozszerzonego operatora; w symbolach:

Norma Grothendiecka zależy od wyboru podstawy (zazwyczaj uważanej za podstawę standardową ) i k .

Równoważność norm

Dla dowolnych dwóch norm macierzowych i , mamy to:

dla niektórych liczb dodatnich r i s , dla wszystkich macierzy . Innymi słowy, wszystkie normy dotyczące są równoważne ; wywołują tę samą topologię na . Dzieje się tak, ponieważ przestrzeń wektorowa ma wymiar skończony .

Co więcej, dla każdej normy wektorowej na , istnieje unikalna dodatnia liczba rzeczywista, taka jak norma macierzy submultiplikatywnej dla każdego .

O normie macierzy submultiplikatywnej mówi się, że jest minimalna , jeśli nie istnieje żadna inna norma macierzy submultiplikatywnej spełniająca wymagania .

Przykłady równoważności norm

Niech znowu odnosi się do norm indukowaną przez wektor p -norm (jak powyżej w punkcie indukowanej Norm).

Dla macierzy o randze , posiadać następujące nierówności:

Inną użyteczną nierównością między normami macierzowymi jest:

co jest szczególnym przypadkiem nierówności Höldera .

Zobacz też

Uwagi

Bibliografia

Bibliografia

  • James W. Demmel , Applied Numerical Linear Algebra, rozdział 1.7, opublikowana przez SIAM, 1997.
  • Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, opublikowana przez SIAM, 2000. [1]
  • John Watrous , Teoria informacji kwantowej, 2.3 Normy operatorów , notatki z wykładów, University of Waterloo, 2011.
  • Kendall Atkinson , Wprowadzenie do analizy numerycznej, opublikowane przez John Wiley & Sons, Inc 1989