Gradient — Gradient

Gradient, reprezentowany przez niebieskie strzałki, oznacza kierunek największej zmiany funkcji skalarnej. Wartości funkcji są reprezentowane w skali szarości i rosną od białego (niski) do ciemnego (wysoki).

W wektorze rachunku The gradientu z skalarnej wartościach funkcji różniczkowalną f od wielu zmiennych jest pole wektorowe (lub funkcja wektorowa ) , którego wartość w punkcie, jest wektor , których składniki są pochodnymi cząstkowymi z co . Czyli dla , jego gradient jest zdefiniowany w punkcie w przestrzeni n- wymiarowej jako wektor:

Symbolu nabla , zapisanych w postaci trójkąta odwróconej i nazywana „del” oznacza operator różnicowy wektor .

Wektor gradientu można interpretować jako „kierunek i tempo najszybszego wzrostu”. Jeżeli gradient funkcji jest niezerowy w punkcie p , kierunek gradientu jest kierunkiem, w którym funkcja rośnie najszybciej od p , a wielkość gradientu to tempo wzrostu w tym kierunku, największe bezwzględna pochodna kierunkowa. Ponadto gradient jest wektorem zerowym w punkcie wtedy i tylko wtedy, gdy jest to punkt stacjonarny (gdzie znika pochodna). Gradient odgrywa zatem fundamentalną rolę w teorii optymalizacji , gdzie jest używany do maksymalizacji funkcji przez wznoszenie gradientu .

Gradient jest podwójny do całkowitej pochodnej : wartość gradientu w punkcie jest wektorem stycznym – wektorem w każdym punkcie; natomiast wartością pochodnej w punkcie jest wektor co tangens – funkcja liniowa na wektorach. Są one związane z tym, że punkt produkt z gradientem F w punkcie P z innym styczna wektora V równa się kierunkowe pochodną o f w p funkcji wzdłuż v ; czyli . Gradient dopuszcza wiele uogólnień do bardziej ogólnych funkcji na rozmaitościach ; patrz § Uogólnienia .

Motywacja

Gradient funkcji 2D f ( x , y ) = xe −( x 2 + y 2 ) jest wykreślony jako niebieskie strzałki nad pseudokolorowym wykresem funkcji.

Rozważmy pomieszczenia, w którym temperatura jest podana przez skalarne dziedzinie , T , aby w każdym punkcie ( x , y , oo ) temperatura T ( x , y , z ) , niezależnie od czasu. W każdym punkcie pomieszczenia gradient T w tym punkcie pokaże kierunek, w którym temperatura rośnie najszybciej, oddalając się od ( x , y , z ) . Wielkość gradientu określi, jak szybko temperatura wzrasta w tym kierunku.

Rozważmy powierzchnię, której wysokość nad poziomem morza w punkcie ( x , y ) wynosi H ( x , y ) . Gradient H w punkcie jest wektorem płaskim wskazującym w kierunku najbardziej stromego nachylenia lub nachylenia w tym punkcie. Nachylenie zbocza w tym punkcie jest określone przez wielkość wektora gradientu.

Gradientu można również użyć do pomiaru zmian pola skalarnego w innych kierunkach, a nie tylko w kierunku największej zmiany, przyjmując iloczyn skalarny . Załóżmy, że najbardziej strome nachylenie na wzgórzu wynosi 40%. Droga prowadząca bezpośrednio pod górę ma nachylenie 40%, ale droga okrążająca wzgórze pod kątem będzie miała nachylenie płytsze. Na przykład, jeśli droga jest pod kątem 60° od kierunku pod górę (gdy oba kierunki są rzutowane na płaszczyznę poziomą), wówczas nachylenie wzdłuż drogi będzie iloczynem skalarnym między wektorem gradientu a wektorem jednostkowym wzdłuż drogi , czyli 40% razy cosinus 60°, czyli 20%.

Mówiąc ogólnie, jeśli funkcja wysokość wzgórza H jest różniczkowalną , następnie gradient H przerywana z wektor jednostkowy daje nachylenie Hill w kierunku wektorze kierunkowego pochodnej o H wzdłuż wektora jednostkowego.

Notacja

Gradient funkcji w punkcie jest zwykle zapisywany jako . Może być również oznaczony dowolnym z poniższych:

  •  : aby podkreślić wektorowy charakter wyniku.
  • grad f
  • oraz  : notacja Einsteina .

Definicja

Gradient funkcji f ( x , y ) = −(cos 2 x + cos 2 y ) 2 przedstawiony jako rzutowane pole wektorowe na dolną płaszczyznę.

Gradient (lub gradientowe pole wektorowe) funkcji skalarnej f ( x 1 , x 2 , x 3 , …, x n ) jest oznaczony f lub f gdzie ( nabla ) oznacza wektorowy operator różniczkowy , del . Notacja grad f jest również powszechnie używana do reprezentowania gradientu. Gradient f jest zdefiniowany jako unikalne pole wektorowe, którego iloczyn skalarny z dowolnym wektorem v w każdym punkcie x jest pochodną kierunkową f wzdłuż v . To jest,

Formalnie gradient jest podwójny do pochodnej; zobacz związek z pochodną .

Gdy funkcja zależy również od parametru, takiego jak czas, gradient często odnosi się po prostu do wektora jej pochodnych przestrzennych (patrz Gradient przestrzenny ).

Wielkość i kierunek wektora gradientu są niezależne od reprezentacji poszczególnych współrzędnych .

współrzędne kartezjańskie

W trójwymiarowym kartezjańskim układzie współrzędnych z metryką euklidesową gradient, jeśli istnieje, jest określony wzorem:

gdzie i , j , kstandardowymi wektorami jednostkowymi w kierunkach odpowiednio x , y i z . Na przykład gradient funkcji

jest

W niektórych zastosowaniach zwyczajowo przedstawia się gradient jako wektor wierszowy lub wektor kolumnowy jego składowych w prostokątnym układzie współrzędnych; ten artykuł jest zgodny z konwencją gradientu będącego wektorem kolumnowym, podczas gdy pochodna jest wektorem wierszowym.

Współrzędne cylindryczne i sferyczne

We współrzędnych cylindrycznych z metryką euklidesową gradient wyraża się wzorem:

gdzie ρ jest odległość osiowa φ jest azymutu i kąta azymutu, z jest współrzędną osiowe i e ρ , e φ i e z wektory jednostki wskazujące wzdłuż współrzędnych kierunkach.

We współrzędnych sferycznych gradient wyraża się wzorem:

gdzie R oznacza odległość promieniową, φ jest kąt kierunkowy i θ jest kątowa i e r , e θ i e φ znowu miejsca wektor jednostkowy zwróconą w kierunku koordynacji (to znaczy znormalizowana bazowych kowariantna ).

Aby zapoznać się z gradientem w innych ortogonalnych układach współrzędnych , zobacz Współrzędne ortogonalne (Operatory różniczkowe w trzech wymiarach) .

Współrzędne ogólne

Rozważamy współrzędne ogólne , które zapisujemy jako x 1 , …, x i , …, x n , gdzie n jest liczbą wymiarów dziedziny. W tym przypadku górny indeks odnosi się do pozycji na liście współrzędnych lub składnika, więc x 2 odnosi się do drugiego składnika, a nie do ilości x do kwadratu. Zmienna indeksująca i odnosi się do dowolnego elementu x i . Używając notacji Einsteina , gradient można następnie zapisać jako:

(Zauważ, że jego podwójna jest ),

gdzie i odnoszą się odpowiednio do nieznormalizowanych lokalnych zasad kowariantnych i kontrawariantnych , jest tensorem metryki odwrotnej , a konwencja sumowania Einsteina implikuje sumowanie przez i oraz j .

Jeśli współrzędne są ortogonalne, możemy łatwo wyrazić gradient (i różniczkę ) w postaci znormalizowanych baz, które nazywamy i , używając współczynników skali (znanych również jako współczynniki Lamé )  :

( i ),

gdzie nie możemy użyć notacji Einsteina, ponieważ nie da się uniknąć powtórzenia więcej niż dwóch indeksów. Pomimo zastosowania górnych i dolnych indeksów , , i nie są ani kontrawariantne, ani kowariantne.

To ostatnie wyrażenie daje w wyniku wyrażenia podane powyżej dla współrzędnych cylindrycznych i sferycznych.

Związek z pochodną

Związek z całkowitą pochodną

Gradient jest ściśle powiązany z pochodną całkowitą ( różnicką całkowitą ) : są one transponowane ( podwójne ) do siebie. Stosując konwencję, że wektory w są reprezentowane przez wektory kolumnowe , a kowektory (mapy liniowe ) są reprezentowane przez wektory wierszowe , gradient i pochodna są wyrażane odpowiednio jako wektor kolumnowy i wierszowy, z tymi samymi składnikami, ale transponują każdy z nich inny:

Chociaż oba mają te same składniki, różnią się rodzajem obiektu matematycznego, który reprezentują: w każdym punkcie pochodną jest wektor kostyczny , forma liniowa ( covector ), która wyraża, jak bardzo (skalarny) zmienia się wynik dla danej nieskończenie małej zmiana wejścia (wektorowego), podczas gdy w każdym punkcie gradient jest wektorem stycznym , który reprezentuje nieskończenie małą zmianę wejścia (wektorowego). W symbolach gradient jest elementem przestrzeni stycznej w punkcie , natomiast pochodna jest odwzorowaniem przestrzeni stycznej na liczby rzeczywiste , . Przestrzenie styczne w każdym punkcie można „naturalnie” utożsamić z samą przestrzenią wektorową i podobnie przestrzeń kostyczną w każdym punkcie można naturalnie utożsamić z podwójną przestrzenią wektorową kowektorów; w ten sposób wartość gradientu w punkcie można traktować jako wektor w oryginale , a nie tylko jako wektor styczny.

Obliczeniowo, mając wektor styczny, wektor można pomnożyć przez pochodną (jako macierze), co jest równe pobraniu iloczynu skalarnego z gradientem:

Różniczka lub (zewnętrzna) pochodna

Najlepsze przybliżenie liniowe do funkcji różniczkowalnej

w punkcie X, w R n jest liniowym z R N do B , który jest często oznaczany przez df X lub Df ( x ) i zwany różnicowy lub całkowitą pochodną o f w x . Funkcja DF , który odwzorowuje x do DF x jest nazywany całkowitej różnicy lub zewnętrzne pochodną o f i jest przykładem różnicowego 1-formy .

Podobnie jak pochodna funkcji jednej zmiennej oznacza nachylenie na stycznej do wykresu funkcji kierunkowa pochodną funkcją wielu zmiennych oznacza nachylenie stycznej hiperpłaszczyznę w kierunku wektora.

Gradient jest powiązany z różniczką wzorem

dla dowolnego vR n , gdzie jest iloczynem skalarnym : pobranie iloczynu skalarnego wektora z gradientem jest takie samo, jak pobranie pochodnej kierunkowej wzdłuż wektora.

Jeżeli R n jest postrzegane jako przestrzeń (wymiar n ) wektorów kolumnowych (liczb rzeczywistych), to df można traktować jako wektor wierszowy ze składowymi

tak, że df x ( v ) jest dane przez mnożenie macierzy . Zakładając standardową metrykę euklidesową na R n , gradient jest wtedy odpowiednim wektorem kolumnowym, to znaczy

Aproksymacja liniowa do funkcji

Najlepsze przybliżenie liniowe funkcji można wyrazić w postaci gradientu, a nie pochodnej. Gradient funkcji f z przestrzeni euklidesowej R n do R w dowolnym punkcie x 0 w R n charakteryzuje najlepsze przybliżenie liniowe do f w x 0 . Przybliżenie jest następujące:

dla x blisko x 0 , gdzie (∇ f  ) x 0 jest gradientem f obliczonym w x 0 , a kropka oznacza iloczyn skalarny na R n . To równanie jest równoważne pierwszym dwóm członom w wielowymiarowym rozwinięciu f w szeregu Taylora w punkcie x 0 .

Związek z pochodną Fréchet

Niech U będzie zbiorem otwartym w R n . Jeżeli funkcja F  : UR jest różniczkowalną, wówczas różniczka f jest pochodna Fréchet z F . Zatem f jest funkcją od U do przestrzeni R n taką, że

gdzie · jest iloczynem skalarnym.

W konsekwencji, zwykłe własności pochodnej obowiązują dla gradientu, chociaż gradient nie jest sam w sobie pochodną, ​​ale raczej dualną do pochodnej:

Liniowość

Gradient jest liniowy w tym sensie, że jeśli f i g są dwiema funkcjami o wartościach rzeczywistych, różniczkowalnymi w punkcie aR n , a α i β są dwiema stałymi, to αf + βg jest różniczkowalna w a , a ponadto

Zasada produktu

Jeśli f i g są funkcjami o wartościach rzeczywistych różniczkowalnymi w punkcie aR n , to reguła iloczynu zakłada, że iloczyn fg jest różniczkowalny w a , oraz

Zasada łańcuchowa

Załóżmy, że f  : AR jest funkcją o wartościach rzeczywistych zdefiniowaną na podzbiorze A z R n , oraz że f jest różniczkowalna w punkcie a . Istnieją dwie formy reguły łańcucha mającej zastosowanie do gradientu. Najpierw załóżmy, że funkcja g jest krzywą parametryczną ; czyli funkcja g  : IR n odwzorowuje podzbiór IR na R n . Jeśli g jest różniczkowalna w punkcie cI takim, że g ( c ) = a , wtedy

gdzie ∘ jest operatorem kompozycji : (  f  ∘  g ) ( x ) = f ( g ( x ) ) .

Bardziej ogólnie, jeśli zamiast tego IR k , to zachodzi:

gdzie ( Dg ) T oznacza transponowaną macierz Jakobianu .

Dla drugiej postaci reguły łańcucha załóżmy, że h  : IR jest funkcją o wartościach rzeczywistych na podzbiorze I z R , i że h jest różniczkowalna w punkcie f ( a ) ∈ I . Następnie

Dalsze właściwości i zastosowania

Zestawy poziomów

Powierzchnia pozioma lub izopowierzchnia to zbiór wszystkich punktów, w których jakaś funkcja ma określoną wartość.

Jeśli f jest różniczkowalne, to iloczyn skalarny (∇ f  ) xv gradientu w punkcie x z wektorem v daje pochodną kierunkową f w x w kierunku v . Wynika z tego, że w tym przypadku, gradient F jest prostopadły do zestawów poziomu o f . Na przykład płaska powierzchnia w przestrzeni trójwymiarowej jest zdefiniowana równaniem postaci F ( x , y , z ) = c . Gradient F jest wtedy normalny do powierzchni.

Bardziej ogólnie, każda osadzona hiperpowierzchnia w rozmaitości Riemanna może być wycinana równaniem postaci F ( P )=0 tak, że dF nie jest nigdzie zerem. Gradient F jest wtedy normalny do hiperpowierzchni.

Podobnie, afiniczny algebraiczna hiperpowierzchni mogą być zdefiniowane za pomocą równania F ( x 1 , ..., x n ) = 0 , gdzie K jest wielomianem. Gradient F wynosi zero w punkcie osobliwym hiperpowierzchni (jest to definicja punktu osobliwego). W punkcie nieosobliwym jest to niezerowy wektor normalny.

Konserwatywne pola wektorowe i twierdzenie o gradiencie

Gradient funkcji nazywany jest polem gradientowym. Pole gradientu (ciągłego) jest zawsze konserwatywnym polem wektorowym : jego całka krzywoliniowa wzdłuż dowolnej ścieżki zależy tylko od punktów końcowych ścieżki i może być oceniona przez twierdzenie gradientowe (podstawowe twierdzenie rachunku różniczkowego dla całek krzywoliniowych). I odwrotnie, (ciągłe) konserwatywne pole wektorowe jest zawsze gradientem funkcji.

Uogólnienia

Jakobian

Jakobian matryca jest uogólnieniem gradient funkcji wektora wartościach od kilku zmiennych różniczkowalnych mapy między euklidesowych , lub bardziej ogólnie, rozdzielaczy . Dalszym uogólnieniem funkcji między przestrzeniami Banacha jest pochodna Frécheta .

Załóżmy, że f  : ℝ n → ℝ m jest funkcją taką, że każda z jej pochodnych cząstkowych pierwszego rzędu istnieje na n . Wtedy jakobian macierz f definiuje się jako macierz m × n , oznaczoną przez lub po prostu . ( I , j ) th wpisu . Jawnie

Gradient pola wektorowego

Ponieważ całkowita pochodna pola wektorowego jest odwzorowaniem liniowym z wektorów na wektory, jest to wielkość tensorowa .

We współrzędnych prostokątnych gradient pola wektorowego f = (  f 1 , f 2 , f 3 ) jest określony wzorem:

(gdzie zapis sumowanie Einsteina jest używany, a produkt napinacz wektorów e I a E K jest dwójkowym napinacz typu (2,0)). Ogólnie rzecz biorąc, wyrażenie to jest równe transpozycji macierzy Jakobianu:

We współrzędnych krzywoliniowych, lub bardziej ogólnie na zakrzywionej rozmaitości , gradient obejmuje symbole Christoffela :

gdzie g jk to składowe odwrotnego tensora metrycznego, a e i to wektory bazowe współrzędnych.

Wyrażony bardziej niezmiennie, gradient pola wektorowego f można zdefiniować za pomocą połączenia Levi-Civita i tensora metrycznego:

gdzie c jest połączeniem.

Rozmaitości riemannowskie

Dla dowolnej gładkiej funkcji f na rozmaitości Riemanna ( M , g ) gradient f jest polem wektorowym f takim, że dla dowolnego pola wektorowego X ,

to jest,

gdzie g x ( , ) oznacza iloczyn skalarny wektorów stycznych w x zdefiniowanym przez metrykę g , a X f jest funkcją, która przyjmuje dowolny punkt xM do kierunkowej pochodnej f w kierunku X , obliczonej w x . Innymi słowy, na wykresie współrzędnych φ od otwartego podzbioru M do otwartego podzbioru R n , (∂ X f  )( x ) jest dane wzorem:

gdzie X j oznacza j- tą składową X na tym wykresie współrzędnych.

Tak więc lokalna forma gradientu przyjmuje postać:

Uogólniając przypadek M = R n , gradient funkcji jest powiązany z jej zewnętrzną pochodną, ​​ponieważ

Dokładniej, gradient f jest polem wektorowym związanym z różniczkową 1-formą df przy użyciu izomorfizmu muzycznego

(nazywany „ostrym”) zdefiniowanym przez metrykę g . Związek między pochodną zewnętrzną a gradientem funkcji na R n jest szczególnym przypadkiem tego, w którym metryka jest metryką płaską podaną przez iloczyn skalarny.

Zobacz też

Uwagi

Bibliografia

  • Bachman, David (2007), Advanced Calculus Demystified , New York: McGraw-Hill , ISBN 978-0-07-148121-2
  • Beauregard, Raymond A.; Fraleigh, John B. (1973), Pierwszy kurs algebry liniowej: z opcjonalnym wprowadzeniem do grup, pierścieni i pól , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
  • Downing, Douglas, Ph.D. (2010), Barron's EZ Calculus , New York: Barron's , ISBN 978-0-7641-4461-5
  • Dubrowin, BA; Fomenko, AT; Nowikow SP (1991). Współczesna geometria — metody i zastosowania: Część I: Geometria powierzchni, grup transformacji i pól . Teksty magisterskie z matematyki (wyd. 2). Skoczek. Numer ISBN 978-0-387-97663-1.
  • Harper, Charlie (1976), Wprowadzenie do fizyki matematycznej , New Jersey: Prentice-Hall , ISBN 0-13-487538-9
  • Kreyszig, Erwin (1972), Advanced Engineering Mathematics (3rd ed.), New York: Wiley , ISBN 0-471-50728-8
  • „McGraw Hill Encyklopedia Nauki i Technologii”. Encyklopedia Nauki i Technologii McGraw-Hill (wyd. 10). Nowy Jork: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
  • Moise, Edwin E. (1967), Rachunek: Complete , Czytanie: Addison-Wesley
  • Protter, Murray H.; Morrey, Jr., Charles B. (1970), College Rachunek z geometrią analityczną (2nd ed.), Czytanie: Addison-Wesley , LCCN  76087042
  • Schey, HM (1992). Div, Grad, Curl i All That (wyd. 2). WW Norton. Numer ISBN 0-393-96251-2. OCLC  25048561 .
  • Stoker, JJ (1969), Geometria różniczkowa , New York: Wiley , ISBN 0-471-82825-4
  • Swokowski hrabia W.; Olinick, Michael; Pensa, Dennisa; Cole, Jeffery A. (1994), Rachunek (wyd. 6), Boston: PWS Publishing Company, ISBN 0-534-93624-5

Dalsza lektura

Zewnętrzne linki