Różniczka funkcji - Differential of a function

W rachunku The różnica stanowi główną część tych zmian w funkcji y  =  f ( x ) w odniesieniu do zmian w zmiennych niezależnych. Różnica dy jest określona

w którym jest pochodna o f w odniesieniu do X , i dx jest dodatkowym rzeczywistym zmienna (tak dy jest funkcją x i dx ). Notacja jest taka, że ​​równanie

zachodzi, gdzie pochodna jest reprezentowana w notacji Leibniza dy / dx , co jest zgodne z traktowaniem pochodnej jako ilorazu różniczki. Pisze się też

Dokładne znaczenie zmiennych dy i dx zależy od kontekstu zastosowania i wymaganego poziomu rygoru matematycznego. Dziedzina tych zmiennych może nabrać szczególnego znaczenia geometrycznego, jeśli różniczka jest uważana za określoną formę różniczkową , lub analityczną, jeśli różniczka jest uważana za liniowe przybliżenie przyrostu funkcji. Tradycyjnie zmienne dx i dy są uważane za bardzo małe ( nieskończenie małe ), a ta interpretacja jest rygorystyczna w niestandardowej analizie .

Historia i użytkowanie

Różniczka została po raz pierwszy wprowadzona poprzez intuicyjną lub heurystyczną definicję przez Isaaca Newtona i poparta przez Gottfrieda Leibniza , który myślał o  różniczce dy jako nieskończenie małej (lub nieskończenie małej ) zmianie wartości  y funkcji, odpowiadającej nieskończenie małej zmianie  dx w argumencie funkcji  x . Z tego powodu chwilowa stopa zmiany y względem x , która jest wartością pochodnej funkcji, oznaczona jest przez ułamek

w tak zwanej notacji Leibniza dla pochodnych. Iloraz dy / dx nie jest nieskończenie mały; jest to raczej liczba rzeczywista .

Stosowanie nieskończenie małych w tej formie było szeroko krytykowane, np. w słynnej broszurze The Analyst biskupa Berkeleya. Augustin-Louis Cauchy ( 1823 ) zdefiniował różnicę bez odwoływania się do atomizmu nieskończenie małych Leibniza. Zamiast tego Cauchy, idąc za d'Alembertem , odwrócił logiczny porządek Leibniza i jego następców: sama pochodna stała się obiektem podstawowym, zdefiniowanym jako granica ilorazów różnicowych, a różniczki zostały następnie zdefiniowane w jego kategoriach. Oznacza to, że można było zdefiniować różniczkę dy za pomocą wyrażenia

w którym dy i dx są po prostu nowymi zmiennymi przyjmującymi skończone wartości rzeczywiste, a nie ustalone nieskończenie małe, jak to było w przypadku Leibniza.

Według Boyera (1959 , s. 12), podejście Cauchy'ego było znaczącym logicznym ulepszeniem w porównaniu z nieskończenie małym podejściem Leibniza, ponieważ zamiast odwoływać się do metafizycznego pojęcia nieskończenie małych, wielkościami dy i dx można było teraz manipulować w dokładnie taki sam sposób jak wszelkie inne rzeczywiste ilości w znaczący sposób. Ogólne podejście koncepcyjne Cauchy'ego do różniczkowania pozostaje standardowym podejściem we współczesnych metodach analitycznych, chociaż ostatnie słowo na temat rygoru, w pełni nowoczesnego pojęcia granicy, ostatecznie należało do Karla Weierstrassa .

W zabiegach fizycznych, takich jak te stosowane w teorii termodynamiki , nadal dominuje pogląd nieskończenie mały. Courant i John (1999 , s. 184) w następujący sposób godzą fizyczne użycie nieskończenie małych różnic z ich matematyczną niemożliwością. Różnice reprezentują skończone niezerowe wartości, które są mniejsze niż stopień dokładności wymagany do konkretnego celu, do którego są przeznaczone. Tak więc „nieskończenie małe fizyczne” nie muszą odwoływać się do odpowiadającej im nieskończenie małej matematycznej, aby mieć precyzyjny sens.

Po dwudziestowiecznych postępach w analizie matematycznej i geometrii różniczkowej stało się jasne, że pojęcie różniczki funkcji można rozszerzyć na różne sposoby. W analizie rzeczywistej bardziej pożądane jest bezpośrednie zajmowanie się różniczką jako główną częścią przyrostu funkcji. Prowadzi to bezpośrednio do założenia, że ​​różniczka funkcji w punkcie jest funkcjonałem liniowym przyrostu Δ x . Takie podejście pozwala na opracowanie dyferencjału (jako mapy liniowej) dla różnych, bardziej wyrafinowanych przestrzeni, co ostatecznie daje początek takim pojęciom, jak pochodna Frécheta czy Gateaux . Podobnie w geometrii różniczkowej różniczka funkcji w punkcie jest funkcją liniową wektora stycznego („nieskończenie małe przemieszczenie”), co przedstawia ją jako rodzaj jednej postaci: zewnętrzną pochodną funkcji. W rachunku niestandardowym różniczki są traktowane jako nieskończenie małe, które same w sobie mogą mieć rygorystyczną podstawę (patrz różniczka (infinitesimal) ).

Definicja

Różniczka funkcji ƒ ( x ) w punkcie  x 0 .

Różnicę definiuje się w nowoczesnych podejściach do rachunku różniczkowego w następujący sposób. Różniczka funkcji f ( x ) pojedynczej zmiennej rzeczywistej x jest funkcją df dwóch niezależnych zmiennych rzeczywistych x i Δ x daną przez

Jeden lub oba argumenty mogą być stłumione, tzn. można zobaczyć df ( x ) lub po prostu df . Jeśli y  =  f ( x ), różniczka może być również zapisana jako dy . Ponieważ dx ( x , Δ x ) = Δ x konwencjonalnie jest napisać dx  = Δ x , tak że zachodzi następująca równość:

To pojęcie różniczki ma szerokie zastosowanie, gdy poszukuje się liniowego przybliżenia funkcji, w której wartość przyrostu Δ x jest wystarczająco mała. Dokładniej, jeśli f jest funkcją różniczkowalną w x , to różnica w wartościach y

spełnia

gdzie błąd ε w przybliżeniu spełnia εx  → 0 jako Δ x  → 0. Innymi słowy, mamy przybliżoną identyczność

w którym błąd może być tak mały, jak to pożądane w stosunku do hemibursztynianu x poprzez ograniczenie Æ x być wystarczająco małe, to jest do powiedzenia,

jako Δ x  → 0. Z tego powodu różniczka funkcji jest znana jako główna (liniowa) część przyrostu funkcji: różniczka jest liniową funkcją przyrostu Δ x , i chociaż błąd ε może być nieliniowy, ma tendencję do szybkiego zerowania, ponieważ Δ x dąży do zera.

Różnice w kilku zmiennych

Operator/funkcja
Mechanizm różnicowy 1: 2:

3:

Częściowa pochodna
Całkowita pochodna

Zgodnie z Goursat (1904 , I, §15), dla funkcji więcej niż jednej zmiennej niezależnej,

częściowy różnica w y , w odniesieniu do dowolnego z tych zmiennych  x 1 jest głównym elementem zmiany Y wynikające ze zmiany  dx 1 w tej jednej zmiennej. Różniczka cząstkowa jest zatem

udziałem pochodnej cząstkowej z y względem  x 1 . Suma różniczek cząstkowych w odniesieniu do wszystkich zmiennych niezależnych jest różniczką zupełną

co jest zasadniczą częścią zmiany y wynikającej ze zmian zmiennych niezależnych  x i .

Dokładniej, w kontekście rachunku wielu zmiennych, za Courantem (1937b) , jeśli f jest funkcją różniczkowalną, to zgodnie z definicją różniczkowalności przyrost

gdzie warunki błędu ε i dążą do zera, gdy przyrosty Δ x i łącznie dążą do zera. Całkowita różnica jest wtedy ściśle zdefiniowana jako  

Ponieważ zgodnie z tą definicją

jeden ma

Podobnie jak w przypadku jednej zmiennej, zachowana jest tożsamość przybliżona

w którym całkowity błąd może być tak mały, jak jest to pożądane w stosunku do poprzez ograniczenie uwagi do wystarczająco małych przyrostów.

Zastosowanie różniczki całkowitej do szacowania błędu

W pomiarze różniczka całkowita jest używana do szacowania błędu Δ f funkcji f na podstawie błędów Δ x , Δ y , ... parametrów x , y , …. Zakładając, że przedział jest wystarczająco krótki, aby zmiana była w przybliżeniu liniowa:

Δ f ( x ) = f' ( x ) × Δ x

i że wszystkie zmienne są niezależne, to dla wszystkich zmiennych,

Dzieje się tak, ponieważ pochodna f x w odniesieniu do konkretnego parametru x daje wrażliwość funkcji f na zmianę x , w szczególności błąd Δ x . Ponieważ zakłada się, że są one niezależne, analiza opisuje najgorszy scenariusz. Wykorzystywane są wartości bezwzględne błędów składowych, ponieważ po prostym obliczeniu pochodna może mieć znak ujemny. Z tej zasady wyprowadza się reguły błędów sumowania, mnożenia itp., np.:

Niech f( a , b ) = a × b ;
Δ F = f o hemibursztynianu + f b ADi B ; wycena instrumentów pochodnych
Δ f = b Δ a + a Δ b ; dzieląc przez f , czyli a × b
Δ f / f = Δ a / a + Δ b / b

Oznacza to, że w mnożeniu całkowity błąd względny jest sumą błędów względnych parametrów.

Aby zilustrować, w jaki sposób zależy to od rozważanej funkcji, rozważmy przypadek, w którym zamiast tego funkcją jest f ( a , b ) = a ln b . Następnie można obliczyć, że oszacowanie błędu wynosi

Δ f / f = Δ a / a + Δ b / ( b ln b )

z dodatkowym współczynnikiem „ ln b ” nie znalezionym w przypadku prostego produktu. Ten dodatkowy czynnik ma tendencję do zmniejszania błędu, ponieważ ln b nie jest tak duże jak a gołe  b .

Różnice wyższego rzędu

Różnice wyższego rzędu funkcji y  =  f ( x ) pojedynczej zmiennej x można zdefiniować poprzez:

i na ogół,

Nieformalnie motywuje to notację Leibniza dla pochodnych wyższego rzędu

Gdy zmienna niezależna x sama może zależeć od innych zmiennych, to wyrażenie staje się bardziej skomplikowane, ponieważ musi zawierać również różniczki wyższego rzędu w samym x . Tak więc na przykład

i tak dalej.

Podobne rozważania dotyczą definiowania różnic wyższego rzędu funkcji kilku zmiennych. Na przykład, jeśli f jest funkcją dwóch zmiennych x i y , wtedy

gdzie jest współczynnikiem dwumianowym . W przypadku większej liczby zmiennych obowiązuje analogiczne wyrażenie, ale z odpowiednim rozwinięciem wielomianowym, a nie rozwinięciem dwumianowym.

Różnice wyższego rzędu w kilku zmiennych również stają się bardziej skomplikowane, gdy same niezależne zmienne mogą zależeć od innych zmiennych. Na przykład dla funkcji f od x i y, które mogą zależeć od zmiennych pomocniczych, należy:

Z powodu tej niedoskonałości notacji, użycie różnicek wyższego rzędu zostało ostro skrytykowane przez Hadamarda 1935 , który stwierdził:

Enfin, que signifie ou que représente l'égalité
A mon avis, rien du tout.

Czyli: Wreszcie, co oznacza równość lub co reprezentuje równość [...]? Moim zdaniem w ogóle nic. Pomimo tego sceptycyzmu, różnice wyższego rzędu okazały się ważnym narzędziem analizy.

W tych kontekstach różniczka n- tego rzędu funkcji f zastosowana do przyrostu Δ x jest zdefiniowana przez

lub równoważne wyrażenie, takie jak

gdzie jest n-różnicą w przód z przyrostem t Δ x .

Ta definicja ma również sens, jeśli f jest funkcją kilku zmiennych (dla uproszczenia rozumianego tutaj jako argument wektorowy). Wtedy tak zdefiniowana n- ta różniczka jest jednorodną funkcją stopnia n w przyroście wektora Δ x . Ponadto, szereg Taylora z F w punkcie x jest przez

Pochodna Gateaux wyższego rzędu uogólnia te rozważania na przestrzenie nieskończenie wymiarowe.

Nieruchomości

Szereg własności różniczki wynika wprost z odpowiednich własności pochodnej, pochodnej cząstkowej i pochodnej całkowitej. Obejmują one:

  • Liniowość : Dla stałych a i b oraz funkcji różniczkowalnych f i g ,

Operacja d z tymi dwiema właściwościami jest znana w algebrze abstrakcyjnej jako pochodna . Sugerują zasadę Mocy

Ponadto obowiązują różne formy reguły łańcucha , o coraz większym stopniu ogólności:

  • Jeśli y  =  f ( u ) jest różniczkowalną funkcją zmiennej u , a u  =  g ( x ) jest różniczkowalną funkcją x , to
Heurystycznie regułę łańcucha dla kilku zmiennych można zrozumieć, dzieląc obie strony tego równania przez nieskończenie małą wielkość dt .
  • Obowiązują bardziej ogólne wyrażenia analogiczne, w których zmienne pośrednie x i zależą od więcej niż jednej zmiennej.

Ogólna formuła

Spójne pojęcie różniczki można opracować dla funkcji f  : R nR m między dwiema przestrzeniami euklidesowymi . Niech xx  ∈  R n będzie parą wektorów euklidesowych . Przyrost funkcji f wynosi

Jeśli istnieje macierz A m  ×  n taka, że

w którym wektor ε  → 0 jako Δ x  → 0, to f jest z definicji różniczkowalny w punkcie x . Macierz A jest czasami znana jako macierz Jakobian , a transformacja liniowa, która łączy z przyrostem Δ x  ∈  R n wektor A Δ x  ∈  R m jest, w tym ogólnym ustawieniu, znana jako różniczkowa df ( x ) f w punkcie x . Jest to dokładnie pochodna Frécheta i ta sama konstrukcja może być wykonana dla funkcji pomiędzy dowolnymi przestrzeniami Banacha .

Innym owocnym punktem widzenia jest bezpośrednie zdefiniowanie różniczki jako rodzaju pochodnej kierunkowej :

co jest podejściem już przyjętym do definiowania różnic wyższego rzędu (i jest najbardziej zbliżone do definicji przedstawionej przez Cauchy'ego). Jeśli t reprezentuje czas i pozycję x , to h reprezentuje prędkość zamiast przemieszczenia, jak to widzieliśmy do tej pory. Daje to kolejne udoskonalenie pojęcia różniczki: powinna być liniową funkcją prędkości kinematycznej. Zbiór wszystkich prędkości przechodzących przez dany punkt przestrzeni jest znany jako przestrzeń styczna , a więc df daje na przestrzeni stycznej funkcję liniową: formę różniczkową . W tej interpretacji różniczka f jest znana jako pochodna zewnętrzna i ma szerokie zastosowanie w geometrii różniczkowej, ponieważ pojęcie prędkości i przestrzeni stycznej ma sens na każdej rozmaitości różniczkowej . Jeśli dodatkowo wartość wyjściowa f reprezentuje również położenie (w przestrzeni euklidesowej), to analiza wymiarowa potwierdza, że ​​wartością wyjściową df musi być prędkość. Jeśli potraktuje się różniczkę w ten sposób, nazywa się to przesunięciem do przodu, ponieważ „wypycha” prędkości z przestrzeni źródłowej do prędkości w przestrzeni docelowej.

Inne podejścia

Chociaż pojęcie posiadania nieskończenie małego przyrostu dx nie jest dobrze zdefiniowane we współczesnej analizie matematycznej , istnieje wiele technik definiowania nieskończenie małej różniczki, tak aby różniczka funkcji mogła być obsługiwana w sposób, który nie koliduje z notacją Leibniza . Obejmują one:

Przykłady i zastosowania

Różniczki mogą być efektywnie wykorzystywane w analizie numerycznej do badania propagacji błędów eksperymentalnych w obliczeniach, a tym samym ogólnej numerycznej stabilności problemu ( Courant 1937a ). Załóżmy, że zmienna x reprezentuje wynik eksperymentu, a y jest wynikiem obliczeń numerycznych zastosowanych do x . Pytanie brzmi, w jakim stopniu błędy pomiaru x wpływają na wynik obliczenia y . Jeśli x jest znane z dokładnością do Δ x jego prawdziwej wartości, to twierdzenie Taylora daje następujące oszacowanie błędu Δ y w obliczeniach y :

gdzie ξ = x + θ Δ x dla niektórych 0 < θ < 1 . Jeśli Δ x jest małe, wtedy wyraz drugiego rzędu jest pomijalny, więc Δ y jest, ze względów praktycznych, dobrze przybliżony przez dy = f' ( xx .

Różniczka jest często przydatna do przepisywania równania różniczkowego

w formie

w szczególności, gdy chce się oddzielić zmienne .

Uwagi

  1. ^ Szczegółowy opis historyczny różnicy można znaleźć w Boyer 1959 , zwłaszcza na stronie 275, gdzie znajduje się wkład Cauchy'ego na ten temat. Skrócona relacja pojawia się w Kline 1972 , rozdział 40.
  2. ^ Cauchy wyraźnie zaprzeczył możliwości istnienia rzeczywistych nieskończeniemałychi nieskończonych ilości ( Boyer 1959 , s. 273-275) i przyjął radykalnie inny punkt widzenia, że ​​„wielkość zmienna staje się nieskończenie mała, gdy jej wartość liczbowa maleje w nieskończoność w taki sposób, jak zbieżności do zera” ( Cauchy 1823 , s. 12; tłumaczenie z Boyer 1959 , s. 273).
  3. ^ Boyer 1959 , s. 275
  4. ^ Boyer 1959 , s. 12: „Zdefiniowane w ten sposób różnice są tylko nowymi zmiennymi , a nie ustalonymi nieskończenie małymi…”
  5. ^ Courant 1937a , II §9 „Tutaj zauważyć jedynie przy okazji, że jest możliwe zastosowanie tego przybliżeniu reprezentację przyrost hemibursztynianu y przez wyrażenie liniowe HF ( x ) w celu skonstruowania logicznie zadowalającej definicji«różnicy» tak jak zrobił to w szczególności Cauchy."
  6. ^ Boyer 1959 , s. 284
  7. ^ Zobacz na przykład wpływowe traktaty Courant 1937a , Kline 1977 , Goursat 1904 i Hardy 1905 . Źródła trzeciorzędne dla tej definicji obejmują również Tolstov 2001 i Itô 1993 , §106.
  8. ^ Cauchy 1823 . Zobacz także, na przykład, Goursat 1904 , I, §14.
  9. ^ Goursat 1904 , I, §14
  10. ^ W szczególności do holomorfii nieskończenie wymiarowej ( Hille i Phillips 1974 ) oraz analizy numerycznej poprzez rachunek różnic skończonych .
  11. ^ Goursat 1904 , I, §17
  12. ^ Goursat 1904 , I, §§14,16
  13. ^ Eisenbud i Harris 1998 .
  14. ^ Zobacz Kock 2006 i Moerdijk & Reyes 1991 .
  15. ^ Zobacz Robinson 1996 i Keisler 1986 .

Bibliografia

Zewnętrzne linki