2. Derivace a lineární aproximace#
2.2. Lineární aproximace#
V následujících pasážích se budeme věnovat lineární aproximaci funkce. To je nahrazení funkce s jakkoli složitým funkčním předpisem funkcí s tím nejjednodušším možným předpisem: lineární funkcí. Tím se pochopitelně dopouštíme jisté nepřesnosti a je to něco za něco: k popisu úlohy máme poté k dispozici jednodušší funkce, ale výpočty jsou zatíženy chybou. Někdy tato chyba může být tak velká, že je idea lineární aproximace naprosto nepoužitelná. Ale jindy se jedná o nástroj, který prakticky neřešitelnou úlohu převede na úlohu snadno zvládnutelnou. Linearizace nelineárních úloh je jedním ze základních inženýrských postupů. V mnoha případech dává samotná dobré výsledky a řeší zadaný problém, v jiných případech slouží jako odrazový můstek ke zvládnutí nelineárního problému.
2.2.1. Lineární aproximace v 1D#
Pokud se funkce mění, můžeme odhad změny z předchozího odstavce přičíst k funkční hodnotě a tím máme odhad funkční hodnoty po změně. Toto je principem lineární aproximace, neuvěřitelně jednoduché a přitom velice mocné techniky používané inženýry k tomu, aby se popis problémů a řešení úloh vůbec daly efektivně zvládnout.
Věta (Lineární aproximace)
Buď \(\displaystyle f:\mathbb R\to\mathbb R\) funkce, která má derivaci. V okolí bodu \(\displaystyle x_0\) platí přibližný vzorec
Poznámka (Slovní interpretace vzorce pro lineární aproximaci)
Výše uvedený vzorec není těžké rozšifrovat.
Veličina \(\displaystyle f(x)\) je funkční hodnota v bodě \(\displaystyle x\), tu chceme odhadnout.
Veličina \(\displaystyle f(x_0)\) je známá funkční hodnota v bodě \(\displaystyle x_0\), to je ýchozí bod pro odhad.
Veličina \(\displaystyle f'(x_0)\) je odhad změny veličiny \(\displaystyle f\) způsobený jednotkovou změnou vstupních dat (zvýšení hodnoty \(\displaystyle x_0\) o jednotku). Tento faktor ještě v dalším kroku musíme přizpůsobit tomu, že změna vstupních dat není jednotková, což uděláme s využitím přímé úměrnosti.
Veličina \(\displaystyle f'(x_0)(x-x_0)\) je odhad změny veličiny \(\displaystyle f\) vyvolané změnou veličiny \(\displaystyle x\) z \(\displaystyle x_0\) o \(\displaystyle \Delta x=x-x_0\) tak, jak jsme jej používali v minulé přednášce.
Poznámka (Alternativní vzorec pro lineární aproximaci)
Vzorec pro lineární aproximaci se často píše v ekvivalentním tvaru
Poznámka (Význam vzorce pro lineární aproximaci)
Vzorec umožňuje složitý funkční předpis předpisem jednodušším (lineární funkce jsou jedny z nejtrivilálnějších).
K použití vzorce stačí znát jeden bod grafu a funkční hodnotu a hodnotu derivace v tomto bodě.
Aproximace je pouze lokální, použitelná pouze v určitém okolí uvažovaného bodu. Jak velké toto okolí může být a jaké chyby se dopouštíme při lineární aproximaci je různé pro různé funkce. Obecně platí, že čím blíže jsme k bodu \(\displaystyle x_0\), tím je tato aproximace přesnější.
Příklad (růst stromu). Strom má v roce 2019 výšku 3 metry a roste rychlostí 0.5 metru za rok. V roce \(\displaystyle x\) je jeho výška dána vzorcem
Příklad (aproximace důležitých funkcí v okolí nuly). Ve cvičení ukážeme platnost následujících přibližných vzorců, které platí pro \(\displaystyle x\) blízké k nule.
(Lineární aproximace v některých fyzikálních zákonech)
2.2.2. Lineární aproximace v některých fyzikálních zákonech#
Příklad (gravitační potenciál v malých výškách nad zemí). Gravitační potenciál \(\displaystyle V\) ve vzdálenosti \(\displaystyle r\) od středu koule o hmotnosti \(\displaystyle M\) je dán vztahem
Dosazením obdržíme
Online výpočet tíhového zrychlení
Příklad (potenciální a kinetická energie). V předchozím příkladě je možné využít vztah
Podobně aproximací přesných vztahů plynoucích z Einsteinovy teorie relativity získáme složku energie související s pohybem, tj. kinetickou energii
Ač se jedná „jenom“ o lineární aproximaci, je vzorec \(\displaystyle E=\frac 12 mv^2\) dokonce mnohem použitelnější, protože výpočet kinetické energie pomocí univerzálně platného relativistického vzorce při malých rychlostech v praxi obvykle zhavaruje na zaokrouhlovacích chybách.
2.3. Lineární aproximace a jednorozměrné materiálové vztahy#
V inženýrské praxi často potřebujeme modelovat odezvu materiálu reagujícího na vnější podnět. Může se jednat například o změnu délky při mechanickém namáhání, tok tepla materiálem při tepelném namáhání, tok tekutiny porézním materiálem (dřevo, půda) při difuzi nebo rozdílu tlaků a podobně.
Pokusíme se modelovat funkci dávající do souvislosti velikost podnětu a reakci materiálu.
Je přirozené, že při nulovém podnětu není žádná odezva a proto funkce prochází počátkem.
S velikostí podnětu odezva na tento podnět roste a proto funkce v okolí počátku má kladnou derivaci a roste.
Z lineární aproximace vidíme, že pro \(\displaystyle x_0=0\) a \(\displaystyle f(0)=0\) se vzorec pro lineární aproximaci redukuje na
\[f(x)\approx f'(0)x,\]tj. na přímou úměrnost.Ukazuje se, že v řadě praktických úloh je uvedená aproximace dobrá na dostatečně dlouhém intervalu a podle typu úlohy má tato aproximace povahu fyzikálního zákona a svůj vlastní název. Nejčastěji se setkáme se s Hookovým zákonem pro deformaci materiálu (relativní prodloužení je úměrné normálovému napětí), Darcyho zákonem pro tok tekutiny půdou (filtrační rychlost je úměrná záporně vzatému hydraulickému gradientu), Fickovým zákonem pro difuzi (hustota difuzniho toku je úměrná záporně vzatému gradientu koncentrace) a Fourierovým zákonem pro vedení tepla v materiálu (hustota tepelného toku je úměrná záporně vzatému gradientu teploty). Později, v přednášce o zákonech zachování ve vektorovém poli ke konci semestru, si tyto závislosti naformulujeme ve vícerozměrném prostředí a hlavně ve tvaru, který umožní zohlednit práci s neizotropními materiály (různé fyzikální vlastnosti v různých směrech).
Matematicky je tedy povaha přímé úměrnosti v materiálových vztazích zřejmá a experimentálně je možné ověřit, pro jaké oblasti platí. Toto nám však mnohdy nestačí a snažíme se tyto vztahy ještě odvodit ze základních fyzikálních vztahů a z představy jak daný proces funguje. To otevírá možnosti potvrdit si, že naše představa o chování materiálu je správná.
V některých velmi speciálních případech dokonce umíme určit materiálovou charakteristiku výpočtem namísto měření. Pro praktické využití tato dovednost není významná (můžeme vypočítat například koeficient filtrace pro půdu složenou z částic ve tvaru stejně velkých kuliček, v praxi se však s takovým materiálem setkáme nanejvýš při speciálních aplikacích v laboratoři), ale dává nám to důležitý prostor pro ověření fyzikálních hypotéz a matematických postupů.
2.4. Derivace a tečna#
Lineární aproximace funkce je vlastně aproximace tečnou. Protože pojem tečna ze střední školy chápeme jenom intuitivně, můžeme nyní pomocí derivace tečnu dokonce definovat. Z geometrického pohledu je tečna přímka bodem \(\displaystyle [x_0,f(x_0)]\), která má směrnici \(\displaystyle f'(x_0)\). Proto se o derivaci často mluví jako o směrnici tečny.
Definice (Tečna)
Nechť \(\displaystyle f\) je funkce, která má v bodě \(\displaystyle x_0\) derivaci \(\displaystyle f(x_0)\). Přímka
Díky souvislosti derivace s tečnou je derivace jedinečným nástrojem při popisu vlastností křivek. Příslušná oblast se nazývá diferenciální geometrie a je to jakási oblast mezi geometrií a diferenciálním počtem.
2.5. Aproximace vyššího řádu#
2.5.1. Motivace: Je možné chtít více než je lineární aproximace?#
Lineární aproximace vychází z předpokladu, že rychlost růstu (nebo poklesu) se příliš nemění. Někdy můžeme mít dodatečnou informaci o tom, jak se tato rychlost změní. Například pokud se bude rychlost zpomalovat, bude skutečná hodnota funkce menší než lineární aproximace.
Je otázka, zda a jak je možné informaci o tom, jak rychle roste rychlost, případně jak rychle roste rychlost růstu rychlosti, využít. To znamená že budeme studovat derivaci derivace, derivaci derivace derivace atd.
Aproximaci funkce \(\displaystyle \cos x\approx 1\) zmíněnou výše (odvodíme ve cvičení), kdy aproximujeme vlastně konstantní funkcí, je možné také chápat jako selhání lineární aproximace. Následující slidy a pojem Taylorův polynom nám umožní najít prostředek pro aproximaci i v těchto případech.
2.5.2. Derivace vyšších řádů#
Definice (Druhá a další vyšší derivace)
Druhou derivací rozumíme derivaci derivace. Označujeme \(\displaystyle f''(x)\) nebo \(\displaystyle \frac{\mathrm d^2 f}{\mathrm dx^2}\).
Podobně \(\displaystyle k\)-tou derivací rozumíme derivaci \(\displaystyle (k-1)\)-ní derivace. Označujeme \(\displaystyle f^{(k)}(x)\) nebo \(\displaystyle \frac{\mathrm d^k f}{\mathrm dx^k}\).
Platí tedy
Označení derivací pomocí čárek se nazývá Lagrangeova notace, označení pomocí podílu diferenciálů Leibnizova notace. Ještě se někdy používá i Eulerova notace, používající \(\displaystyle \mathrm Df\), \(\displaystyle \mathrm D^2 f\) a \(\displaystyle \mathrm D^k f\) pro první, druhou a \(\displaystyle k\)-tou derivaci.
Příklad.
Exponenciální funkce \(\displaystyle e^x\) má všechny derivace stejné.
U mocninné funkce se každým derivováním sníží exponent. Je-li exponentem přirozené číslo, po konečném počtu kroků se exponent sníží na nulu, funkce tedy bude konstantní a všechny další derivace budou nulové.
Polynomy mají všechny derivace od jistého řádu rovny nule.
Podobně je možné pracovat s parciálními derivacemi parciálních derivací. Například
(Druhá derivace a deformace nosníků)
2.5.3. Druhá derivace a deformace nosníků#
Derivace hrají ústřední roli v teorii studující tuhost, deformaci a odolnost proti selhání u nosníků. Máme-li nosník podepřený na koncích a zatížený silou kolmo na podélnou osu nosníku (například vodorovný nosník se svislým zatížením) a je-li \(\displaystyle v(x)\) výchylka od rovnovážného stavu v bodě \(\displaystyle x\), potom derivace \(\displaystyle \frac{\mathrm dv}{\mathrm dx}\) vyjadřuje úhel pootočení svislého průřezu nosníku vlivem deformace a druhá derivace \(\displaystyle \frac{\mathrm d^2v}{\mathrm dx^2}\) při malých deformacích vyjadřuje křivost nosníku. Z fyzikálních úvah a ze vztahu mezi křivostí a momentem \(\displaystyle M(x)\) síly, která nosník deformuje, je možné odvodit rovnici
Někdy je vhodné mít moment \(\displaystyle M(x)\) síly deformující nosník mít vyjádřený pomocí zatížení nosníku. To souvisí s druhou derivací momentu a proto je nutno rovnici ještě dvakrát derivovat. Proto se ohybová rovnice nosníku někdy uvádí jako vztah obsahující dokonce čtvrtou derivaci.
2.5.4. Taylorův polynom a polynomiální aproximace v 1D#
Definice (Taylorův polynom)
Taylorův polynom stupně \(\displaystyle n\) pro funkci \(\displaystyle f\) v bodě \(\displaystyle x_0\) je polynom
Taylorův polynom je nejlepší aproximace funkce \(\displaystyle f\) polynomem. Je možné ukázat, že rozdíl
Věta (Taylorova aproximace v okolí nuly)
Platí
Často používáme aproximaci v nule. Potom dostáváme pro aproximaci v okolí nuly
Příklad.
2.6. Konečné diference a numerická aproximace derivace#
Pro numerické řešení rovnic obsahujících derivace je vhodné umět nahradit derivace veličinami, se kterými se lépe pracuje v numerických výpočtech.
Základním přístupem je vynechání limitního přechodu v definici derivace
Lepší aproximace derivace vychází z Taylorova polynomu druhého řádu napsaného pro \(\displaystyle f(x+h)\) a \(\displaystyle f(x-h)\), tj. ze vztahů
Pokud tyto vztahy odečteme, dostaneme
\[ f(x+h)-f(x-h)\approx2f'(x)h. \]a odsud dostáváme aproximaci první derivace pomocí centrální diference ve tvaru\[ \frac{\mathrm d f}{\mathrm dx}=f'(x)\approx \frac{f(x+h)-f(x-h)}{2h}.\]Protože používáme aproximaci kvadratickým polynomem, je aproximace derivace pomocí centrální diference přesnější než aproximace pomocí dopředné diference.Pokud tyto vztahy sečteme, dostaneme
\[ f(x+h)+f(x-h)\approx 2f(x)+ f''(x)h^2 \]a odsud dostáváme aproximaci druhé derivace\[ \frac{\mathrm d^2f}{\mathrm dx^2}=f''(x)\approx \frac{f(x-h)-2f(x)+f(x+h)}{h^2}. \]
(Od vazeb mezi atomy k materiálovým vlastnostem)
2.7. Odbočka: od vazeb mezi atomy k materiálovým vlastnostem#
Výraz
Lineární člen chybí a kvadratický člen je analogický potenciální energii pružiny o tuhosti \(\displaystyle k\) ve tvaru
Pokud aproximujeme potenciál pomocí Taylorova polynomu, z koeficientu u kvadratického člene můžeme určit frekvenci oscilací.
Dále můžeme tímto způsobem určit pevnost vazby a tím pro daný materiál určit Youngův modul pružnosti, tj. konstantu úměrnosti mezi deformací materiálu a tahovým nebo tlakovým napětí v materiálu.
Poloha rovnovážné polohy, resp. její závislost na teplotě (pokud bychom do matematického modelu dodali skutečné parametry i s jejich teplotní závislostí) zase definuje koeficient teplotní roztažnosti materiálu.
Takovým způsobem můžeme u materiálu se známou strukturou odhadnout fyzikální vlastnosti výpočtem. To je důležité, protože teoretické předpovídání vlastností materiálu otevírá cestu k navrhování nových materiálů s výhodnějšími vlastnostmi. materiál můžeme prozkoumat ještě dříve, než jej vyrobíme a dostaneme na stůl.
2.8. Řešení rovnic#
V praxi se setkáváme s případy, kdy je znám výsledek po aplikování funkce na vstupní data a je nutné rekonstruovat tato vstupní data. Řešíme tedy rovnici, kde neznámá je argumentem funkce a je známa funkční hodnota. Pojmy nutné pro korektní formulaci a jednu z velmi rychlých přibližných metod řešení rovnic si představíme v následujících pasážích.
Nejprve se budeme zabývat tím, jestli se k funkční hodnotě dají vstupní data rekonstruovat jednoznačně (prostá funkce). Pokud ano, představíme si pravidlo, které toto přiřazení vstupních dat k výsledku po aplikaci funkce dokáže realizovat (inverzní funkce). A na závěr si ukážeme metodu, jak při řešení rovnic (resp. počítat funkční hodnoty inverzních funkcí) využít derivaci. To vede k velmi rychlé a velmi obecné metodě numerického řešení (Newtonova metoda).
2.8.1. Prostá funkce#
Někdy jsme v situaci, že známe výsledek po působení nějaké funkce a potřebujeme zrekonstruovat vstupní hodnotu. Řešíme tedy pro zadanou funkci \(\displaystyle f\) a hodnotu \(\displaystyle y_0\) rovnici
Definice (Prostá funkce)
Nechť \(\displaystyle f\) je funkce a \(\displaystyle M\subseteq \mathrm{Dom}(f)\) podmnožina definičního oboru funkce \(\displaystyle f\). Řekneme, že funkce \(\displaystyle f\) je prostá, jestliže každý obraz má jen jediný vzor, tj. pro každé \(\displaystyle y_0\in f(M)\) existuje jediné \(\displaystyle x\in M\) s vlastností \(\displaystyle f(x)=y_0\). Nespecifikujeme-li množinu \(\displaystyle M\), máme na mysli, že uvedená vlastnost platí na celém definičním oboru funkce \(\displaystyle f\).
Věta (Rovnice s prostou funkcí)
Pokud je \(\displaystyle f\) prostá funkce a platí
Příklad. Vlastnost být či nebýt prostá je zásadní pro vyslovení odpovědi na otázku, zda rovnice má jediné řešení, či zda řešení může být více.
Funkce \(\displaystyle \frac 1x\) je prostá a proto z rovnosti \(\displaystyle \frac 1x = \frac 15\) plyne \(\displaystyle x=5\).
Funkce \(\displaystyle x^2\) není prostá a proto z rovnosti \(\displaystyle x^2 = 7^2\) neplyne \(\displaystyle x=7\). Ve skutečnosti pro každou rovnici ve které není prostá funkce, potřebujeme speciální metodu. Proto máme speciální vzorec pro řešení kvadratické rovnice, nebo například speciální postupy pro řešení goniometrickcýh rovnic.
2.8.2. Inverzní funkce#
Inverzní úloha je tak trošku jako reverzní inženýrství. Máme výsledek a potřebujeme znát vstupní data. U funkcí to je supersnadné, u konstrukcí supersložité. Užitečné je ale obojí.
Definice (Inverzní funkce)
Nechť funkce \(\displaystyle f: A\to B\) je prostá. Pravidlo, které každému \(\displaystyle x\) z množiny \(\displaystyle f(A)\) přiřadí to (jediné) \(\displaystyle y\), pro které platí \(\displaystyle f(y)=x\) se nazývá inverzní funkce k funkci \(\displaystyle f\), označujeme \(\displaystyle f^{-1}\).
Poznámka (Inverzní funkce pří řešení rovnic)
Jinak zapsáno, je-li
Symbol \(\displaystyle f^{-1}(x)\) lze tedy chápat buď jako hodnotu inverzní funkce k funkci \(\displaystyle f\) v bodě \(\displaystyle x\), nebo jako převrácenou hodnotu k číslu \(\displaystyle f(x)\), tj jako \(\displaystyle [f(x)]^{-1}=\frac{1}{f(x)}\). Nebude-li z kontextu zřejmé, o kterou variantu se jedná, musíme toto upřesnit.
Příklad. Funkce \(\displaystyle y=x^2\) není prostá na \(\displaystyle \mathbb R\) a proto zde nemá inverzní funkci. Pokud definiční obor funkce \(\displaystyle y=x^2\) zúžíme na nezáporná čísla, tj. požadujeme \(\displaystyle x\geq 0\), je taková funkce prostá a má inverzní funkci. Protože tato úloha má praktický význam, vyplatí se pro tuto inverzní funkcí zavést speciální označení. Jak dobře víme, inverzní funkcí je druhá odmocnina, tj. funkce \(\displaystyle y=\sqrt x\).
2.8.3. Newtonova metoda#
Newtonova metoda (též Newtonova Raphsonova metoda) je metoda pro numerické řešení rovnic. To používáme v případě, že není možné (nebo není účelné) řešit rovnici přesně a snažíme se najít přibližné řešení. Například neznáme inverzní funkci, nebo s touto funkcí neumíme pracovat.
Budeme hledat řešení rovnice
Z lineární aproximace funkce \(\displaystyle f\) v bodě \(\displaystyle x_0\)
Příklad. Zkusme najít číslo takové, jehož kosinus je stejný jako toto číslo. Rovnici
0.7503638678402438930349423066821768532469930658553590309665831
0.7391128909113616703605852909048902340028928367356569073234079
0.7390851333852839697601251208568043328895331231701889796312306
0.7390851332151606416617026256850263723252232625296426915134025
0.7390851332151606416553120876738734040134207763670352584051590
0.7390851332151606416553120876738734040134117589007574649656806
0.7390851332151606416553120876738734040134117589007574649656806
Vidíme, že proces opravdu neuvěřitelně rychle konverguje k řešení rovnice. Rychlost konvergence je důležitá, pokud je výpočet funkční hodnoty „drahý“. Například při modelování namáhání dřevěné konstrukce s nelineární charakteristikou aproximujeme rovnici pomocí konečných diferencí soustavou rovnic, která má desítky tisíc proměnných. Každé kolo iterační metody vyžaduje mnoho výpočtů a rychlost konvergence je zásadní.
Úkol(Ad hoc iterace)
Newtonovu metodu je možné chápat také tak, že rovnici
a poté hledáme iteracemi
Příklad (ad hoc iterace). Například rovnici
0 0.857142857142857
1 0.922889272327007
2 0.896366455780602
3 0.907775917517455
4 0.902989981267125
5 0.905019667139163
6 0.904162819564782
7 0.904525248412642
8 0.904372074163256
9 0.904436833065177
Vidíme konvergenci a iterační vzorec jsme našli s minimálním úsilím. Rychlost konvergence však není nijak velká a riziko, že výpočet nebude konvergovat roste se složitostí rovnice a silně závisí na zkušenostech uživatele s touto technikou. Newtonova metoda
0 0.909090909090909
1 0.904428379310109
2 0.904417592410086
3 0.904417592352745
4 0.904417592352745
2.9. Shrnutí, hlavní myšlenky#
Derivace udává trend ve změnách veličin a díky tomu umožňuje za určitých okolností nahrazovat komplikované funkční vztahy pomocí vztahů lineárních. Toto nazýváme lineární aproximace a je to jedna za zásadních metod, jak si inženýři zjednodušují úlohy, které by byly jinak neřešitelné.
Derivace dokáže detekovat růst a klesání funkce a díky tomu dokážeme také detekovat body, kde se růst zastaví a změní na klesání nebo naopak. Tyto body nás přirozeně zajímají, protože v těchto bodech je studovaná veličina maximální nebo minimální a to má dopad při minimalizaci nákladů, maximalizaci pevnosti či zisku a jiných úlohách z praktického života.
Pokud trend (rychlost změny, derivace) nestačí k podchycení zásadních vlastností veličiny (nastává v lokálním extrému nebo v případě, že potřebujeme lepší aproximaci, než je aproximace lineární), máme k dispozici nástroje i v tomto případě: derivace vyšších řádů a Taylorův polynom.