Analys 360 En webbaserad analyskurs Grundbok Ekvationslösning och inversa funktioner Anders Källén MatematikCentrum LTH [email protected] Ekvationslösning och inversa funktioner 1 (9) Introduktion I det här kapitlet ska vi diskutera hur man löser en ekvation f (x) = y. Vi börjar med en diskussion om hur man grafiskt ser hur många lösningar det finns och ungefär vilka de är. Därefter diskuterar vi Newtons metod som numeriskt kan bestämma dessa nollställen till önskad precision. Därefter fokuserar vi på situationen när det finns precis en lösning till ekvationen (funktionen sägs då vara injektiv). Då kommer lösningen x att bli en funktion av högerledet y, en funktion som kallas inversen till den ursprungliga funktionen. Vi diskuterar hur vi kan skissera grafen för denna invers utifrån grafen för ursprungsfunktionen, samt hur vi kan bestämma inversens derivata. I samband härmed härleder vi också den viktiga kedjeregeln för derivation av sammansatt funktion. Ekvationslösning Att lösa en ekvation f (x) = y innebär att vi för fixt y vill hitta alla x som löser denna ekvation. För att få reda på hur många lösningar som finns och ungefär var dessa ligger kan man i en variabel ofta använda sig av grafritning. Exempel 1 För att se hur många lösningar ekvationen f (x) = y har för olika y när f (x) = x4 − 4x3 − 20x2 + 25, skisserar vi först grafen för funktionen. Vi ser att limx→±∞ f (x) = ∞, samt att f 0 (x) = 4x3 − 12x2 − 40x = 4x(x + 2)(x − 5). Vi ser att f har stationära punkter i x = −2, 0, 5 och att vi får följande teckentabell: x: −2 0 5 0 f (x) − 0 + 0 − 0 + f (x) & −7 % 25 & −350 % Vi har därför lokala minima i x = −2, 5 och ett lokalt maximum i x = 0. Grafen till funktionen är ritad till höger. Från denna graf kan vi nu avläsa hur många lösningar ekvationen f (x) = a har för olika a, genom att se efter hur många skärningar vi har mellan grafen y = f (x) och den horisontella linjen y = a (några av vilka är ritade röda figuren). Vi ser att svaret kan sammanfattas i följande tabell y −4 −3 −2 100 80 60 40 20 −1 −20 −40 −60 −80 −100 −120 −140 −160 −180 −200 −220 −240 −260 −280 −300 −320 −340 1 2 3 4 5 6 7 8 0 1 2 3 4 a < −350 a = −350 −350 < a < −7 a = −7 eller a = 25 −7 < a < 25 9 10 x Ekvationslösning och inversa funktioner 2 (9) Men detta ger oss endast antalet rötter. Hur får vi reda på t.ex. vilka nollställena är? En metod ska diskuteras i nästa avsnitt. Låt oss dock först göra följande observation. Om vi byter x mot y får vi en kurva x = f (y) som vi kan rita på följande sätt: vi speglar kurvan y = f (x) i linjen y = x. Detta kan alternativt göras så att vi roterera kurvan y = f (x) ett kvarts moturs och därefter speglar den i y-axeln. Vi får följande kurva y 10 5 −350 −300 −250 −200 −150 −100 −50 50 100 x −5 Vad kurvan visar är vilka lösningar vi får till ekvationen f (x) = y: vi tar x = y i figuren och ser efter vilka värden vi då får. Detta är illustrerat med y = −50 genom att vi ritat ut den röda linjen x = −50 och ser efter var den skär den blå kurvan. Motsvarande y-värden ger de x-värden som är lösningen på ekvationen[1] Som tabellen ovan och figuren till höger visar får vi (med undantag för x = −350) flera värden till ett givet x-värde, så denna kurva är inte en graf till en funktion. En kurva är endast graf till en funktion om varje x ger precis ett y. Numerisk bestämning av ett rot Vi ska nu se hur vi kan bestämma ett närmevärde till en lösning till en ekvation f (x) = y. Det räcker om vi diskuterar fallet y = 0, för om vi har ett annat högerled, t.ex. f (x) = 10, så kan vi använda vad vi kommer fram till på funktionen x → f (x) − 10. Vi börjar med ett exempel. Exempel 2 För funktionen f (x) = x3 − 3x + 1 gäller att f 0 (x) = 3(x2 −1), så de stationära punkterna är x = ±1. Ett teckenstudium ger att x = −1 är ett lokalt maximum i vilket funktionen tar värdet 3, medan x = 1 är ett lokalt minimum i vilket funktionen tar värdet −1. Det följer därför att det måste finnas ett nollställe till polyomet någonstans i intervallet −1 < x < 1. Men hur ska vi hitta den? Ekvationslösning och inversa funktioner 3 (9) Problemet vi ska diskutera är att hitta en lösning till en ekvation f (x) = 0 som ligger i närheten av någon punkt x0 . Vi vet då att nära x0 gäller att f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ). Det betyder att ekvationen f (x) = 0 är approximativt ekvationen f (x0 ) + f 0 (x0 )(x − x0 ) = 0, vilken har lösningen (vi antar att f 0 (x0 ) 6= 0) y 0 f( )= x0 ′ f( )(x x0 Detta ger naturligtvis i allmänhet inte den sökta lösningen, men har vi tur har vi fått en bättre approximation än den vi startade med. y− x = x0 − f (x0 )/f (x0 ). − ) x0 Låt oss kalla den nya approximationen x1 . Geometriskt innebär diskussionen ovan att vi dragit tangenten till kurvan y = f (x) i punkten x0 och bestämt dess skärning x = x1 med x-axeln. Det vi hoppas är att denna punkt ligger närmare den sanna roten än vad vår startpunkt x0 gjorde. y = f (x) x0 x1 x Vi kan sedan dra tangenten till grafen för f i den nya punkten x1 och bestämma en ny approximation x2 till roten till ekvationen f (x) = 0 som skärningen mellan den och x-axeln. Och så vidare, tills vi inte ser någon ändring i värdena vi får fram. Exempel 3 Vi fortsätter exemplet ovan och använder då till 1 f (x0 ) =0− = x1 = x 0 − 0 f (x0 ) −3 x0 = 0. Formeln ovan leder 1 . 3 Vi kan nu upprepa detta med x1 = 1/3 som nytt x0 , och får ett nytt närmevärde x2 = x1 − 1 1/27 f (x1 ) = − = 0.3472. 0 f (x1 ) 3 −8/3 Fortsätter vi denna process ett par gånger finner vi x3 = 0.3473, x4 = 0.3473, x5 = 0.3473. Vi ser att dessa fyra decimaler inte ändrar sig hur länge vi än håller på. Rimligtvis har vi bestämt det okända nollstället med fyra decimaler. Denna metod att förbättra ett närmevärde x0 till en rot till ekvationen f (x) = 0 genom att successivt definiera x1 , x2 , . . . genom relationen xn+1 = xn − f (xn ) f 0 (xn ) Ekvationslösning och inversa funktioner 4 (9) kallas Newton-Raphsons metod. Det går att visa att om vi bara börjar tillräckligt nära den okända roten, så kommer processen att konvergera mot denna[2] . Det finns dock ingen garanti för konvergens i det enskilda fallet, som nästa exempel visar: Exempel 4 I närheten av x = 4 har polynomet f (x) = −x3 + 2x2 + 5x + 6 ett nollställe. Om vi ställer upp Newton-Raphsons algoritm med startvärdet x0 = 1, så finner vi att x1 = −1, x2 = 1, x3 = −1, x4 = 1, och så vidare. Vi ser alltså att vi inte får konvergens mot något nollställe. y 15 10 5 −2 −1 1 2 3 4 x Detta beror delvis på att vi började för långt ifrån det riktiga nollstället. Att det blev en 2-cykel beror till stor del på att vi hoppar runt ett lokalt minimum. Inversa funktioner Om ekvationen f (x) = y har högst en lösning för alla y, säger man att funktionen f är injektiv. Låt Vf beteckna de y för vilka ekvationen har en lösning. Den mängden kallas funktionens värdemängd. Låt vidare Df beteckna de x för vilka f är definierad – en mängd som kallas funktionens definitionsmängd. Då gäller alltså att f : Df → Vf . Att funktionen är injektiv innebär då att det till varje y ∈ Vf finns precis ett x ∈ Df . Denna process definierar en funktion Vf → Df som kallas inversen till f och betecknas f −1 . Exempel 5 Om vi sätter f (x) = x2 , som är definierad för alla x, så gäller att Vf = {y; y ≥ 0}. Ekvationen f (x) = y, alltså x2 = y, är då lösbar för alla y ≥ 0. Det √ finns två lösningar om y 6= 0, nämligen x = ± y, så funktionen är inte injektiv. Om vi emellertid inskränker definitionsområdet till de x som är sådana att x ≥ 0, så är funktionen injektiv och ekvationen entydigt lösbar. Den inversa funktionen är √ precis den funktion som vi har gett “namnet” (beteckningen) . Ekvationslösning och inversa funktioner 5 (9) Om vi har grafen till en injektiv funktion så kan vi rita grafen till dess invers utan att behöva veta vilket uttryck som definierat den ursprungliga funktionen. Att det är så beror på den fundamentala relationen f (x) = y ⇔ y 3 y = f (x) 2 x = f −1 (y). y = f −1 (x) 1 De två ekvationerna här definierar alltså samma kurva, men när vi vill rita grafen till f −1 så ska vi rita kurvan y = f −1 (x). Detta innebär att rita kurvan f (y) = x, och vi såg i början av kapitlet att vi gör det genom att spegla kurvan y = f (x) i linjen y = x. 1 2 3 4 x Figuren till ovan till höger visar detta för√funktionen f (x) = x2 , x ≥ 0. Grafen till f är den blå kurvan och dess invers, f −1 (x) = x är den röda kurvan. √ 1 På samma sätt kan vi definiera funktionen x n = n x som invers till funktionen y = xn , x ≥ 0 för ett godtyckligt heltal n 6= 0. Anmärkning Om n är udda, så gäller att funktionen xn är en funktion från R → R, sådan att dess invers x1/n kan definieras√för alla x. Det betyder√att medan uttrycket √ −2 inte finns som reellt tal, så finns 3 −2 och är lika med − 3 2. Dock är inversen inte deriverbar i origo (varför?[3] ) Derivatan av en invers Vi kan också beräkna derivatan av en invers funktion uttryckt i derivatan av den ursprungliga funktionen. Ett sätt att göra det är rent geometriskt och illustreras i figuren till höger. I den använder vi beteckningen dy = y − f (a) och dx = x − a. I ord visar figuren följande. Grafen till den ursprungliga funktionen ges av ekvationen y = f (x) och dess tangent i punkten x = a har ekvationen y dy = f ′ (a)dx y = f (x) y − f (a) = f 0 (a)(x − a). dy = Speglar vi tangenten i linjen y = x får vi tangenten till kurvan y = f −1 (x) och den speglade tangentens ekvation är y ′ )d f (a y = f −1 (x) ⇔ x = f (y) a x − f (a) = f 0 (a)(y − a). 1 dx ) f′ (a x= ⇔d f (a) x Den är tangent till kurvan y = f −1 (x) i punkten b = f (a), vilket innebär att a = f −1 (b). Med andra ord, kurvan y = f −1 (x) har en tangent i punkten b = f (a) (och är därför deriverbar där) som har ekvationen y − f −1 (b) = 1 (x − b). f 0 (a) Ekvationslösning och inversa funktioner 6 (9) Det i sin tur betyder att vi har visat följande sats Sats 1 Låt f vara en injektiv funktion med invers f −1 . Om f är deriverbar i punkten a med f 0 (a) 6= 0 och inversen är kontinuerlig i f (a)[4] , så är f −1 deriverbar i punkten b = f (a) med derivatan 1 (f −1 )0 (b) = 0 . f (a) Beviset ovan är rent grafiskt, och kan inte generaliseras till funktioner av fler variabler. Vi kompletterar därför med ett bevis som bygger direkt på definitionen av derivatan. (Det är dock samma bevis.) Bevis. Eftersom f är deriverbar i a kan vi skriva f (x) − f (a) = A(x)(x − a) där A(x) är kontinuerlig i a. Om A(a) = f 0 (a) 6= 0 gäller att A(x) 6= 0 i någon omgivning av a, och för sådana x kan vi skriva x−a= 1 (f (x) − f (a)). A(x) Om vi inför den inversa funktionen i detta, x = f −1 (y), blir detta f −1 (y) − f −1 (b) = 1 A(f −1 (y)) (y − b). Men här är B(y) = 1/A(f −1 (y)) en kontinuerlig funktion av y nära b, och dess värde i b är 1/f 0 (f −1 (b)) = 1/f 0 (a). Därmed är satsen fullständigt bevisa[5] . 1 Exempel 6 Vi ska beräkna derivatan av funktionen x n . Vi vet då att denna är invers till funktionen f (x) = xn . Om vi ska beräkna värdet av inversens derivata i 1 en punkt b ska vi först hitta det a som är sådant att b = f (a) = an , alltså a = b n . Derivatan av f i den punkten är nu 1 f 0 (a) = nan−1 = n(b n )n−1 = nb så vi ser att (f −1 )0 (b) = Vi ser alltså att formeln (xn )0 = nxn−1 för bråk på formen 1/n. 1 n−1 n = n−1 n , 1 1 −1 bn . n nb gäller inte bara om n är ett heltal, utan även I nästa avsnitt ska vi se att denna derivationsformel gäller för alla rationella exponenter och i ett senare kapitel att den gäller för alla reella exponenter. Ekvationslösning och inversa funktioner 7 (9) Kedjeregeln Vi såg i föregående avsnitt att om α är ett heltal eller ett genom ett heltal så gäller att (xα )0 = αxα−1 . Vi vill nu visa att det gäller för godtyckliga rationella tal α = p/q genom att först bevisa en formel som är av mycket större betydelse än att den ger detta resultat. Formeln ifråga talar om hur man deriverar en sammansatt funktion och kallas kedjeregeln. Den sammansatta funktionen definieras som den funktion f ◦ g som beräknas genom (f ◦ g)(x) = f (g(x)). Sats 2: Kedjeregeln Låt f, g vara två funktioner sådana att den sammansatta funktionen f ◦g är definierad i punkten a, och antag att g är deriverbar i punkten a och f är deriverbar i punkten b = g(a). Då gäller att även f ◦ g är deriverbar i a och att (f ◦ g)0 (a) = f 0 (g(a))g 0 (a). Bevis. Enligt förutsättningarna kan vi skriva f (y) − f (b) = Af (y)(y − b), g(x) − g(a) = Ag (x)(x − a), där Af är kontinuerlig nära b och Ag är kontinuerlig nära a, och sådana att Af (b) = f 0 (b) och Ag (a) = g 0 (a). Men då följer med b = g(a) att f (g(x)) − f (g(a)) = Af (g(x))(g(x) − b) = Af (g(x))(g(x) − g(a)) = Af (g(x))Ag (x)(x − a). Vi kan alltså skriva (f ◦ g)(x) − (f ◦ g)(a) = A(x)(x − a), där A(a) = Af (g(a))Ag (a) = f 0 (g(a))g 0 (a). Detta bevisar kedjeregeln. Anmärkning Definition av den inversa funktionen innebär att (f ◦ f −1 )(x) = (f −1 ◦ f )(x) = x för alla x som uttrycken kan beräknas för. Båda formlerna innebär att x = f −1 (y) är lösningen på ekvationen f (x) = y, fast på lite olika sätt.[6] Om vi deriverar formeln (f −1 ◦ f )(x) = x får vi enligt kedjeregeln att (f −1 )0 (f (x))f 0 (x) = 1 ⇔ (f −1 )0 (f (x)) = 1 , f 0 (x) vilket är formeln för derivatan av en invers funktion från ovan. Ekvationslösning och inversa funktioner 8 (9) p Exempel 7 Vi ska nu derivera funktionen h(x) = x q där p, q är heltal[7] . Vi observerar då att vi enligt potenslagarna kan vi skriva h(x) = f (g(x)), där f (x) = xp , 1 g(x) = x q . Enligt kedjeregeln har vi nu att 1 1 1 p p−1 1 p p h0 (x) = f 0 (g(x))g 0 (x) = pg(x)p−1 g 0 (x) = p(x q )p−1 x q −1 = x q + q −1 = x q −1 . q q q Anmärkning I ett tidigare kapitel härledde vi derivationsformeln (1/g)0 (a) = −g 0 (a)/g(a)2 om g(a) 6= 0 direkt från definitionen. Vi kan emellertid härleda den utifrån att (1/x)0 = −1/x2 och kedjeregeln också: 1 g 0 (a) ( )0 (a) = (f ◦ g)0 (a) = f 0 (g(a))g 0 (a) = − . g g(a)2 Vi avslutar detta kapitel med ett exempel som visar att det är viktigt att kunna identifiera sammansatta funktioner – att ha klart för sig vad en storhet är funktion av i varje situation. Exempel 8 Ett barn blåser långsamt upp en ballong genom att blåsa in 2 dl luft per sekund. Alldeles innan ballongen spricker är dess radie 6 cm. Hur snabbt sträcktes ballongytan vid detta ögonblick? För att lösa problemet approximerar vi ballongen med en sfär. Vi vet att då gäller att om V är dess volym och S dess area när radien är r, så är 4 V = πr3 , 3 S = 4πr2 . Om vi löser ut r som funktion av V och stoppar in i uttrycket för S, får vi att √ 3 S(V ) = 36πV 2/3 . Men här ändrar sig V , och alltså S, med tiden, eftersom S(t) = S(V (t)). Deriverar vi denna formel med avseende på t genom att använda kedjeregeln får vi att S 0 (t) = S 0 (V (t))V 0 (t) = √ 3 2 36π V −1/3 V 0 (t). 3 Vi har att V 0 (t) = 2 då ballongen spricker, vilket sker då V (t) = 4π63 /3. Stoppar vi in detta får vi att √ 2 3 36π 2 2 0 p S (t) = · 2 = · 2 = cm2 /s. 3 3 6 4π/3 6 3 Ekvationslösning och inversa funktioner 9 (9) Anmärkning I det här exemplet har vi använt samma namn S på vad som egentligen är olika funktioner. Vi har en funktion S(V ) som beskriver S som funktion av V . Vi har också en funktion som beskriver S som funktion av t, som vi skrivit S(t). Om funktionen V (t) beskriver volymen som funktion av tiden så gäller att S(t) = S(V (t)). Förvirrande? Behöver inte vara så om vi istället tänker på S som en variabel som vi ibland beskriver hur den beror av V , ibland hur den beror av t. Lägg märke till att kedjeregeln ofta skrivs på formen dS dV dS = , dt dV dt vilken innehåller precis den beskrivna oegentligheten. Noteringar 1. Förvirrande med hoppandet mellan x och y? Det är just detta som är problemet med invers funktion som detta kapitel handlar om. 2. Detta diskuteras t.ex. i artikeln Grafisk analys av en skalär rekursion 3. För heltal n > 1 gäller att derivatan av x → xn är noll i origo. Dess tangent är alltså horisontell, vilket betyder att inversens tangent är vertikal. 4. Detta villkor är uppfyllt t.ex. om f är deriverbar i en omgivning av a med kontinuerlig derivata. 5. Notera att vi behövde veta att inversen var kontinuerlig för att kunna dra slutsatsen att B är det. 6. Formeln (f ◦ f −1 )(x) = x betyder att ekvationen f (y) = x har lösningen y = f −1 (x), medan ekvationen (f −1 ◦ f )(x) = x betyder x = f −1 (y) är sådant att f (x) = y. 7. För definitionen av xp/q , se Arbetsbladet om potenser och potenslagar.