Empirisk modellering Finna funktionella samband ur en mängd data från lab eller fält regression Beskriva en mängd data från lab eller fält interpolation Regression Exempel med funktioner Med en så enkel som är i det närmaste funktion som möjligt få ‘ickelinjära’, dvs linjär samma relation mellan kombination av en eller flera oberoende elementära funktioner variabler och en beroende variabel som datamängden uppvisar Exempel med funktioner som beror av flera variabler, t ex en yta (multipel regression) Kurvlinjära funktioner linjär kombination av elementära funktioner I växande ordning Logaritm funtionen potens funktionen exponentialfunktionen Periodisk funktion Asinwx+Bcoswx båda för lösa fasskift y=bf(x)+cg(x)+dh(x) detta är en linjär kombination av funktionerna f,g och h konstanterna b,c och d kan bestämmas med minsta kvadratmetoden analogt med enkel linjär regression Multiplikation av två funktioner af(x) - vertikal g(x)f(x) - är oftast en g(x)f(x) - g(x)sin(x) - oscillerar förändring f(ax) - horisontell förändring f(x) förändras vertikalt enligt g(x) komplicerad funktion men g(x)sin(x) är dock enkel mellan g(x) och -g(x) t ex xsin(x) oscillerar mellan x och -x Transformera till linjär ekvation Exponential ekvationen Potensfunktionen y=Axb y=Aerx ln(y)=ln(Aerx) ln(y)=B + rx, B=ln(A) dvs log y-axeln ln(y)=lnA+bln(x) dvs log både x och y- axeln Ickelinjära modeller som ej kan linjäriseras Logistiska ekvationen går ej att linjärisera Metod: Bestäm ett minimum för n funktionen e ( y (ti ) yi ) 2 i 1 dvs minsta kvadratmetoden i annan tappning y(xi) - är din funktion som du försöker anpassa till dina n st datapunkter yi Interpolation Bra metod när man vill beskriva sina data med en kurva eller yta istället för en massa punkter Du är alltså inte intresserad av det funktionella sambandet som förklaring utan snarare vill binda samman dina punkter Exempel på interpolation Ett polynom av graden n-1 kan alltid fås att gå igenom n data punkter men polynom över 3 eller 4 ger väldigt oscillerande kurvor dock genom punkterna Har du bara 3 - 4 punkter kan du alltså lika gärna anpassa ett polynom Splines: styckvisa polynom Varje par av punkter har sin egen anpassade polynom linjär spline interpolation blir räta linjer mellan varje par kvadratisk spline är paraboler mellan varje par. Här kan derivatan i vänstra punkten bestämmas till derivatan i denna punkt för den föregående parabolen. Kubisk spline: både 1:a och 2:dra derivatan blir samma i punkterna Multipel regression Istället för att anpassa en linje så skall man anpassa ett plan eller hyperplan (om fler än två oberoende variabler) Frågan man kan ställa sig är om man behöver alla variabler för att prediktera den beroende variabeln. Även om regresionen i sig är signifikant så kan det vara för många oberoende variabler. Orsak: ingen korrelation och stor spridning utmed extra variabeln Onödiga variabler Den ‘överblivna’ variabeln kan dock vara signifikant om man studerar den enskilt. Dock har de andra variablerna redan förklarat den variation som finns så variationen kvar ‘räcker’ inte till en variabel till (i dess dimension)