ENTROPI I TERMODYNAMIKEN Entropi är ett grundläggande begrepp i fysiken i likhet med energibegreppet. Entropi förekommer förstås i klassisk termodynamik, men också t ex i kvantmekaniken, hydrodynamik och teorin för svarta hål. Entropi är av intresse när man studerar övergångar mellan makroksopiska fysikaliska tillstånd, eller det mest sannolika makroskopiska tillståndet. Inom termodynamiken har det utvecklats olika sätt att definera, införa och använda entropin i teorin (själva benämningen "entropi" lanserades av Clausius 1865). Den klassiska metoden (Clausius, Thomson, Clapeyron) deifinerar entropin utgående från Carnots kretsprocess. Systemen postuleras sträva mot maximal entropi. Carathédorys (1909) namn är förknippat med en matematiskt orienterad introduktion av entropin. Gibbs ansats står närmare en fenomenologisk teori där de termodynamiska variablerna antas vara definerade experimentellt, liksom deras tillståndsekvation (equation of state). Den av Gibbs och Boltzmann utvecklade statistiska fysiken ger termodynamiken ett mikroskopiskt (mikrofysikaliskt) grundval. Senare har tillkommit termodynamik för irreversibla processer (Onsager, Truesdell, Prigogine, m fl) där entropin användes för att sätta begränsningar på de konstitutiva ekvationerna. 1. Termodynamiska tillståndsfunktioner En ideal gas satisfierar tillståndsekvationen (1) pV = nRT. Här betecknar p trycket, V är gasens volym, n är mängden gas i mol, R är gaskonstanten, och T betecknar den absoluta temperaturen. Relationen (1) kan förstås skrivas som p = cRT, där c betecknar den molara koncentrationen (mol per volymenhet), vilket också gäller för en gas som inte begränsas av en "behållare" (t ex gas i atmossfären). För en fix mängd (n) ideal gas är alltså tillståndet entydigt fastställt då vi känner två av de termodynamiska variablerna (eller funktioner); t ex, temperaturen och volymen. Tillståndsekvationen (1) kan beskrivas som en yta i (p, T, V)-rymden (fasrummet). För reella ämnen kan dylika tillståndsytor i fasrummet fastställas experimentellt. Ett ämnes förändring (för sk reversibla processer) kan följas som en kurva längs tillståndsytan i fasrummet. Varje ämne karaktäriseras också av dess inre energi, vanligen betecknad med U. Föreställer vi ämnet som bestående av partiklar är ämnets inre energi summan av partiklarnas kinetiska och potentiella energi V (enligt Newtonsk mekanik), (2) U = ½ ∑ mi vi2 + V(x1,...,xN). Ekv (2) modifieras när vi hamnar att beakta relativistiska eller kvantmekaniska effekter. Däremot gäller energilagen, eller termodynamikens första lag, generellt, (3) δQ = dU + δW (δ[värme] = d[inre energi] + δ[arbete]). Vi kan ge ett exempel för att förklara innebörden för relationen (3). Antag vi upphettar en gas i en cylinder med rörlig kolv. Genom upphettningen tillförs gasen värmemängden δQ (energi som överförs mellan ämnen kallas av tradition för värme). Om kolven hålls fixerad kan gasen inte uföra arbete (δW = 0), och allt värme går till dess inre energi (δQ = dU) som yttrar sig i en ökning i gasens temperatur (molekylernas kinetiska energi ökar). Om gasen får skjuta på kolven en aning, så att volymen ökar med dV, går endel av värmen till detta "arbete", δW = pdV. Ekv (3) uttrycker alltså energins bevarelse. (Är vi riktigt noggranna borde vi också räkna med kolvens kinetiska energi ½ mv2 och ersätta U i (3) med U + ½ mv2.) Till skillnad från värmet Q och arbetet W, är inre energin U en termodynamisk tillståndsfunktion. Detta betyder att om en gas expanderar från tillståndet (p1,V1) till (p2,V2), då är förändringen ∆U en funktion endast av ändtillståndena, ∆U = U(p2,V2) U(p1,V1), medan t ex arbetet ∆W som utföres under denna expansion beror på själva förloppet, (4) ∆W = ∫ pdV Γ där Γ är den bana som expansionen beskriver i fasrummet. För samma ändpunkter kan förloppet Γ (banan som förbinder ändpunkterna) vara olika, och därmed också värdet (4). [Det är en aning ologiskt att bruka beteckna förändringen i värmen (arbetet) med dQ (dW), eftersom detta inte är en differential utan en differentialform. Vi använder beteckningen δQ för en differentialform som generellt kan skrivas, (5) δQ = f(p, V)dp + g(p, V)dV. Uttycket (5) är en differential (el. exakt differentialform) endast om det finns en funktion h sådan att f = ∂h/∂p och g = ∂h/∂V, som innebär att δQ = dh, och att (6) ∂f/∂V = ∂g/∂p (villkor för att (5) skall vara en differential). Vi definerar differentialoperatorns verkan på en differentialform (5) enligt, (7) dδQ =(∂f/∂V) dV ∧ dp + (∂g/∂p) dp ∧ dV. Kilprodukten dV ∧ dp är antisymmetrisk bilineär 2-form, dp ∧ dV = - dV ∧ dp. 2formen dV ∧ dp kan defineras som dV ⊗ dp - dp ⊗ dV. 1-formen dp applicerad på en vektor W = Wp ∂p + WV ∂V i (p.V)-planet ger komponenten Wp längs p-axeln. För två vektorer A och B ges dV ⊗ dp(A, B) = AVBp, och dV ∧ dp(A, B) ger den orienterade ytan som uppspänns av vektorerna i (p,V)-planet. Speciellt gäller dp ∧ dp = dV ∧ dV = 0. Integralen av en 2-form f(x,y) dx ∧ dy över en yta M är det samma som den orienterade ytintegralen, (8) ∫∫ f(x,y) dx ∧ dy = ∫∫ f(x,y) dx dy. M M Ifall Γ = ∂Μ är en sluten kurva och randen till ett område M, och α betecknar en 1-form definerad över M, kan Stokes teorem skrivas som, (9) ∫α ∂M = ∫∫ dα. M Ifall integralen ∫ α mellan två punkter är oberoende av vägen däremellan, försvinner (för varje område M) vänstra membrum i (9), villket innebär att dα = 0. 2-formen (7) kan skrivas som {(∂f/∂V) - (∂g/∂p)} dV ∧ dp, vilken försvinner exakt då villkoret (6) gäller. Allmänt, en 1-form α är en exakt differentialform om och endast om dess differential dα försvinner överallt, dα = 0. För differentialformer α gäller den generella identiteten d2α = ddα = 0.] Med hjälp av den inre energin U kan vi definera en ny tillståndsfunktion kallad entalpi, (5) H = U + pV. För en gas med δW = pdV, har vi δQ = dH + Vdp. Detta betyder att för en isobarisk process (dp = 0) är värmetillskottet δQ lika med entalpiförändringen dH. Entalpi har därför kommit till användning för att beräkna reaktionsenergin vid kemiska reaktioner som ofta sker vid konstant tryck. 2. Entropi och statistisk fysik Karaktäristiskt för kemiska reaktioner och andra tillståndsförändringar är att de går i en viss riktning tills en stationär jämvikt möjligen uppnås. Försätts två termodynamiska system i kontakt med varandra så att de kan utbyta energi eller materia, då söker sig det sammansatta systemet till ett nytt jämviktstillstånd. Ekv (1) är otillräcklig för att ange vilken riktning processen kommer att ta. Med enbart energilagen kan man inte t ex förutse huruvida värme strömmar från en kallare kropp till en varmare, eller tvärtom. Från klassisk dynamik är det bekant att dynamiska systems jämviktstillstånd sammanfaller med en minimipunkt för deras potential. Ifall vi minimerar U direkt för en ideal gas, innebär detta enligt (2) (för en ideal gas gäller V = 0), att molekylernas hastighet är noll och därmed också temperaturen. Frågan inställer sig hur vi skall gå till väga för temperaturer T > 0. V x* Kulans jämviktsläge är vid potentialens minimiställe, x*. En tanke kanske är att minimera U beaktande villkoret T = konstant > 0. Härvidlag kan man använda sig av Lagranges multiplikator metod och beakta villkoret genom att minimera funktionen (6) F = U - λT, där λ är en parameter, Lagrange multiplikatorn. Problemet är dock, att systemets termodynamiska jämviktstillstånd inte motsvarar ett unikt mikroskopiskt tillstånd, vilket minimeringen av (6) leder till om vi uttrycker energin i term av de mikroskopiska variablerna (molekylernas läge och hastighet i kinetisk teori). Ett och samma makroskopiska tillstånd (definerad exempelvis av ett bestämt temperaturvärde T och tryck p) motsvarar egentligen en mängd olika mikroskopiska tillstånd. Antag att man väljer en annan metod och löser rörelseekvationerna för alla molekyler för en gas i en volym V (deras antal kan vara i storleksordningen 1023 ). Men denna metod återförs vi till frågan molekylernas initialtillstånd som vi behöver känna till för att lösa rörelseekvationerna. Utvägen har varit att tillgripa en statistisk beskrivning. Ett makroskopiskt tillstånd motsvarar en statistisk fördelning av de mikroskopiska tillstånden. Som grunden för statistisk fysik ligger postulatet om lika a priori sannolikhet: varje mikroskopiskt tillstånd för gasen i volymen V, med samma totalenergi, har samma sannolikhet. Vi kan generalisera (efter W Gibbs) ansatsen och betrakta en ensemble, ett stort antal (ℵ) kopior av systemet med samma volym V och antal partiklar N, vilka är i termisk kontakt med varandra. Antag att systemen har de diskreta energinivåerna Ej. Antag vidare att vi har en fördelning i ensemblen, betecknad n, där nj av systemen har energin Ej. Kombinatoriskt räknat finns det (7) Ω(n) = (∑ nj.)!/ ∏nj! sätt att fördela energin mellan systemen för en distribution n. Postulatet om "lika a priori sannolikhet" innebär i detta fall att den relativa sannolikheten för fördelningen n att förekomma i ensemblen är proprtionell till (7). Man resonerar vidare (ett matematiskt resonemang), att för stort ℵ (ℵ ρεφ ∞) är (7) skarpt koncentrerad kring den "representativa" fördelningen n* som maximerar Ω(n), under villkoren (8) Etot = ∑ nj Ej (totalenergin konstant), ℵ = ∑ nj. För att bestämma fördelningen n*, som maximerar Ω(n), visar det sig räknemässigt vara enklare att använda dess logaritm, In Ω(n) (Stirlings approximation kan då tillämpas direkt.) Använder vi Lagranges multiplikatormetod för att variera In Ω(n) med villkoren (8), samt begagnar Stirlings approximation, In k! ≈ k In k - k, erhåller vi ekvationen, (9) 0 = δ(In Ω(n) − α∑ nj - β∑ nj Ej) = ∑ (In (∑ni) − In nj* - α - β Ej)δ nj som har lösningen (α och β är Lagranges multiplikatorer) (10) nj* = ℵ exp(−α) exp(-β Ej). På grund av villkoret (8) kan vi skriva, (11) nj* = ℵ exp(-β Ej)/Z, och sannolikheten Pj = nj*/ℵ för tillståndet j blir, (12) Pj = exp(-β Ej)/Z, med tillståndssumman Z (Z efter Zustand) definerad genom (13) Z = ∑ exp(-β Ei). Medelenergin E = Etot/ℵ för fördelningen n* kan nu skrivas (14) E = ∑ Pj Ej. Vi identifierar E (14) med den inre energin U i termodynamiken. Då ger ekv (14) (15.a) dU = ∑ (dPj Ej + Pj dEj) = (15.b) -(1/β) ∑ (In Pj + In Z) dPj + ∑ Pj (∂Ej/∂V)dV ⇒ (15.c) -(1/β) d [∑ Pj In Pj] = dU + [- ∑ Pj (∂Ej/∂V)] dV (Observera att ∑ dPj = 0 eftersom ∑ Pj = 1). Jämför vi (15.c) med termodynamikens första lag på formen δQ = dU + p dV, kan vi göra gissningen att trycket p ges av (16) p = - ∑ Pj (∂Ej/∂V), samt att värmetillskottet δQ är relaterat till fördelningen Pj genom (17) δQ = -(1/β) d [∑ Pj In Pj] . Nämligen, den första delen av högra membrum i (15.a), ∑ dPj Ej, anger hur den inre energin förändra pga en förändring dPj besättningen av energinivåerna. Om värme tillförs systemet, då kommer t ex de högre energinivåerna att befolkas mera än de lägre. Termen ∑ dPj Ej har alltså med värmetillskottet att göra. Den andra termen, ∑ Pj dEj, anger hur den inre energin ändras pga ändringar dEj i energinivåerna. Om exv systemet expanderar med volymen dV, måste atomerna göra arbete och deras totala energi förändras med - pdV. Detta leder till relation (16). (För funktionen Ej(N,V) har vi i detta fall dEj = (∂Ej/∂V)dV eftersom N är konstant.) Vi kan skriva (17) som δQ = (1/β) dS om vi definerar entropins tillståndsfunktionen S genom, (18) S = - ∑ Pj In Pj . Ekv (15.c) kan nu skrivas, (19) (1/β) dS = dU + p dV Parametern β, en tillståndsfunktion, karaktäriserar också systemet, och är relaterad till den inre energin genom kravet (8). Relationen δQ = (1/β) dS innebär, att om vi multiplicerar δQ med tillständsfunktionen β erhåller vi en exakt differential dS = β δ Q. Beräknar vi ånyo In Ω(n) med hjälp av Stirlings approximation, kan vi skriva, (20) In Ω(n) ≈ ℵ In ℵ - ∑ nj In nj = -ℵ ∑ (nj/ℵ) In (nj/ℵ) = −ℵ∑ Pj In Pj , dvs, In Ω(n) är proportionell till entropin S (18). Vi har alltså funnit systemets jämviktstillstånd ("mest sannolika tillstånd") genom att maximera entropin. Betrakta två system K' och K'', karakteriserade av β-värdena β' och β'', som är termisk kontakt tills de uppnår jämvikt med varandra. Vi argumenterar, att för termisk jämvikt måste vi ha β' = β''. Ty, upprepar vi föregående resonemang för en ensemble med det sammansatta systemet K' + K'' får vi en fördelning av typen Pij = exp[-β (E'i + E''j)]/Z'Z'' = exp[-β E'i]/Z' × exp[-β E''j]/Z'', vilket visar att systemen har samma β-värde. Definerar vi temperaturen T genom T = 1/β, betyder detta att system i termisk jämvikt har samma temperatur. (Senare skriver vi kT = 1/β, där k betecknar Boltzmanns konstant. Detta innebär att man väljer en speicell absolut temperaturskala.) Ekv (19) kan skrivas, (21) T dS = dU + p dV, vilken är den bekanta formen från termodynamiken. Relationen (21) gäller för reversibla processer i termodynamiken, dvs "kvasistatiska" processer som kan tänkas ske i små steg från ett jämviktstillstånd till nästa. Ekv (15) gäller ju för en infinitesimal förändring från ett jämviktstillstånd. Varje mellanliggande tillstånd i den reversibla processen har alltså väldefinerat tryck, temperatur, osv. En process som inte uppfyller dessa krav är irreversibel. Eftersom δQ = T dS för en reversibel process, kan vi definera, enligt Clausius, entropin för reversibla processer genom, (21.1) dS = δQ/T (Clausius' definition 1865 av entropi vid reversibla förändringar). Vi observerar, att eftersom "sannolikheten" Ω för det sammansatta systemet K' + K'' är en produkt, Ω = Ω' × Ω'', är entropin i detta fall additiv, S = S' + S'', emedan In Ω = In Ω' + In Ω''. 3. Carnot cykeln och termodynamikens andra huvudsats "As anyone who has taken a course in thermodynamics is well aware, the mathematics used in proving Clausius' theorem is of a very special kind, having only the most tenous relation to that known to mathematicians". SG Brush, The Motion We Call Heat (1976), vol. 2, 581. "Nothing can be lost in the operation of the nature - no energy can be destroyed. What effect is then produced in place of the mechanical effect which is lost ? A perfect theory of heat impertively demands an answer to this question; yet no answer can be given in the present state of science ..." William Thomsons i ett försök 1849 att få rätsida på Carnots memoir, cit. i Brush, a.a. (s 569) . En intressant reversibel cyklisk process kan defineras (efter S Carnot, 1824) på följande sätt. Antag vi har två "stora" värmereservoarer med temperaturerna T1 och T1 > T2. Med "stor" avses att reservorernas temperatur inte kommer att påverkas under processens gång. Vi ställer en gas i en cylinder med kolv i termisk kontakt med reservoraren T1. Antag gasen absorberar en värmemängd ∆Q1 = T1(S2 - S1) under en isotermisk expansion (energin omvandlas till arbete), T = T1 = konstant, från en volym V1 till V2. Därefter isolerar vi cylindern och låter gasen expandera tills den nått temperaturen T2 och en volym V3. Denna process är adiabatisk, ingen värmeöverföring sker ∆Q = 0. Denna process är också isentropisk, eftersom dS = TδQ = 0. Därefter sätter vi kolven i kontakt med reservoaren T2 och låter gasen avge en värmemängd −∆Q2 = T2(S2 - S1) till reservoaren medan den komprimeras till en volym V4. Volymen V4 väljs så att vi genom en adiabtisk kompression från V4 når tillbaka till startvolymen V1 och temperaturen T1. S C B S2 ∆ Q1 = T1 (S2 - S1) −∆ Q2 S1 ∆ Q1 ∆ Q2 = T2 (S2 - S1) A D T T2 T1 Carnot cykeln beskriven med TS-diagram. Isomtermisk expansion från A till B, absorberar värme. Adiabatisk expansion från B till C, nedkylning. Isotermisk kompression från C till D. Adiabatisk kompression till utgångsläget A. Betraktar vi hela cykeln har vi ∆U = 0, eftersom vi återkommer till utgångsläget. För hela cyklen får vi alltså, (22) ∆Q = ∆W + ∆U = ∆W ⇒ ∆W = (T1 - T2)(S2 - S1). Förhållandet mellan arbetet ∆W och den tillförda energin ∆Q1 = T1(S2 - S1) blir, (23) η = ∆W/∆Q1 = (T1 - T2)/T1. Carnotcyklen omvandlar värme i arbete med effektiviteten angiven av η (23). Carnots slutsats var, att för en reversibel cykel är effektiviteten endast beroende av temperaturen T1 hos "källan" och T2 hos "kylaren". Omvänt kan resultatet (23) användas för att definera den absoluta temperaturen (förutom en konstant faktor). Kör man Carnotcykeln baklänges fungerar den som en värmepump som med hjälp av arbetsinsatsen ∆W absorberar värmemängden ∆Q2 vid temperaturen T2 och avger en värmemängd ∆Q1 till reservoaren med temperaturen T1. Härav inser man, att ifall det funnos en maskin som opererar mellan temperaturerna T1 och T2 med större effektivitet än Carnotcyklen, då vore en perpetuum mobile av andra slaget möjlig. (Perpetuum mobile av första slaget skapar energi.) Nämligen, om maskinen har en effektivitet η' > η, så ger den ett arbete ∆W' = η'∆Q > ∆W = η∆Q för en energiinsats ∆Q. Ifall vi uttnyttar arbetet ∆W för att med hjälp av den omvända Carnotcykeln återföra värmen ∆Q till källan, är vi tillbaka i utgångsläget (vi kan igen använda ∆Q för att producera arbete) men har vunnit ett nettoarbete ∆W' - ∆W > 0; dvs, vi har en perpetuum mobile. Termodynamikens andra huvudsats kan formuleras just som att perpetuum mobile av andra slaget är omöjlig. För termodynamikens andra huvudsats kan vi uppställa ett antal ekvivalenta formuleringar. (24.a) Perpetuum mobile av andra slaget omöjlig (24.b) Ingen maskin kan vara effektivare än den reversibla Carnotcykeln (Carnot) (24.c) Det finns ingen process vars enda resultat är en fullständig omvandling av värme i arbete (mao, det finns ingen maskin med effektiviteten η =1) (Kelvin) (24.d) Det finns ingen process vars enda resultat är överföring av värme från en kallare kropp till en varmare kropp (mao, värme kan inte spontant flöda från en kall kropp till en varm kropp) (Clausius 1854). Om exv värme spontant kunde strömma från en kallare kropp till en varmare kunde vi med hjälp av Carnotcykeln åstadkomma en perpetuum mobile. J Fourier som utvecklade teorin för värmeflöde (1808) var väl medveten om att det faktum att värme går från det varmare till det kallare motsvarade en sorts naturlag.om irreversibelt värmeflöde. Enligt definitionen av den reversibla Carnot cykeln är entropiförändringen för denna process noll, ∆S = 0. En alternativ formulering av temodynamikens huvudsats lyder, (24.e) Den totala entropin kan inte minska i någon process ("den totala entropin i universum går mot ett maximum", Clausius 1865). Antag, att vi har en maskin som cykliskt opererar mellan temperaturerna T2 och T1 så att den totala entropiförändringen (som för en cyklisk process är lika med omgivningens entropiförändring, ∆S = ∆Somg + ∆Smask = ∆Somg) blir negativ, (25) ∆S = −∆Q1/T1 + ∆Q2/T2 < 0 ⇒ ∆W = ∆Q1 - ∆Q2 > ∆Q1(1 - T2/T1), dvs, en sådan maskin skulle ha högre effektivitet än Carnots reversibla process. En irreversibel cyklisk process förorsakar alltså en entropiökning i omgivnigen, (26) ∆Stot > 0 (irreversibel process). Ifall omgivningens temperatur är To, då förskingrar denna irreversibla process en energimängd (27) ∆Wförs = To ∆Stot. Ekv (27) anger hur mycket mindre arbete denna irrerversibla process producerar jämfört med en reversibel Carnot process som opererar mellan samma temperaturer. Nämligen, antag maskinen opererar mellan temperaturerna To och T > To, och att den för en värmemängd Q från källan T producerar arbetet W = Q - Qo. För en lika stor värmemängd producerar den reversibla Carnotcykeln arbetet W' = ηQ = (1 - To/T) Q. Skillnaden blir (28) W' - W = (1 - To/T) Q - (Q - Qo) = To(Qo/To - Q/T) = To ∆S. Denna ekvation visar samtidigt ekvivalensen mellan (24.b) och (24.e). To Qo W = Q - Qo Q T Omvandling av värme i arbete. Vi kan ge ytterligare en formulering av termodynamikens andra huvudsats i samklang med (24.e): (24.f) Slutna system tenderar mot maximal entropi (24.g) Jämviktstillståndet hos slutna system har maximal entropi. Därmed är vi tillbaka till utgångspunkten för den statistiska fysiken, där vi sökte jämviktstillståndet genom att bestämma fördelningen n som maximerar "sannolikhetstalet" Ω(n). 4. Entropi och irreversibilitet Diskussionen kring ekv (27) och (28) visar ett samband mellan entropiökning och irreversibilitet. En reversibel process är en idealisering. I verkligheten är innefattar alla processer ett visst mått av irreversibilitet. Vi har fenomen såsom friktion, och utjämningsprocesser i system, vilka bidrager till entropiökning, förutom värmekonvektion som är förknippade med en entropiförändring enligt Clausius' formel (21.1). För ett systems totala entropiförändring kan vi skriva (beteckningarna lånade av N-E Fagerholm) (29) ∆S = ∆Sq + ∆Sw + ∆Sx med (30) ∆Sq = ∫ δQ/T (värmeöverföring, värmekonvektion, etc) ∆Sw = ∫ δWirr/T (friktion, viskositet, etc) ∆Sx = entropiökning pga inre utjämning, blandningsentropi. Ett exempel på utjämningsentropi ges av en ideal gas i en behållare avdelad med en vägg. Antag gasen befinner sig i den ena delen med volymen Vo då väggen plötsligt avlägsnas. Gasen utfyller snabbt hela volymen V (en form av utjämning), men inget arbete sker, ej heller någon värmeförlust eller temperaturförändring (för ideal gas). Skillnaden i systemets entropi mellan initial- och sluttillståndet kan beräknas genom att betrakta en motsvarande reversibel process mellan dito tillstånd; t ex, via en isotermisk expansion från volymen Vo till V. Enligt Clausius' (21.1) definition erhåller vi (31) V ∆S = ∫ δQ/T = ∫ (dU + p dV)/T = ∫ nR dV/V = nR In(V/Vo) Vo (isotermisk expansion för en ideal gas, dU = 0, p = nRT/V). Vid den irreversibla expansionen gick arbetet T ∆S = ∫ p dV förlorat. Skiljeväggen avlägsnas plötsligt och det sker en irreversibel utjämning. Inget potentiellt nyttjebart arbete utförs. Vi kan också beräkna föregående entropiskillnad utgående från statistisk fysik. För jämviktstillstånd visade vi att entropin är proportionell till In Ω, där Ω i sin tur är proportionell till sannolikheten för tillståndet (beräknad utgående från postulatet om a priori lika sannolikhet). Vi ansätter (L Boltzmann, Vorlesungen über Gastheorie, 1896) för entropin, (32) S = k In Ω, där k är en konstant (Boltzmanns konstant). Jämför de båda tillstånden då gasen fyller hela volymen V, och då den fyller en delvolym Vo. Ifall antalet molekyler är N, kan den relativa sannolikheten för tillstånden uppskattas till (33) Ω'/Ω = (V/Vo)N, vilket ger (34) ∆S = k In Ω' - k In Ω = k In (Ω'/Ω) = Nk In (V/Vo). En jämförelse med ekv (31) visar att Nk = nR, med vilken man kan bestämma värdet på Boltzmanns konstant. Omvänt, kan vi på ett oberoende sätt bestämma värdet på Boltzmanns konstant k, då kan vi beräkna Avogadros tal N genom N = R/k. Ett illustrativt exempel på en irreversibel process ges av ett vattenfall. Via höjdskillnaden erhåller vattnet lägesenergi som omvandlas i det fallande vattnets kinetiska energi som t ex kan tas tillvaratas i kraftverk. Då det strömmande vattnet bromsas upp av en fors omvandlas dess kinetiska energi små turbulenta virvlar av mindre och mindre storlek för att slutligen bli värmerörelse hos vattenmolekylerna. En fallhöjd på h leder enligt denhär tankegången till en temperaturhöjning ∆T bestämd genom mgh = mc∆T, där c är vattnets specifika värme (1 cal/g = 4.18 J/g). Sätter vi in h = 57 meter (Niagaras hästskofall) erhåller vi ∆T = 134 grader .... kan premisserna/slutsatsen i detta exempel godkännas ? Kännetecknande för en irreversibel process är, att om den filmas och filmen sedan visas baklänges, kommer denna baklängesversion att beskriva en omöjlig fysikalisk process; t ex , den att gasen i en behållar samlas i den ena halvan. Det är den motsatta utvecklingen som sker "spontant". JC Maxwell uppmärksammade genast från början en skenbar paradox i detta. Irreversibiliteten innebär ju en tidsasymmetri på makroskopisk nivå, även om fysiken (Newtons mekanik, elektromagnetism) är tidssymmetrisk på mikroskopisk nivå. Maxwell var den första som betonade entropins statistiska karaktär; jämviktstillstånden är inte absoluta, utan flukturerar kring jämvikten. Boltzmann (och Clausius) försökte däremot till en början härleda irreversibliltet från dynamiken - vilket är omöjligt eftersom dynamiken är tidsymmetrisk - tills också han anslöt sig till det statistiska synsättet. Enligt det statistiska synsättet antar man att partiklarna (molekyler etc) efter kollisioner "glömmer" det exakta föregående tillståndet, och därför är en retrodiktion omöjlig (olika initialtillstånd leder till samma makroskopiska sluttillstånd). En enkel modell av GL Baker illustrera saken: Antag vi har identiska partiklar som rör sig x-axeln med samma konstant hastighet v i båda riktningarna, mellan två väggar. Vid elastiska kollisioner med varandra eller väggarna ändrar partklarnas hastighet bara riktning. Beteckna med N+(t) antalet partiklar som vid en viss tidpunkt går åt höger, och med N- (t) = N - N+(t), antalet partiklar som går åt vänster (N är totala antalet partiklar). Antalet partiklar som vid tidpunkten t + dt som går åt höger, N+(t + dt), kan uppskattas på följande sätt. När två partiklar kolliderar sker ingen förändring i N+, utan endast då en partikel kolliderar med en vägg. N+ minskar med ett om en högergående partikel stöter mot en vägg, och ökar med ett om en vänstergående partikel kolliderar med en vägg. Sannolikheten för en kollision med en vägg under tidsintervallet dt uppskattas till vdt/<d>, där <d> betecknar det genomsnittliga avståndet från en vägg till den närmaste partikeln. Ekvationen för N+(t) kan enligt denna ansats skrivas, (35) dN+(t)/dt = (N - (t)/N - N+(t)/N) (v/<d>), som förenklas till, (36) dƒ+(t)/dt = (v/<d>)(1 - 2 ƒ+(t)), med ƒ+(t) = N+(t)/N. Ekv (36) visar att ƒ+(t) närmar sig ½ för t >> d/<v>; dvs, vi får en jämn fördelning mellan högergående och vänstergående partiklar, oberoende av utgångsläget. Lösningen till (36) är nämligen, (37) ƒ+(t) = ½{1 - [1 - 2ƒ+(0)] exp (- 2 at)}, med a = v/<d>. Lösningen (37) är tidsasymmetrisk till skillnad från de dynamiska principerna vi utgick ifrån (kollisionerna är tidssymmetriska händelser). Irreversibiliteten (tidsasymmetrin) i löningen (37) uppkommer genom att vi inte följer partiklarnas banor i detalj. Statistisk behandling tillåter oss inte att rekonstruera initialtillståndet. Den statistiska behandlingen innehåller implicit ett antagandet om "tidspilen" (arrow of time). Boltzmann (1872) påvisade att de irreversibla lösningarna resulterade i de dynamiska modellerna ifall man förutsatte en "Stosszahlansatz" (hypothesis of molecular disorder); den exakta korrelationen mellan före och efter kollisionen i den deterministiska teorin upphävs då (se vidare avsnitt 4.3). Beteckna med ƒ(1) = ƒ(v) hastighetsfördelningen för molekyl #1. Låt ƒ(1,2) beteckna den sammansatta fördelningen för molkylerna #1 och #2. Boltzmanns ansats, att molekylernas hastigheter är okorrelerade både före och efter kollisionen, utrycks matematiskt som en faktorisering av ƒ(1,2), ƒ(1,2) = ƒ(1) ƒ(2). Inom engelsk litteratur talar man också om coarse graining, som kanske kunde översättas som "grovmaskig approximation". Man studerar sas systemet inte med den finaste upplösningen, utan nöjer sig med en mindre upplösning för att studera systemets statistiska egenskaper. Maxwell betonade speciellt att irreversibiliteten följer av oförmågan att observera den fysikaliska utvecklingen på atomär nivå i detalj. P och T Ehrenfest introducerade begreppen fine-grained density och coarse-grained density. Analyserar man systemet (partiklarna i fasrummet) med "fine-grained density" förekommer ingen irreversibilitet. Irreversibiliteten är förbunden med en "coarse-grained density" analys. Observera, att om vi löser Bakers modell exakt, då visar det sig att hastighetsfördelningen ƒ+ i den tidssymmetriska lösningen upprepar sig efter en tidsperiod på t = 2L/v, där L är avståndet mellan de båda väggarna (se figuren), vilket står i direkt strid mot lösningen (37). t1 t1 - t0 = 2 L/v t0 L Baker-modellen ritad på rum-tids diagram. Eftersom partiklarna efter innebördes kollisioner fortsätter med samma hastighet ritas kollisionera som korsande linjer. Hastighetskonfigrationen upprepar sig efter en tidsperiod på t = 2L/v, där L är avståndet mellan de båda väggarna. Det är endast med hjälp av en statistisk förenkling (Boltzmanns Stosszahlenansatz) som man erhåller en irreversibel lösning. I det idealiserade fallet är den irrerversibla löningen inte tillämpbar. I verkligheten är inget system fullständigt isolerat, och det är närmast omöjligt att preparera ett tillstånd där varje partikel skulle ha exakt samma hastighet, osv. Faktum är att det behövs ytterst små "störningar" (perturbations) för att systemet skall bete sig irreversibelt. Detta framkommer t ex om man studerar en 2-dimensionell version av Bakers modell, med partiklarna innelutna i en låda. Små ojämnheter i väggarna gör i detta fall en exakt prediktion, eller retrodiktion, av partiklarnas rörelse på lång sikt efter många kollisioner, omöjlig. Vi tillämpar den statiska fysikaliska metoden utvecklad i avsnitt 2 på Bakers modell. Varje partikel tillskrivs endast två möjliga tillstånd; antingen går de åt höger eller vänster. Systemets makroskopiska tillstånd karaktärsieras av talet N+. Tillämpar vi postulatet om a priori sannolikhet, erhåller vi en binomial fördelning med sannolikhetsparametern p = ½ (sannolikhet för att gå åt vänster/höger). (Medan vi i avsniit 2 beräknade Ω för ett sk kanonisk (canonical) ensemble, begränsar vi här ensemblet till ett mikrokanonisk ensemble; dvs, vi betraktar olika möjliga tillstånd med samma energi, vilka tillskrivs samma sannolikhet.) Sannolikhetstalet för ett tillstånd N+ blir, (38) Ω(N +) = N!/[(N - N+)! N+!] . (Delar vi (38) med 2N, som anger totala antalet möjliga tillstånd då varje partikel har två möjliga tillstånd, får vi resultatet uttryck i sannolikhet.) För stora N och N+ kan vi skriva In Ω(N +) som, (39) In Ω(N +) = -N {ƒ + In ƒ+ + (1 - ƒ+) In (1 - ƒ+) }, med ƒ+ = N+/N. Ekv (39) når maximum för ƒ+ = ½ i överenstämmelse med lösningen (37) där ƒ+ → ½ då t → +∞. Betrakta en liten avvikelse, fluktuation, ƒ = ½ + δƒ, från ƒ = ½ i (39). För denna fluktuation erhåller vi (använd approximationen In(1 + x) ≈ x - ½ x2 för |x| << 1), In Ω - In Ωmax ≈ - N 2 (δƒ)2 vilket motsvarar en entropifluktuation (ekv (34)) (40) ∆S = k(In Ω - In Ωmax) = - kN 2 (δƒ)2. Omvänt blir sannolikheten för en fluktuation δƒ, (41) P(δƒ) ∝ exp(∆S/k) = exp(- N 2 (δƒ)2) = exp(- 2 (δN+)2/N), där vi skrivit δƒ = δN+/N. Ekv (41) (ibland kallad Einsteins formel; Einstein var en expert på fluktuationer) är en Gaussisk fördelning med deviationen σ = (N/4)½. (Samma resultat erhålles genom att beräkna deviationen för binomialfördelningen.) Storleken på fluktuation δN+ från jämviktvärdet N+ = N/2 är alltså δN+ ≈ √N. Den relativa avvikelsen för N av storleksordningen N = 1023 blir δN+/N ≈ 10-12. Dessa slutsatser kan exv tillämpas på en behållare med en gas bestående av N molekyler. Tänker vi oss behållaren indelad i två lika stora volymer, då kommer inte molekylerna att fördela sig exakt jämnt (N/2 + N/2) mellan halvorna såsom tillståndet för Ωmax förutsätter. Istället har vi en fluktuation kring värdet N/2 av storleksordningen √N. (Desto större fluktuationer desto osannolikare är de, enligt ekv (41).) 4.1 "Maxwells demon" För att illustrera entropilagens statistiska karaktär ("to show that the second law of thermodynamics has only a statistical certainty") framlade Maxwell 1867 ett argument som blivit bekant under benämningen (efter Kelvin) "Maxwells demon" (demonen dök upp i en brevväxling mellan Maxwell och PG Tait). Vi tänker oss en behållare med gas som delas i två delar, A och B, av en vägg. I väggen finns en sorts ventil. Antag att ett liten väsen, "demonen", kontrollerar denna ventil så, att när en molekyl närmar sig från sidan A öppnar han ventilen för att släppa igenom denna. På detta sätt uppkommer småningom en tryckskillnad mellan A och B som kan nyttjas för arbete. Ifall vi kan förmoda att arbetet för att styra ventilen är försumbar, har vi alltså en perpetuum mobile. Samtidigt har vi förstås också uppnått ett tillstånd med minskad entropi. (I Maxwells ursprungliga version av argumentet släppte man igenon de snabba molekylerna till B, och de långsamma molekylerna till A, för att uppnå en temperturdifferens: värme strömmar alltså från en kallare till en varmare del i strid mot entropilagen.) Avsikten med Maxwells argument var att visa att entropilagen är en statistisk lag. Inför man en agent som inte är underkastad statistiska fluktuationer, då gäller inte entropilagen längre. Senare författare har genom oilka exempel försökt visa att det är omöjligt att realisera Maxwells demon fysikaliskt. Som ett exempel, betrakta följande schematiska idé för en automatisk "ventil". A B "Maxwells demon" i form av en dörr som släpper igenom molekyler från A till B, och som stängs automatiskt av en fjäder. Dörren/ventilen fungerar som en semipermeabel membran. För att systemet skall fungera måste dörren förses med en dämpande mekanism, dvs friktion, som håller den stängd när den slås igen. Dörren är alltså förbunden med en irreversibel process och en eventuell tryckgradient förloras genom den dissipativa dörrmekanismen. Eftersom dörren + fjädern tillhör det fysikaliska systemet kan man tillämpa ekvipartitionsteoremet på dem. Ekvipartitionsteoremet säger, att för ett system i jämvikt vid temperaturen T, fördelas en kinetisk genomsnittlig energimängd ½ kT på varje frihetsgrad (k är Boltzmanns konstant). För dörren + fjäderna erhåller vi, "kin.ene. + pot.ene." = ½ kT + ½ kT = kT. Detta är i medeltal energin som den hamnar att dissipera (förskingra) vid varje molekylpassage. Den energi som eventuellt vinns via tryckskillnaden uppvägs genom dissipationen. Tekniska argument som försöker kringgå entropilagen antar oftast att man på något vis kan utnyttja fluktuationerna för att göra arbete (perpetuum mobile). Bland annat har man föreslagit att Browns rörelse (fluktuerande värmerörlese hos t ex små pollenkorn i vattten) strider mot entropilagen (L Gouy 1888, H Poincaré 1904). Haken är att själva mekanismerna man tänker använda sig av för detta ändamål är också underkastade statistiska fluktuationer som kullkastar schemat. 4.1.1 Ekvipartitionsteoremet Härledningen i avsnitt kan upprepas mutatis mutandis för en mikrokanonisk ensemble, där vi betraktar ett system med fix antalet partiklar (molekyl, atom, etc) och totalenergi U. I motsvarighet till ekv (12) har vi resultatet, att för sannolikheten Pj att molekylen befiiner sig i ett tillstånd j med energin Ej gäller, (42) Pj = exp(-βEj)/Z, (43) Z = ∑ exp(-βEj) (β = 1/kT). Denna formulering är anpassat för kvantmekaniska system där påträffar fall med diskreta energinivåer. För ett klassiskt system av partiklar (dvs, vi rör oss vid energinivåer som sitter så tätt att de bildar ett kontinuum) kan vi modifiera summeringen (43) till en summa över fasrumsceller ∏ d3pnd3xn varpå summan övergår i en intregral, (44) Z = c∫ exp(- βE) ∏ d3pnd3xn = ∫ exp(- βE) dΓ (dΓ = c∏ d3pnd3xn), där E är totalenergin (kinetisk + potentiell) för partiklarna med impuls pn och läge xn. Här beteckanr c en konstant vars värde inte kan bestämmas från klassisk teori utan kräver en kvantfysikalisk analys. I fallet med skiljbara partiklar erhåller man c = 1/ h3N där h är Plancks konstant. Heuristiskt kan man härleda detta från antagandet att en partikel upptar minst en volym h3 i fasrummet (h3 är den minsta möjliga volymen för ett mikrotillstånd). Konstanten c kan teoretiskt bestämmas exv genom att jämföra (44) och (43) för fallet med en harmonisk oscillator vid höga temperaturer. Alternativt utgår man direkt från den kvantmekaniska relationen (de Broglie) p = h k/2π mellan impuls och vågtal. För fria partiklar blir (43) en summa över diskreta modtal som kan approximeras med en integral över impulsvariablerna. Ekv (44) är baserat på antagandet att alla fördelningar över det 6N-dimensionella fasrummet (med kordinaterna (pn,xn) - dynamikens impuls-läge fasrum skall inte förväxlas med termodynamikens fasrum) har samma a priori sannolikhet. Ifall ρ(pn,xn) är en fördelning över fasrummet (ρ(pn,xn)dΓ anger hur många partiklar befinner sig i dito fasrumscell), då kan uttrycket för entropin på motsvarande vis skrivas, (44.1) S(ρ) = -k ∫ ρ(pn,xn) In ρ(pn,xn) dΓ. (Man utgår från S = - kN ∑ Pi In Pi. För ett diskretiserat fasrum indelat i celler dΓi ansätter man NPi = ρ(pn,xn)dΓi och låter summan övergå i en integral (44.1). Pi är sannolikheten för att en partikel skall befinna sig i cellen dΓi. Postulatet om a priori lika sannolikhet säger i detta fall att partiklarnas olika fördelningar bland fasrumscellerna, med samma volym, har samma sannolikhet.) Fördelningen ρ ∝ exp(- βE) följer genom att maximera S(ρ) under vilkoren att ∫ρ = N och ∫ Ε ρ = U. För partiklar som inte växelverkar kan exp(- βE) faktoriseras på formen (45) exp(- βE) = exp(- β ∑ En) = ∏ exp (-βEn). Tillexempel, för en partikel som befinner sig i en harmonisk potential (partikeln kontrolleras av en "fjäderkraft") och svänger, säg i x-riktningen (1-dimensionellt fall), samt har energin E = p2/2m + fx2/2 (f, fjäderkonstanten), erhåller vi för dess medelenergi i ett system i termisk jämvikt, (46) <E> = ∫ E exp(- βE) dpdx [∫ exp(- βE) dpdx] -1, vilken för E = p2/2m + fx2/2 ger <E> = ½(1/β) + ½(1/β) = ½ kT + ½ kT = kT. (Den harmoniska potentialen råkar ge lika stort bidrag, på grund av sin kvadratiska form, som den kinetiska energin. För generella potentialer behöver detta inte vara fallet.) Ekvipartitionsteoremet är av central betydelse för att uppskatta fluktuationer i system kring jämviktslägen. Tillexempel, en induktanskrets med energin ½ LI2 kan behandlas i analogi med "partikeln + fjädern", och man erhåller via <½ LI2> = ½ kT ett uttryck för strömfluktuationen, (47) <I2> = kT/L ("Johnson noise"). 4.1.2 Tidspilen "I likhet med de flesta människor [?] läste jag första gången HG Wells berättelse Tidsmaskinen när jag var tonåring och den gjorde ett bestående intryck på mig. I själva verket bidrog den formodligen till mitt beslut att bli fysiker." P Davies, "I Rättan Tid" (1995). "Solen skulle inte kunna stråla ifall den vore ensam i rymden och inga kroppar fanns som kunde absorbera dess strålning (...) Om jag t ex observerade i mitt teleskop i går kväll en stjärna som, låt oss säga, befinner sig på 100 ljus års avstånd, då vet jag inte endast att ljuset som nådde mit öga utsändes för 100 år sedan, utan också att stjärnan eller dess individuella atomer visste redan för 100 år sedan att jag, som då ännu inte ens existerade, skulle betrakta stjärnan i går kväll vid den och den tiden." H Tetrode, Z.Phys. !0, 317 (1922). Citerad i J Narlikar, "The Structure of the Universe" (Oxford UP 1978). Den klassiska dynamiken är tidssymmetrisk. Också elektromagnetismens ekvationer är tidssymmetriska. För det senare använder man oftast dock tidsasymmetriska lösningar, de sk retarderade lösningarna. I princip vore det möjligt att använda också de avancerande lösningarna där signalerna går sas bakåt i tiden (formellt ändrar man tecknet på ljushastigheten c i de retarderade lösningarna). Medan de retarderade lösningarna endast beror på laddningarnas historia, beror de avancerande lösningarna på hur laddningarna beter sig i framtiden. Med de retarderade lösningarna har vi vant oss vid tanken att exv stjärnljuset vi oberverar härrör från tusentals år sedan från en stjärna på tusentals ljusårsavstånd. Ifall det finns avancerande lösningar, och full tidssymmetri råder, är det möjligt att vi nu emottar strålning från stjärnor tusentals år i framtiden. t S** t** t** = to + x**/c s** to O x s* t* = to - x*/c t* S* Retarderad lösning: ljusstrålen s* som observeras vid O kommer från gången tid t*. Avancerande lösning: ljustrålen s** kommer från en framtida stjärna S** som sänder ljuset vid tiden t**. Paradoxer kan uppkomma ifall det vore möjligt att sända signaler bakåt i tiden. Omvänt kunde vi sända signaler tillbaka i tiden. Detta kan verka fullkomligt nonsens, men faktum är att man i den kvantiserade versionen av elektrodynamiken, kvantelektrodynamiken (QED), använder en kombination av avancerande och retarderade lösningar (nämligen deras differens, L = LR - LA; motsvarande uttryckt i term av elektrodynamikens sk Greens funktioner, G = GR - GA, som bestämmer lösningarna). Tetrode, Wheeler, Feynman, Hogarth, Roe, Hoyle, Narlikar, m fl, har undersökt klassisk elektrodynamik där man använder en kombination av retarderade och avancerande lösningar (verkan-på-avstånd teorier, action-at-a-distance). Under antagandet att det finns tillräckligt med absorbatorer i framtiden som kan absorbera 100% av strålningen, kunde Wheeler och Feynmann visa, att en lösning med den symmetriska formen ½(LR + LA) i ett statiskt universum reproducerar den konventionella retarderade lösningen. Nämligen, fältet ½(LR + LA) från en laddning leder via den avancerande återstrålningen från absorbatorerna till en samtidig reaktion vid laddningen som är lika med ½(LR - LA). Totalfältet blir alltså det retarderade fältet, ½(LR + LA) + ½(LR - LA) = LR. Hur är det möjligt att Wheeler och Feynman kunde erhålla en tidsasymmetrisk lösning i en tidssymmetrisk teori ? Teorin innehåller nämligen antagandet att absorbatorerna är i vila före de störs av strålningen och sätts i rörelse. Vi har alltså en transition från ordning till oordning vilken motsvarar den termodynamiska tidspilen (utveckling mot ökande entropi). Einstein argumenterade mot den avancerande lösningen med liknande argument som man använder inom statistisk fysik. Man kan göra en jämförelse med en sten som kastas i sjön och som frambringar cirkulära vågor vilka sprider sig utåt. Det är ytterst osannolikt att man på sjön får se den omvända processen där cirkulära vågor plötsligt synes uppkomma vilka konvergerar mot en punkt. (Dethär kan förstås hända i en tvättbalja om man skakar om den. Tvättbaljans kanter motsvarar Wheeler-Feynman teorins hundraprocentiga framtida absorbatorer.) Endel spekulativa teorier har vävts kring en idé som lanserades på 60-talet av Thomas Gold om att tidspilen sammanhänger med universums expansion. I ett "krympande" universum skulle tiden gå "baklänges". Det senare verkar inte så värst övertygande. Skulle tiden "stå stilla" i ett statiskt universum, eller "då" det väger mellan kontraktion och expansion ? Entropilagen, liksom existensen av tidspilen, kan förmodligen inte "bevisas" från våra nuvarande principer, utan är postulat eller axiom. Detta kan jämföras med att rörelsekevationer inte fastställer initialvillkoren (boundary conditions), utan dessa måste fyllas i antingen för hand, eller med hänvisnigar till ytterligare principer (man kan exv tänka sig att vakuum kvantfluktuationer spelar en roll för entropiska initialvillkor). Självfallet finns det möjligheter att ersätta entropilagen med andra postulat på en mer "grundläggande" nivå. Tillexempel förefaller det som om fysiken på mikroskopisk nivå inte är fullständigt tidssymmetriska. Man har en grundläggande symmetri kallad CPT-symmetri i fysiken. C står för "charge" (operator som ändrar tecknet på elektriska laddningar); P står för "parity" (speglingstransformation); T står för "time" (tidsinversion). Redan 1956 visades att P-symmetrin är bruten vid radioaktivt sönderfall (svag växelverkan) av kobolt, 60Co → 60Ni* + e- + ν e (anti-neutrino). Denna process gör en skillnad mellan höger och vänster iom att sannolikheten för att elektronen går i Co-atomens spinriktning observerats vara större än för att gå i motsatt riktning. Några år senare (1964) visades att också CPsymmetrin är bruten under svag växelverkan i sönderfallsrekationer som involverade kaonen Ko och dess antipartikel. För att CPT-symmetrin skall hålla måste en T-asymmetri uppväga CP-brottet i detta fall. Mao förefaller som om vi hade ett tidssymmetribrott på mikrofysikalisk nivå. På vilket sätt dylika asymmetrier hänger samman med makroskopisk asymmetri är inte klarlagt. Det att universum inte kokat bort i en reaktion mellan materia och anti-materia visar att ett asymmetriskt förhållande mellan materia och anti-materia spelat en betydande roll vid universums uppkomst och utveckling. I varje fall verkar det klart att tidsasymmetrin har att göra med en koppling mellan universums mikroskopiska och markoskopiska dimensioner. 4.2 Entropi och sannolikhet Boltzmann introducerade tankegången att entropi har att göra med tillståndets "sannolikhet". Entropiökningen innebar en övergång till sannolikare tillstånd. Kelvin hade 1874 sammanfattat diskussionen med Maxwell och Tait on entropilagens statistiska natur i en artikel som kom hänvisas till som "reversibilitetsparadoxen". Frågan gällde, hur fysiken kunde ge upphov till irreversibilitet när grundlagarna är reversibla. Kelvin observerade att för system med många partiklar var de oordnade tillstånden mycket fler än de ordnade, varför det var mest sannolikt att ett system utvecklas från ett ordnat tillstånd till ett oordnat, istället för tvärtom. Härifrån fick Boltzmann idén att förknippa entropi med begreppet sannolikhet. Ett makrotillstånds "termodynamiska sannolikhet", W, motsvarar antalet mikrotillstånd hos systemet som är förenbar med makrotillståndet (tryck, energi, hastighet,osv). Boltzmann antog alltså att det fanns ett funktionell förhållande mellan entropi och den termodynamiska sannolikheten, S = ƒ(W). Vilken form har ƒ ? Boltzmann utgick ifrån att total entropin för två oberoende system är summan av de enskilda entropierna, S = S' + S'', medan däremot den termodynamiska sannolkiheten är deras produkt, W = W' × W'', vilket motsvara antalet kombinationer av mikrotillstånd för det sammansatta systemet. Funktionen ƒ måste alltså satisfiera, ƒ(W' W'') = ƒ(W') + ƒ(W''). Insätt W' = x och W'' = 1 + dx/x, då får vi ekvationen, ƒ(x+dx) - ƒ(x) = ƒ(1 + dx/x); dvs, ƒ'(x) = ƒ'(1)/x, (eftersom ƒ(1) måste vara 0, enär ƒ(1) = ƒ(1) + ƒ(1)) som har lösningen, ƒ(x) = k In x, där k är en konstant. Planck (1906) var den första att använda formen S = k In W med "Boltzmanns konstant" k. (Enligt en anekdot ville Planck hellre att man skulle minnas honom för att han införde Boltzmanns konstant, än för hans introduktion av "Plancks konstant" h.) Den logaritmiska relationen mellan entropi och termodynamisk sannolikhet har en naturlig tolkning i term av "information" (se avsnitt 6). Ekvationen S = k log W ("W" för Wahrscheinlichkeit) finns inristad på Boltzmanns (†1906) gravsten i Wien (avbildad i Brush a.a. s 609).. 4.3 Irreversibilitet och Boltzmanns H-teorem "Irreversibiltetsparadoxen har vilat som en förbannelse över oss i mer än hundra år: de så kallade 'grundläggande' teoriernas misslyckande att skilja mellan förflutet och framtid." P Coveney, R Highfield, "Tid utan ände", ICA 1992. Entropins samband med irreversibilitet förtydligas på ett intressant inom kinetisk energi genom Boltzmanns klassiska "H-teorem" (1872). Vi föreställer oss en samling identiska partiklar med en hastighetsfördelning ƒ(v). Man frågar sig hur denna fördelning påverkas genom partiklarnas innebördes växelverkan, här "kollisioner". Antalet partiklar med hastigheten i ett intervall (v, v + dv) ges av N(v) = ƒ(v)d3v. Antalet ∆N(v) minskas ifall en partikel med hastgheten i (v, v + dv) kolliderar med en annan partikel och får en hastighet i intervallet (v', v' + dv'). Omvänt ökar N(v) ifall en partikel med hastigheten i intrevallet (v', v' + dv') kolliderar med en annan partikel och får en hasitghet i intervallet (v, v + dv). Symboliskt kan vi skriva (4.3-1) dN(1)/dt = (1'2')(1'2' →12) - (12)(12 →1'2'); (12) är sannolikheten per tidsenhet att partiklar av slaget (tillstånd) 1 och 2 kolliderar; (12 →1'2') betecknar sannolikheten för att kollisionen mellan partiklar av slaget 1 och 2 resulterar i dito av slaget 1' och 2' (i en deterministisk). 5. Carathéodorys definition av entropi Carathéodorys (1909) ansats utgår från empiriska resultat inom termodynamiken för att skapa en generell matematisk grundval. Vi betraktar enkla system vars jämviktstillstånd karaktäriseras av tryck och volym (p, V). Vi antar att det finns en funktion T sådan, att då två system (p,V) och (p',V') befinner sig i termisk jämvikt gäller T(p,V) = T(p',V'). Funktionen T kommer att förbindas med temperaturbegreppet. Begreppet värme defineras via energilagen. I en adiabatisk process (systemet är isolerat) ändras den inre enenrgin dU under arbete δW enligt (48) dU = - δW = - pdV (adiabatisk reversibel process). Genom (48) kan man bestämma inre energin för olika tillstånd. För en icke-adiabatisk process defineras värmetillskottet δQ genom, δQ = dU + δW (energilagen). En primär distinktion i termodynamiken gäller den mellan reversibla och irreversibla processer. För ett givet tillstånd (p,V) kan vi undersöka alla de tillstånd σ(p,V) som nås från (p,V) genom adiabatiska reversibla processer. σ(p,V) är en kurva i (p,V)-planet som går genom punkten (p,V). Dessa kurvor fyller (p,V)-planet. p 3 2 4 1 σ2 δQ = 0 σ1 V Vi kan därför beskriva punkterna i (p,V)-panelt genom att ange en σ-kordinat som visar vilken adiabatisk kurva punkten ligger på, plus ytterligare en kordinat som var på kurvan punkten befinner sig. När vi går från en adiabatisk kurva till en infinitesimalt närstående adiabatisk kurva, kan värmeförändringen skrivas, (49) δQ = τ dσ med hjälp av den nya kordinaten σ. Här betecknar τ någon tillståndsfunktion, och vi tar den som den andra nya kordinaten. Carathéodorys huvudteorem går ut på, att för ett system där inte alla tillstånd kan nås från ett visst tillstånd genom reversibal adiabatiska processer, gäller en relation av formen (49) med en funktion τ som gör δQ/τ till en exakt differential. För en irreversibel process har vi däremot δQ ≠ τ dσ. Carathéodorys formulering av termodynamikens andra lag lyder nu som följande: Det är omöjligt att från ett givet tillstånd nå alla tillstånd godtycklig nära genom adiabatiska processer (inkluderande irreversibla processer). Ifall σ både växer och avtar för irreversibla processer, är det möjligt att nå vilket värde för σ som helst. Därefter kan man nå olika τ-värden genom en adiabatisk reversibel process. Alla (σ,τ)-värden vore alltså tillgängliga. Den kvarstående frågan är huruvida σ växer eller minskar i irreversibla processer. Denna fråga kan man exv avgöra genom att studera ett enskilt exempel, såsom den ideala gasen. För en reversibel cyklisk process 1-2-3-4-1 (se figuren) har vi t ex, (50) ∆W = ∆Q = τ1 ∆σ - τ2 ∆σ = (τ1 - τ2) ∆σ, som kan fyllas ut genom att direkt räkna värdena för den ideala gasen (Carnot processen). Det kan vara intressant att jämföra Carathéodoros ansats med Clausius' diskussion av reversibla processer i Ann. Phys. 93, 481 (1854) (vide Brush a.a. s. 575). Clausuis förutsätter att en värmemängd Q vid temperaturen t har en "ekvivalent transformationsvärde" [senare (!865) kallad för "entropi"] givet som ƒ(t) Q, där ƒ(t) är en funktion av "temperaturen". Tanken är att ƒ(t) Q skall bilda en tillståndsfunktion, eller exaktare, att ƒ(t) ∆Q bildar en exakt differential för reversibla processer. Clausius har vissa problem att bevisa att ƒ(t) är relaterad till den absoluta temperaturen genom ƒ(t) = 1/T. Kelvin gjorde omvänt och definerade den termodynamiska temperaturen T genom denna relation. 6. Entropi och informationsteori Vi har redan tidigare anmärkt att irreversibilitet och tidsasymmetri har att göra med skillnaden mellan en mikroskopisk och makroskopisk beskrivning. Den makroskopiska fysiken är tidsasymmetrisk fastän den mikroskopiska fysiken är tidssymmetrisk. Entropin definerad genom, S = k In Ω(n), för ett tillstånd n med sannolikhetstalet Ω(n), är proportionell till antalet "bits" information som behövs för att utfylla den makroskopiska beskrivningen, för att kunna avgöra vilket mikrotillstånd är i fråga. Ω var ju definerad som antalet mikrotillstånd som är förenbar med makrotillståndet (för samma totala energi, antalet partiklar, etc). Entropin uttrycker alltså "informationsglappet" mellan makrotillståndet och mikrotillstånden. Entropilagen innebär att detta informationsglapp ökar, och att det behövs alltmer information för att rekonstruera mikrotillståndet. Extremfallet utgörs av "kaos", där makrotillståndet inte ger någon information alls om mikrotillståndet. Andra extremfallet är en kristall vid den absoluta nollpunkten, där alla atomers lägen är fixerade och det finns bara ett möjligt mikrotillstånd. I detta fall har vi alltså S = 0. I dethär sammanhanget måste det påpekas att distinktionen mellan makro- och mikrotillstånd inte är entydig. Hur många partiklar behövs det för att konstituera ett makrotillstånd - hundra, 10 000 eller 1020 ? Entropibegreppet används också inom informationsteorin. Antag vi sänder ett meddelande användande ett alfabet med n tecken. Om tecknet #i förekommer med frekvensen pi i ett meddelande med längden N, kan vi uppskatta meddelandets "sannolikhet" enligt (beaktande ordningen - meddelande med samma frekvenser men med olika ordningsföljd för tecknen betraktas naturligtvis som olika), (51) P = ∏ piNpi. (För stora N har vi 1/P = N!/ ∏Nj!, med Nj = Npj.) Det minsta antalet bits HN som behövs för att beskriva detta medelande ges av (log för basen 2) (52) HN = log (1/P) = - N ∑ pi log pi . H defineras som meddelandets entropi. Entropin är maximum då alla frekvenser är lika med pi = 1/n. Räknar man ut entropin för en bok kan det hända att den kommer nära maximal entropi men detta säger förstås inte mycket om innehållet. Entropibegreppet blir intressant när vi studerar följande fall. Antag att vi har att sända ett meddelande i form av en sträng med ettor och nollor (binärt system). Transmissionen är inte helt tillförlitlig (brusig kanal) om det finns en sannolikhet p att en etta blir en nolla, eller att en nolla blir en etta istället för en nolla. Sänder vi iväg en sträng med N tecken kommer i genomsnitt Np tecken att bli förbytta. Mottagaren kan inte veta vilka tecken som ändrats. Det finns N!/[(N - Np)! Np!] olika sätt dessa felaktiga bitar kan vara ordnade i strängen. Detta motsvara i informationsbitar I antalet (log för basen 2) (53) I = log (N!/[(N - Np)! Np!] ) ≈ -N{p log p + (1- p) log (1 - p)} = NH. Högra membrum gäller för stort N. Ekv (53) anger hur mycket information behövs för att rekonstruera den ursprungliga strängen, "H bits per bits". En binär kanal med "tryckfelssannolikheten" p behöver i genomsnitt minst I/(1 - H) bitar för att överföra I bitar felfri information. (Överföringen behöver "redundans". Ett enkelt exempel: Man kan använda två bitar för att sända en bit information, så att 00 → 0 och 11 → 1, medan 01 och 10 inte används. Om mottagaren får en sekvens 01 eller 10 vet denna att ett fel insmugit sig medan två efter varandra följande fel inte upptäcks med denna procedur. Kodningsteori studerar optimala algoritmer för kodning, dekodning och korrigering av information som skickas längs brusiga linjer.) Antalet fel varierar förstås statistiskt (exv binomialfördelning). Beräkningar kan realiseras med datorer (och hjärnor). Eftersom det finns ett samband mellan fysikalisk entropi och informationsbegreppet, har det uppstått en fråga huruvida beräkningar nödvändigtvis måste dissipera energi. Eftersom en bit motsvarar två valmöjligheter, har man tänkt sig att behandlingen av en bit information, i en omgivning med temperaturen T fodrar minst en energi (54) E = T ∆S = kT In 2 (dissipation per bit). Emellertid kan själva beräkningarna i princip realiseras med hjälp av en reversibel dynamik (exv system med idealiska elastiska biljardbollar). Däremot är uppdateringar av "registren" förenade med en genomsnittlig dissipation i enlighet med ekv (54). (Ifall den genomsnittliga entropiökningen per bit vore mindre än (54) kunde "Maxwells demon" i princip nyttja denna "dator" för att kringgå entropilagen.) 7. Entropi och biologi "There was constant speculation about how cellular existence was compatible with the second law of thermodynamics [in a closed system the amount of disorder (entropy) invariably increases]. What was conceivably a paradox ceased to exist as soon as it was seen how animal cells could trap and utilize the energy of food molecules." JD Watson, Molecular Biology of the Gene, WA Benjamin 1970. En klassisk fråga är huruvida utvecklingen av livets komplexitet strider mot entropilagen enligt vilken naturen strävar mot "maximalt kaos". Faktum är att livet har en stor reserv "negentropi" (negativ entropi) att leva på. Från solen strömmar hela tiden negentropisk energi som levande organismer använder sig av. Endel av solens negentropi förvandlas till organiserade strukturer. Vid alla omvandlingar sker en dissipation, en ökning av den totala entropin. I princip arbetar jordens termodynamiska "maskiner" mellan temperaturerna T = 6000 K (solinstrålningen) och To = 288 K (jordens medeltemperatur). Den teoretiska maxeffekten blir (6000 - 288)/6000 ≈ 0.95. Det finns en mycket stor reserv i solinstrålningen. Teorin om dissipativa strukturer handlar om hur komplexa former uppstår i samklang med entropilagen. Det torde ju vara uppenbart att dissipation, friktion, viskositet, etc, är nödvändiga för att relativt stabila komplexa strukturer skall kunna uppstå. (Ett handgripligt exempel: Utan friktion tar varken skruvar eller spikar fast.) För kemiska reaktioner och biologiska system K är det viktigt att poängtera, att trots det totala systemet, K + Ko (Ko betecknar "omgivningen") går mot maximal entropi, behöver inte systemet K vid dynamisk jämvikt ha maximal entropi. Antag t ex att vi har ett system som från ett initialtillstånd 1 med temperaturen T, i en process med värmeutbytet Q, når slutillståndet 2 med samma temperatur T (omgivningens temperatur). Enligt ekv (29) har vi (likamed tecknet gäller endast för reversibla processer) (55) Q ≤ T (S2 - S1). Enligt energilagen har vi (56) ∆W = Q - (U2 - U1) ≤ To(S2 - S1) - (U2 - U1) ⇒ ∆W ≤ F1 - F2 med en fria energin F definerad generellt genom, (57) F = U - TS. Ekv (56) innebär att det maximala arbetet som kan vinnas i processen är F1 - F2. Om inget yttre arbete görs, ∆W = 0 (exv för en process med konstant volym, p dV = 0), följer, att för en process under konstant volym för ett system i kontakt med en reservoar ("omgivning") med temperaturen T, kan processen endast gå i riktningen med minskande fri energi. Jämviktvillkoret motsvaras alltså i detta fall av minimitillståndet för (57), vilket är ekvivalent med att Stot, entropin för system + omgivning, är maximum. Ifall processen sker vi konstant tryck och vi har ∆W = p(V2 - V1), kan (56) skrivas som (58) G2 ≤ G1 med Gibbs energi definerad genom, (59) G = U + pV -TS = H - TS = F + pV. Olikheten (58) innebär t ex, att kemiska reaktioner som sker vi konstant tryck och är i förbindelse med en reservoar vid konstant temperatur, spontant går i riktning mot minskande Gibbs energi. Jämviktstillståndet motsvarar minimum hos systemets Gibbs energi (maximum för den totala entropin, Stot). En reaktion (60) A+B →C + D kan gå i den omvända riktningen, beroende på ämnenas koncentrationer, trycket, osv, som avgör vilken riktning för mot minskande Gibbs energi och dynamisk jämvikt. En biologiskt viktig reaktion är fotosyntesen i växterna, (61) 6CO2 + 6H2O + (solenergi) → C2H12O6 + 6O2, som ger upphov till en energirik förening, glukos. I djuren (och växterna) sker en omvänd reaktion, katabolism, som frigör energi. Denna energi kan tillvaratas exv genom att först lagras i form av ATP (adenosin trifosfat) som exv används av musklerna. Formandet av ATP involverar ett endoergiskt (∆G > 0) steg vilket drivs av enzymer och en exoergisk process (∆G < 0) - för processen totalt gäller att ∆G < 0. Energin hos ATP frigörs i musklerna via hydrolys, (62) ATP + H2O → ADP + fosfat: ∆G = -30kJ/mol (1 atm, 25° C). Kretsloppet sluts genom att ADP sedan fosforiseras igen till ATP. Den kemiska energin finns i atombindningarna. Exv vid proteinsyntes motsvarar varje peptidbindning energin ∆G = 2 kJ/mol. Eftersom formandet av petidbindningen är kopplat till omvandlingen av ATP till ADP med ∆G = -30 kJ/mol, blir totalförändringen för Gibbs energi ∆G = -28 kJ/mol vilket visar att processen är spontan. På samma satt utnyttjar en mängd andra reaktioner energin från ATP för att bygga upp komplexa molekyler. Ifall vi har en process, (63) n1 C1 + n2 C2 → n3 C3 + n4 C4 med de stökiometriska koefficenterna n1, n2, ..., för föreningarna C1, C2, ...., då defineras reaktionens jämviktskonstant K som (64) K = c3n3 c4n4/c1n1 c2n2 där c1, c2, ..., är föreningarnas koncentrationer (molära andel). Jämviktkonstanten K är förbunden med Gibbs energin (per mol) ∆G° = n4 G4° + n3 G3° - n2 G2° - n1 G1° (G1°, G2°, ..., är ämnenas Gibbs energi beräknade för ett gemensamt referenstryck) enligt (65) ∆G° = -RT In K; dvs, K = exp(-∆G°/RT). För −∆G > RT kommer reaktionen alltså att löpa i en riktning tills nästan alla reaktanterna konsumerats. RT motsvarar för temperaturen 25°C (298 K) ca 2.5 kJ/mol. Kemiska bindningar med mindre energi än detta bryts alltså lätt sönder (men kan också relativt lätt återbildas) vid rumstemperatur. För kovalenta bindningar har stora Gibbs energier upp till ∆G = -400 kJ/mol. De sk svaga kemiska bindningarna (weak bonds) med −∆G i området från 4 till under 30 kJ/mol (van der Waals-, väte- och jonbindningar) är dock mycket viktiga för biokemin. Exempelvis polymerisering bygger på de svaga bindningarna. "Komplementära" molekyler vars "ytor" passar in i varandra formar starkare elektrostatiska bindningar. Vätebindningar är vidare exv viktiga för ämnens vattenlöslighet. Relationen (65) härleds tämligen enkelt för ideala gaser. Från (21) och (57) har vi nämligen, (66) dF = -p dV - S dT som ger ∂F/∂V = -p. För en ideal gas har vi p = nRT/V och föregående ekvation kan integreras till (67) F = n[ƒ(T) + RT In(p/po)], där po betecknar ett referenstryck, och ƒ en karaktäristisk funktion för ämnet. Gibbs energin G = F + pV kan alltså skrivas på en liknande form, (68) G = n[G°(T) + RT In(p/po)] . Vidare kan vi skriva (69) Gi = Ni[Gi°(T) + RT In(pi/po)] (antalet mol = Ni) för ämnenas Gibbs energi där pi betecknar partialtrycket pi = ci po (ci = Ni/N; N = totala molantalet). För reaktionen (63) erhåller vi (70) ∆G = ∆G° + RT In K. För dynamisk jämvikt gäller ∆G = 0 vilket leder till jämviktsvillkoret (65). [Strukturalstrande modell -- exv game-of-life typ. Jfr turbulensfenomen.] 8*. Termodynamik med differentialformer Vi utgår från den grundläggande ekvationen (21) (21) T dS = dU + p dV. Denna ekvation innebär att formen T dS - p dV = dU är en exakt differential. Vi har därför sambandet 0 = d(T dS - p dV) = dT ∧ dS - dp ∧ dV för det termodynamiska systemet. Vi inför 2-formen (M Tulczyjew 1977) (71) ω = dV ∧ dp + dT ∧ dS. Formen ω är alltså definerad över ett fasrum F med kordinaterna (p,V,S,T). Det termodynamiska systemet karaktäriseras av delrummet M av möjliga tillstånd som satisfierar (72) ω|M = 0. Formen ω för fasrummet F kallas för en symplektisk form, och kan jämföras med den symplektiska formen (73) Ω = ∑ dp ∧ dq definerad för fasrummet med kordinaterna (p,q) i klassisk partikelmekanik. 2-formen ω kan uppenbarligen skrivas som en differential av följande fyra 1-former, (74) θu = -p dV + T dS θf = -p dV - S dT θg = V dp - S dT θh = V dp + T dS (ω = dθ). För tillståndsrummet M gäller, eftersom dθ|M = 0, att alla formerna (74) kan för M skrivas som differentialer av funktioner ("potentialer") definerade över M, (75) dU = -p dV + T dS dF = -p dV - S dT dG = V dp - S dT dH = V dp + T dS. Dessa potentialer motsvarar de konventionella termodynamiska funktionerna som brukar införas i termodynamiken. Tillståndsmångfalden M kan exv beskrivas med hjälp av U (som kallas för en genererande funktion för M) enligt ekvationerna, (76) -p(V,S) = ∂U/∂V; T(V,S) = ∂U/∂S (⇔ θu|M = dU|M), och så vidare för de övriga potentialerna. (M är ett sk Lagrange delrum till fasrummet; den uppfyller ekv (72) och har dimensionen n ifall fasrummet har dimensionen 2n.) Vi kan överföra de olika potentialerna i varandra genom sk Legendre transformationer; t ex har vi, (77) dG = dF + d(pV) ⇒ G = F + pV. Vi kan som ett exempel ge en tillståndsekvation för den ideala gasen, skriven på formen (78) pVγ = k exp(S/C V) ⇔ S = CV In (pVγ/k), där k är en kosntant och där CV, definerad genom (79) CV = (∂U/∂T)V, antas också vara en konstant. Kombinerar vi (79) och (78) med (21) kan vi erhålla följande tillståndsekvation för den ideala gasen, (80) pV = CV(γ - 1) T (med relationen CV(γ - 1) = R, R är gaskonstanten). Insätter vi exv (78) i (75.1) erhåller vi för potentialen U (inre energin) uttrycket, (81) U(V,S) = [k/(γ- 1)] V(1 - γ) exp(S/C V). En liknande räkning kan upprepas för de övriga potentialerna. Enligt föregående formulering är entropin en variabel som utvidgar (p,V,T)-rummet till ett fasrum (symplektiskt rum). För dess introduktion i detta sammanhang kan vi exv följa Carathédoros metod. Litteratur GL Baker, "A simple model of irreversibility", Am. J. Phys. 54 (8), 701-708, 1986. J Kijowski, M Tulczyjew, A Symplectic Framework for Field Theories, Springer 1979 (till avsnitt 8). TL Hill, An Introduction to Statistical Thermodynamics, Addison-Wesley 1960. L Landau, EM Lifshitz, Statistical Physics, Addison-Wesley 1958. J Arponen, Statistinen Fysiikka, Liimes 1994. BH Lavenda, Thermodynamics of Irreversible Processes, Dover 1978. PW Atkins, The Second Law - Energy, Chaos, and Form, WH Freeman 1994. SG Brush, The Kind of Motion We Call Heat - A History of the Kinetic theory of Gases in the 19th Century, vol. 1 and vol. 2, North-Holland 1976. JS Wicken, Evolution, Thermodynamics, and Information- Extending the Darwinian Program, Oxford UP 1987. J Serrin, Foundations of Classical Thermodynamics, University of Chicago Press 1975. I Prigogine, Introduction to Thermodynamics of Irreversible Processes, Interscience Publishers 1967. HA Bent, The Second Law - An Introduction to Classical and Statistical Thermodynamics, Oxford UP 1967. W Yougrau, Treatise on Irreversible and Statistical Thermophysics - An Introduction to Nonclassical Thermodynamics, Dover 1982. Shang-Ken Ma, Statistical Mechanics, World Scientific 1985. [tidsassymmetri] JJ Halliwell et al. (eds), Physical Origins of Time Asymmetry, Cambridge UP 1994. F Hoyle, JV Narlikar, Lectures on Cosmology and Action-at-a-distance Electrodynamics, World Scientific 1996. N-E Fagerholm, Termodynamiikka, Otakustantamo 1986. D Jou, J Casaz-Vázquez, G Lebon, Extended Irreversible Thermodynamics, Springer 1996.