TDDC30 Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 8 Erik Nilsson, Institutionen för Datavetenskap, LiU På denna föreläsning: • Träd • Traversering • Insättning, borttagning • Representation som länkad nod, array 1 Scenario • Harry har fått i uppdrag att bringa ordning och reda till ett företags chefstruktur med ett nytt program • Harry börjar med att skriva in alla anställda i en enkellänkad lista, men det blir snabbt krångligt • En ny datastruktur behövs! 2 Grafteori • En graf Sverige Norge Finland • Består av noder & bågar • T.ex. länder och sina grannar… • En riktad graf • Sätter riktning på bågarna Vakna På morgonen Gå till sängs • T.ex. Ett tillståndsdiagram • En riktad acyklisk graf (DAG) Gå till jobbet Jobba Gå hem Agnes • Innehåller inga cykler • T.ex. Ett släktträd. Laura Erik Torbjörn Tracy 3 Träd Definition (datastruktur*): • Ett träd är en riktad acyklisk graf (DAG) • och det finns enn väg till varje nod Vanliga användningsområden: • Representering av hierarkier (ex): • Organisationer • Släktträd (DAG) • Filsystem(mappar/filer) • Spara data för snabb sökning *Inom grafteorin är träd en acyklisk oriktad graf. 4 Scenario • Harrys resultat: VD Adam Adamsson Utvecklingschef Berta Bengtsson Säljchef Caesar Cesarini Ekonomichef Diana Didriksson Hackaren Harry 5 Träd(2) Definition: • Förälder: en nod som har minst ett barn • Syskon: noder med samma förälder • Rot: en nod utan förälder • Löv: en nod utan barn • Gren/delträd: en samling noder med gemensam anfader Rot Förälder Barn Syskon Gren Löv 6 • Träd defineras rekursivt: Ett delträd är också ett träd, som kan innehålla fler delträd, eller bara en nod (d.v.s. ett löv) Träd(3) Nodinformation: • Grad: Antal barn noden har • Djup: Avstånd från roten • Höjd: Avstånd till lövet längst bort, nedåt Djup 0 • Trädets höjd = Rotens höjd 1 2 3 • Träd med noder av grad ≤ 2: Binärt träd Grad: 2 Djup: 1 Höjd:2 7 ADT Träd element() Returnerar datat i rotnoden (för delträdet) parent() Returnerar föräldranoden (implementeras inte alltid) children() Returnerar en kollektion(t.ex. en lista) med nodens barn isInternal() Testar om noden är en inre nod d.v.s. om den har barn isExternal(), isLeaf() Testar om noden är en yttre nod d.v.s. om den är ett löv isRoot() Returnerar sant om noden ej har någon förälder isEmpty() Testar om (del)trädet har några noder överhuvudtaget Binära träd left() Returnerar det vänstra barnet right() Returnerar det högra barnet hasLeft() Testar om noden har ett vänsterbarn hasRight() Testar om noden har ett högerbarn 8 Traversering • Traversering: Ett systematiskt sätt att ”besöka” alla noder i ett träd • En träd-iterator implementerar någon form av traverseringsalgoritm • Djupet-först • Bredden-först 9 Preorder-traversering Algoritm: 1. Besök mig 2. Besök vänstra delträdet 3. Besök högra delträdet = Delträd 10 Inorder-traversering Algoritm: 1. Besök vänstra delträdet 2. Besök mig 3. Besök högra delträdet = Delträd 11 Postorder-traversering Algoritm: 1. Besök vänstra delträdet 2. Besök högra delträdet 3. Besök mig = Delträd 12 Levelorder-traversering Algoritm: 1. Besök mig 2. Besök mina syskon till höger 3. Besök de som har djup + 1 Djup 0 1 2 3 13 Några fler termer • Fullt binärt träd: Samtliga noder har noll eller två barn • Perfekt träd: Ett fullt träd med alla löv på samma djup • Fullständigt binärt träd: Ett perfekt träd med skillnaden att den får sakna några av de ”högraste” löven, längst ned 14 Binärt sökträd • En typ av binärt träd • En struktur för snabb sökning För varje nod gäller följande: • Alla element till vänster är mindre än nodens värde • Alla element till höger är större än nodens värde - + + - - • Nackdel: kan inte spara två element med samma värde. 15 Binärt sökträd • Sökning går snabbt! • Hur snabbt? - Vi fokuserar på balanserade träd och kollar på vad som händer när n ökar: n = 15 n=3 => max 1 ”steg” => max 3 ”steg” n=7 => max 2 ”steg” Allmänt fall: För ett balanserat träd blir det maximala antalet steg som vi måste gå för att hitta vårt sökta värde lika med trädets höjd => O(log(n)) 16 Addering i binärt sökträd För varje nod som besöks: • Existerar ej noden: Rätt plats funnen • Är värdet mindre än nodens: följ den vänstra grenen • Är värdet större än nodens: följ den högra grenen - + + - - 17 Borttagning i binärt sökträd Steg 1, 2, 3: Mål: ta bort värdet 3 Strategi: 1. Sök ut rätt nod på liknande sätt som vid adderingen 2. Sök reda på en ersättare: 1. 2. 1 - 4 1 - 2 7 + + - 6 - 9 8 5 4 - 3 2 Om bara ett barn finns, välj det Annars välj noden längst till vänster i det högra delträdet. Steg 4: 3. Koppla loss ersättaren, ersätt den med dess högra delträd om ett sådant finns 4. Sätt in ersättaren på dess nya plats - 3 5 + 6 7 + 8 9 18 Borttagning i binärt sökträd(2) Det färdiga trädet efter borttagningen - 1 2 4 - + 7 + 6 9 8 5 19 Representation • Träd brukar vanligtvis implementeras som länkade noder Parent(optional) data left right 20 Representation(2) Parent(optional) data left right • Kodexempel, som generisk klass class TreeNode<DataType> { TreeNode parent; DataType data; TreeNode left; TreeNode right; } 21 Representation(3) Parent(optional) data left right • Då delträd också är träd lämpar sig strukturen väl för rekursiva algoritmer Exempel: Preorder-traversering public void visitPreorder(TreeNode node){ node.visitMe(); visitPreorder(node.left()); visitPreorder(node.right()); } 22 Representation(4) Parent(optional) data left right • Stackar och köer kan också användas för traversering Exempel: Levelorder-traversering (Börja med att lägga roten i en kö) 1. Hämta en nod från kön 2. Besök noden 3. Lägg vänster och höger barn i kön 4. Repetera så länge kön inte är tom 23 Representation med fält • Träd kan även implementeras med ett fält! A ADT B D G C E Representation A B C D E F G H F H Traverseringsregler för binärt träd: Index för root 0 Index för vänster barn 2*i+1 Index för höger barn 2*i+2 Index för förälder (i-1)/2 (avrunda nedåt) 24 Implementation som fält(2) Egenskaper för fältrepresentation • Slipper tre pekare per element AB CD E F G H • Mindre minne • Traversera m.h.a. aritmetiska operationer (2*i + 1) • Minne kan preallokeras (vanligtvis ett träddjup i taget) • Fält allokeras som sammanhängande stycken av datorminne • => Hög spatial lokalitet => Snabbt • Varje new är ett anrop till OS för att be om minne, tar tid • Tenderar att bli svårare att implementera • Ett dåligt balanserat träd ger ineffektivt minnesutnyttjande 25