HTML (HyperText Markup Language) Standard CDT212 Vetenskapsmetodik 090224 Gustavsson Patric [email protected] Palosaari Jari [email protected] SAMMANFATTNING Den här rapporten kommer att ta upp historien bakom internet, hur allting började en gång i tiden och hur utvecklingen har gått framåt. Det kommer att visas hur den första HTML koden fick sin början genom en fysiker vid namn Tim Burnes-Lee och vad som var hans tanke med HTML kod. Alla de olika versionerna som har funnits genom åren kommer att beskrivas samt vilka av versionerna är och har varit standarder. Det kommer även tas upp kommande standard för HTML, som är fortfarande under utvecklingsarbete. Ett enkelt exempel kommer att visas både som HTML kod samt hur sidan ser ut i en webbläsare. Beskrivningar på hur man skriver HTML kod kommer att finnas med och även en länk till en webbsida på internet, där man kan själv prova på att skriva HTML kod samt kunna se resultatet direkt på samma webbsida genom en enkel knapptryckning. 2 INNEHÅLLSFÖRTECKNING INNEHÅLLSFÖRTECKNING ................................................................................................ 3 INLEDNING .............................................................................................................................. 3 HTML STANDARD .................................................................................................................. 3 Bakgrund ............................................................................................................................... 3 Varför HTML ......................................................................................................................... 4 Grunden ................................................................................................................................ 4 CSS ........................................................................................................................................ 5 Exempel ................................................................................................................................ 5 Versioner ............................................................................................................................... 6 Avslutning ................................................................................................................................. 8 SLUTSATSER.......................................................................................................................... 8 REFERENSER......................................................................................................................... 9 INLEDNING Rapporten är framarbetad av två studenter som går vetenskapsmetodik kurs på Mälardalens Högskola i Västerås, våren 2009. Ett av delmomenten i kursen är att skriva en vetenskaplig rapport om valfritt ämne, i detta fall HTML Standard. Uppgiften går ut på att söka information om de olika standarder som finns och har funnits i HTML, skriva denna rapport om det samt göra en muntlig presentation av uppgiften. Begränsningarna i denna rapport är att rapporten måste innehålla 2500-3000 ord eller att innehållet ska rymmas på 7-9 sidor. Detta har medfört att det inte finns möjligheter att få med all versionshistoria med alla skillnader i och med att det inte skulle få plats. Istället beskrivs versionerna samt historian bakom HTML i en väldigt kortfattad version. Kursen går även ut på att samtidigt kritiskt granska någon annan students rapport samt opponera mot den, likaså sker opposition mot denna rapport där andra studenter får chansen att kritiskt granska samt opponera mot den. Syftet med kursen samt rapporten är att ge studenterna klara riktlinjer om hur en vetenskaplig rapport ska skrivas och utformas. Kursen är ett krav till att få göra ett examensarbete. HTML STANDARD HyperText Markup language, HTML är standard språket att skriva webbsidor i idag. Tanken bakom detta språk att HTML dokument ska kunna läsas av alla Webbläsare oberoende på vilket operativsystem du har. Här kommer det lite exempel och bakgrund om hur det fungerar[1]. Bakgrund Dagens internet föddes egentligen genom ARPANET, som är döpt efter sin sponsor ARPA (Advanced Research Projects Agency) och var den första hopslagningen av 4 universitet i USA. Det var militären som först skapade nätverket för att man skulle kunna kommunicera utan att vara beroende av bara en datorcentral, och de styrde nätet fram till 1983 då man skilde det militära nätet, MILNET från det övriga. Redan 1977 så kopplade andra nät upp sig mot 3 ARPANET. 1990 så flyttades det mesta av trafiken över från ARPANET till det nya NSFNET från National Science Foundation som kom att bli det nya internet. Det som vi dagligen kallar internet är egentligen WWW (World Wide Web) som är en sammankoppling av dokument som hänvisar till varandra. 1992 så skapade Tim Burnes-Lee den första versionen av HTML som ett hjälpmedel att sprida informationen för fysiker i världen på ett bättre sätt. Så var HTML också fött [2]. Dagens internet är världens största nätverk, eller ett nätverk av nätverk där alla kan fritt byta information. Ingen vet egentligen hur stort internet är, eftersom det består av separata nätverk och inte av något centralt register som styr det hela. Men internet växer enormt mycket varje dag som går. Varför HTML Grundtanken med HTML är att endast text ska föras över nätet. Detta betyder att innehållet som ska visas i webbläsaren tolkas samt presenteras av webbläsaren själv. Användaren ska själv kunna bestämma t.ex. hur länkar ska visas, storleken för brödtext, typsnitt m.m. HTML är ett sidbeskrivningsspråk som används för att skapa de webbsidor som utgör World Wide Web. Det är en öppen standard, som betyder att det inte behövs någon licens för att använda HTML koden. Det är fritt fram och kunna göra t.ex. egna webbläsare. Det är ganska enkelt att lära sig HTML och man behöver bara ett vanligt textredigeringsprogram för skrivandet, och en webbläsare för att se hur sidan ser ut. Grunden En HTML sida kan skapas i vilket textredigeringsprogram helst, bara man sparar filen som .html eller .htm (spelar ingen roll vilket som), dvs. som ren text. Det som styr hur sidan kommer att se ut är olika element som identifieras av taggar. Elementet har en starttagg <taggnamn> och en sluttagg </taggnamn>, som exempel <b>text</b> där texten text som står mellan taggarna blir fet. En enkel HTML sida är uppbyggd av 3 huvudelement, <HTML></HTML> och det är själva sidan och i vilket språk man använder sig av. Nästa element är <HEAD></HEAD> det är själva huvudet på sidan, där det står information som inte kommer att synas på sidan. Sedan har vi elementet <BODY></BODY> det som skrivs mellan dessa taggar har vi det som kommer att synas på själva sidan. Ett litet grundexempel kommer nedan: <HTML> <HEAD></HEAD> <BODY> </BODY> </HTML> De flesta elementen kan ha olika egenskaper, som kallas för attribut. Ett attribut är en egenskap som man kan tilldela ett element, så som storlek, färg, eller placering av texten. För att ett attribut ska ha någon verkan så måste man ange ett värde på attributet, t.ex. <h1 align=left>Rubrik</h1> där man talar om att rubriken ska stå till vänster på sidan [3]. 4 Några vanliga element är: <title></title> Här skriver man sidans titel, som kommer att synas i namnlisten på webbläsaren. Elementat placeras inom elementet <head> <h1></h1> Huvudrubrik med stor text, finns även olika storlekar ner till h6. </p> </br> är styckes avdelare respektive radbrytning som kan anges som både start och sluttagg i samma tagg. Här är ett exempel på hur ett länkelement är uppbyggt: <a href="http://testsida.se">Min sida</a> här ser man att texten min sida är en länk till http://testsida.se Det finns 4 kategorier av element i HTML [4]: Rubrik Strukturmärken som beskriver syftet med texten, t.ex. <h1> </h1> Presentationsmärken som beskriver stilen på texten t.ex. <i>kursiv</i> Hyperlänkmarkeringar som länkar antingen inom dokumentet eller till en annan webbplats. Där kan man också styra hur länken ska se ut om man hovrar över den eller om man redan har besökt länken osv. Interaktiva element som skapar interaktiva objekt så som listor eller knappar. Om man nu gör en enkel sida i ett WYSIWYG (What You See Is What You Get) [5] program som t.ex. Dreamweaver så kan man se att programmet automatiskt lägger till lite text om verifiering och vilken typ av standard som man använder sig av. Det gör ju att det underlättar arbetet med att få en sida som håller enligt standarden som gäller. Det är bara att skriva in text och programmet lägger in taggar och den kod som behövs. CSS CSS är stilmallar som ger möjligheter för den som skapar webbsidor att styra flera webbsidor samtidigt när det gäller färg, teckensnitt, justering av text och objekt m.m. Med en enda CSS stilmall kan man styra tusentals webbsidor och genom att bara göra en ändring i CSS mallen så sker ändringen i alla webbsidor som använder mallen. Det här sättet att jobba med webbsidor är väldigt effektivt samt sparar på en massa tid. Samtidigt har man möjligheter att skriva CSS som en lokal mall direkt i koden på en webbsida och då gäller de lokala CSS reglerna före de externa. Samtidigt är målet med CSS att ge läsaren möjlighet att påverka utseendet av sidan [6]. CSS1 (Cascading Style Sheets). W3C rekommendation December 1996, reviderad i April 2008. CSS2 Utkom 1998 och gav möjligheter att formge hela webbsidan med positionerade rektangulära områden (boxar) som tidigare bara varit möjligt med tabeller. Idag är CSS3 under arbete och är inte helt färdig. CSS3 kommer att ersätta CSS1 samt CSS2 [7]. Exempel Här kommer ett litet exempel på hur en sida kan se ut rent textmässigt i notepad.exe och sedan hur samma sida ser ut i Windows Explorer. 5 Exempel på en webbsida öppnad i notepad.exe Exempel på hur webbsidan som den ser ut i Windows Explorer. Versioner HTML 1.0 Den här versionen var den första som släpptes 1992. Innan 1990 var det väldigt svårt att hämta information via internet, så en fysiker vid namn Tim Berners-Lee hittade på ett sätt att indexera informationen på nätet. Hans lösning var att använda hypertextlänkar som gjorde att man kunde gå från en informationskälla till en annan på ett enkelt sätt. Detta sätt 6 kom att kallas för HTML. Webbservrar ute på nätet som hade stöd för HTML växte fort och runt 1993 fanns det ungefär 100 webbservrar som hade stöd för HTML. HTML 2.0 Den här versionen var den första riktiga standarden som stöds till stor del av alla webbläsare och många webbsidor idag är byggda på den här standarden. Den här versionen publicerades november 1995 och var standarden för alla webbsidor fram till januari 1997. HTML 3.0 Fler och fler människor började arbeta med webbsidor och kraven började komma om att kunna göra bättre webbsidor. Sidor med bättre utseende så att de som kom till sidan skulle tycka om sidan samt att de skulle återkomma. Samtidigt började problemen med HTML standarder. Netscape var den ledande webbläsaren den här tiden som började med lite egna taggar samt attribut som användes i deras webbläsare. Detta skapade problem för de övriga webbläsarna på marknaden. HTML 3.2 (wilbur) 1994 skapades "World Wide Web Consortium" (W3C) för att hålla kontroll över standarder, se till att uppbyggnaden av koden går rätt väg samt att den håller standarden så att webbläsare klarar av HTML koden fullt ut. W3C första arbete för att skapa en gemensam standard för alla webbläsare blev kallad "wilbur", senare även kallad för HTML 3.2. Den skapades tillsammans med IBM, Microsoft, Netscape Communications Corporation, Novell, SoftQuad, Spyglass och Sun Microsystems. HTML 3.2 blev den officiella standarden i januari 1997. Idag stödjer praktiskt taget alla webbläsare HTML 3.2 fullt ut. HTML 4.0 (cougar) HTML 4.0, som hade kodnamnet "cougar" skiljer sig från föregångaren genom att ha lite fler nya taggar samt att den kan hantera Cascading Style Sheets (CSS). Internationaliseringen är också viktig i den här versionen. Nu kan man göra mer användarvänliga sidor för olika språk. Skapandet av tabeller och formulär är förbättrade, samt en massa nya sätt att inkludera script i HTML. Rekommendationen från W3C till att gå över till den här versionen kom december 1997 samt blev den officiella versionen april 1998. När HTML 4.0 varit ute ett tag, uppdaterades dokumentationen från vissa fel och den slutgiltiga versionen kallades då HTML 4.01 och publicerades i december 1999. XHTML 1.0 (Extensible HyperText Markup Language) Är en vidareutveckling av HTML som fick W3C-rekommendation 26 januari 2000. XHTML [8] kom till för att få bort dåligt skriven HTML kod som finns ute på internet, detta på grund av att vanlig HTML kod fungerar trots att det finns fel i koden. XHTML är mera krävande på den som skriver koden. Det första steget mot en modulär och utvidgningsbar ”web” baserad på XML (eXtensible Markup Language) [9]. Syftet med XML är att kunna utväxla data mellan informationssystem. Meningen är att man ska kunna strukturera samt organisera information och data till skillnad från HTML som används till att åskådliggöra samt visa data. Olikt HTML kan XHTML utökas/utvidgas av vem som helst som använder det. Nya attribut och taggar kan definieras och läggas till de som redan existerar. XHTML är baserad på det striktare XML till skillnad från HTML som är baserad på det flexiblare SGML (Standard Generalized Markup Language) [9] som är ett format för strukturerad text. Sedan januari 2000 står XHTML 1.0 tillsammans med HTML 4.01 som standard. HTML 5.0 är en kommande standard under arbete och tanken är att kunna ersätta både HTML 4.01 samt XHTML 1.0. Arbetet startades av WHATWG (Web Hypertext Application Technology Working Group) [10] och är den femte huvudversionen av HTML. Utvecklingen 7 av bakåtkompabilitet med existerande HTML är ett av ledorden. HTML 5.0 innehåller tekniker för ljud, video, grafik samt webbapplikationer, såväl som text och bild. Informationen till versionshistorian kommer från dessa 2 länkar [11] [12]. Avslutning Det här med webbsidor har ju blivit så att i stort sett alla företag behöver en sådan för att kunna nå fram till sina kunder. Det finns väldigt många och även bra webbsidor om hur man gör en egen webbsida och många bra guider till tips och trix. Eller så anlitar man något av alla företag som gör webbsidor, finns både proffs och amatörer, där det antingen görs hela paketet med webbhotell och domänadresser osv. eller bara själva sidan där man får göra uppdateringar själv. Det som är bra med det nya sättet att göra webbsidor (att använda CSS) är att man gör en sidmall och sen har man den mallen som grund för resten av sidorna på webbplatsen. Gör man en ändring av t.ex. bakgrundsfärgen så slår det igenom på alla sidor. Enkelt att styra upp en stilig design som finns på hela webbplatsen. w3schools har en gratissida med en massa guider till HTML, XHTML, XML m.m. Där kan du t.ex. se hur koden ser ut och samtidigt se hur sidan ser ut i en webbläsare, dynamiskt så ändrar man något så syns det hur det slår ut på sidan [13]. SLUTSATSER Det som styr HTML standarden och det som härrör webben i stort är ett konsortium som heter W3C (World Wide Web Consortium), och består av fler än 510 medlemmar och nästan 60 heltidsanställda medarbetare runt om i världen. W3C’s medlemmar kommer ifrån ledande industrier, forsknings- och utvecklingsinstitut, standardiseringsorgan, regeringar samt EU. W3C’s mål är: ” att se till att webben når sin fulla potential, vilket görs genom att utveckla teknologier (specifikationer, riktlinjer, programvara och verktyg) som kommer att skapa ett forum för information, handel, inspiration, fritt tänkande och gemensamma insikter”, hämtat från W3C’s svenska hemsida [14]. Det stora som är i antågande är att den nya standarden HTML 5 som kommer bli en standard för både HTML och XHTML och inkluderar tekniker för ljud, video, grafik och webbapplikationer. Det är bra att nu i den nya standarden så har även tillverkarna av webbläsarna arbetat tillsammans för att skapa den bästa möjliga vägen framåt för webben [15]. En del svårigheter som finns nu är att om man gör en webbsida så kan den se väldigt olika ut i olika webbläsare, och det är en bra sak med den nya standarden som förhoppningsvis jämnar ut skillnaderna. 8 REFERENSER [Titelsida] Bilden kommer från http://www.w3.org/ 090212 [1]http://www.tiger.se/dok/htmltext.html 090306 [2] http://www.passagen.se/funktioner/hjalp/internet/internet_dok/historia.shtml 090309 [3]http://vonpepel.com/ref/html/attribut.html 090306 [4] http://sv.wikipedia.org/wiki/HTML 090306 [5] http://sv.wikipedia.org/wiki/WYSIWYG 090306 [6] http://sv.wikipedia.org/wiki/Cascading_Style_Sheets 090306 [7] http://www.w3.org/Style/CSS/#specs 090306 [8] http://en.wikipedia.org/wiki/Xhtml 090306 [9] http://en.wikipedia.org/wiki/Xml 090306 [10] http://en.wikipedia.org/wiki/WHATWG 090306 [11] http://www.yourhtmlsource.com/starthere/historyofhtml.html#1.0 090219 [12] http://www.cs.umu.se/kurser/TDBD07/VT00/esem/esem4.html 090219 [13] http://www.w3schools.com/html/html_examples.asp 090306 [14] http://w3c.sics.se/resources/office/translations/sevenpoints.html 090306 [15] http://susning.nu/HTML 090306 9