Historien om Internet CDT212, 2007-10-19 Johan Hägg Jonas Nilsson NCV01 NCV01 [email protected] [email protected] © Donna Cox and Robert Patterson Sammanfattning Rapporten går igenom de händelser och teknologiska framsteg som har lett till det vi idag kallar för Internet och World Wide Web. Historien började i huvudsak med att en forskare fick idéer om ett globalt nätverk där man skulle kunna komma åt all information som fanns i nätverket på alla ställen. Detta ledde så småningom till att ARPANET byggdes. ARPANET var ett nationellt nätverk i USA som från början bestod av både akademiska och militära stordatorer. Därefter följde en rad tekniska framsteg som bland annat tillät ett flertal nätverk att kopplas samman. Detta kopplat med uppfinningar utvecklade på CERN skapade slutligen det vi idag kallar för Internet. Rapporten kommer även att ta upp vissa tjänster som man kan använda via Internet så som World Wide Web och Usenet samt dess historia. Rapporten tar även upp en approximation av Internets tillväxt och lite av de problem som uppkommit i och med den frihet som finns på Internet. 2 Innehållsförteckning INLEDNING....................................................................................................................... 3 ARPANET .......................................................................................................................... 3 Historia............................................................................................................................ 3 Andra länder kopplas in i ARPANET ............................................................................ 5 RFC ..................................................................................................................................... 5 Usenet ................................................................................................................................. 5 TCP/IP................................................................................................................................. 5 CERN & Internet i Europa .................................................................................................. 6 TCP/IP i Europa .............................................................................................................. 6 Europa och Internet ......................................................................................................... 7 World Wide Web ................................................................................................................ 7 Historia............................................................................................................................ 7 HTTP & Gopher ............................................................................................................. 7 Webbläsare ...................................................................................................................... 8 WorldWideWeb .......................................................................................................... 8 Mosaic ......................................................................................................................... 8 Internet & World Wide Web........................................................................................... 8 SLUTSATS ......................................................................................................................... 9 Referenser ........................................................................................................................... 9 INLEDNING Hur kom Internet till? Vad var det för tekniska framsteg som gjorde det möjligt att skapa detta globala nätverk som vi i dagsläget nästan tar för givet? Detta är frågorna som denna rapport tänker besvara. ARPANET Historia När man skall titta på hur Internet uppkom får man gå tillbaks till augusti 1962. Då skrev Joseph Carl Robnett Licklider vid MIT (Massachusetts Institute of Technology) en rad texter om ett så kallat Galactic Network. I dessa texter presenterade han en idé om ett antal ihopkopplade datorer utspridda över hela världen, att informationen som fanns på alla dessa ställen kunde delas och kommas åt från alla ställen. Dessa tidiga idéer om ett världsomspännande datornätverk där information kan kommas åt överallt är det som på senare tid har blivit Internet. Ett år senare började Licklider arbeta på ARPA. ARPA står för Advanced Research Projects Agency, och är en del av USA:s försvar. På ARPA övertygade han två andra kollegor om att hans koncept verkligen var något att utveckla vidare. Men Licklider hann själv lämna ARPA innan något arbete på detta nätverk hann påbörjas. År 1967 publicerade Lawrence G. Roberts den första planen för något som kom att kallas för ARPANET. Efter att detta gjorts utarbetades en mer komplett och detaljerad plan över hur detta nätverk skulle kunna byggas. Det blev företaget BBN (Bolt Beranek and Newman) som fick kontraktet om att bygga ARPANET åt ARPA. BBN följde Roberts plan i minsta detalj, som bestod i att man byggde upp nätverket med hjälp av små 3 datorer, så kallade IMP (Interface Message Processor). Dessa IMP använde en teknik som kallas store-and-forward paketöverföring. De var uppkopplade mot varandra med modem som använde s.k. leased lines som var ständigt uppkopplade mot varandra via telenätet med en hastighet av 50 kbit/sekund. De datorer som sedan använde sig av nätverket kopplades mot denna IMP med en seriell överföring [FUNET98, Walden03]. I det allra första stadiet bestod ARPANET av fyra olika IMP:er som fanns på olika universitet i Los Angeles, Stanford, Santa Barbara och Salt Lake City. Dessa var uppkopplade i december 1969. Arbetet med ARPANET fortsatte och det utvecklades ett protokoll som användes över hela ARPANET. Detta protokoll kallades för NCP (Network Control Protocol), och detta användes över hela ARPANET i början. I oktober 1972 visades ARPANET upp på en datorkonferens. Samma år började även epost att användas och det första e-post-programmet utvecklades. E-post var ett bra redskap för de som arbetade inom ARPANET-projektet att utbyta information med varandra. Detta var något som snabbt blev populärt och redan 1973 stod e-posttrafiken för 75% av all trafik på ARPANET. Allt eftersom blev också fler universitet och institutioner uppkopplade mot ARPANET, 1981 fanns det 113 olika IMP:er (noder) uppkopplade mot ARPANET. Året 1983 är ett ganska viktigt årtal eftersom det var då USA:s militära del av ARPANET splittras från den akademiska delen när militären flyttar sina noder som tidigare ingått i ARPANET till sitt nya nätverk som kallas för MILNET. Detta innebar att endast ungefär hälften av noderna fanns kvar i ARPANET. Det som skiljde ARPANET från tidigare nätverk var dels att det blev så pass världsomspännande, hela USA samt även vissa noder utanför USA, men även det faktum att det var det första nätverket som gick från en centraliserad nätverksmiljö till en decentraliserad. Tidigare datornätverk som fanns att tillgå gick ut på att datorerna anslöt till en och samma stordator för att komma åt information på denna. Det nya med ARPANET var att alla datorer kunde dela information med varandra utan att allt behövde gå via en och samma stordator. En annan sak som var nytt med ARPANET var att man hade så kallade IMP:er som själv skötte datatrafiken i nätet, istället för tidigare då detta fanns direkt i datorn när man hade decentraliserade datornätverk. IMP-enheterna går att jämföra med dagens routrar som bygger upp dagens nätverk och sköter datatrafiken i näten. En vanlig myt som man ofta hör om ARPANET är att det skulle ha varit atombombsäkert. ARPANET klarade visserligen en del felaktigheter i nätverket, mest beroende på att telefonlinjerna som nätverket var uppkopplat med inte höll så bra klass på den tiden vilket ledde till att data ibland förlorades under överföringarna, men att det skulle vara atombombsäkert var en överdrift. Anledningen till att man ofta hör detta är att det ungefär samtidigt som man ARPANET började utredas så kom det en annan undersökning från RAND (en forskningsinstitution inom USA:s försvar). Denna forskning utredde möjligheterna att skapa ett nationellt nätverk för USA:s försvar att användas för röstsamtal som skulle vara atombombsäkert. En annan myt som är vanlig är att USA:s försvar skulle velat utveckla ett atombombsäkert datornätverk, och att det var därför ARPANET blev utvecklat. Men i denna rapport har vi visat att det i själva verket var flera forskares enskilda prestationer 4 som ledde till ARPANET. Visserligen hela tiden med organisationen ARPA i botten (som var en del av USA:s försvar). Nätet var hela tiden kopplat både mot universitet och andra institutioner så väl som militära institutioner [Leiner03, Wikipedia07a]. Andra länder kopplas in i ARPANET Den första icke-amerikanska uppkopplingen mot ARPANET gjordes via en satellitlänk till NORSAR i Norge år 1973 (denna länk gick faktiskt via den nordiska satellitstationen i Tanum i Sverige). Via denna uppkoppling till Norge kunde man även nå en nod som fanns i London. På så vis blev dessa de två första länder förutom USA att bli inkopplade till ARPANET. Senare, under år 1983 kom även en snabbare överföring till Norge, men denna gång inte via satellit, utan via kabel. Efter detta kom ARPANET att spridas ut mer och mer över Europa och mot slutet av 1980-talet kan man säga att det som vi idag kallar Internet började byggas upp. ARPANET togs helt ur bruk den 1 januari 1990 [NORSAR03, Leiner03]. RFC RFC står för ”Request for Comments”. Detta är en typ av dokument där forskare och andra som sysslade med nätverksteknik kunde beskriva till exempel en ny teknik de uppfunnit och ville dela med andra och få kommentarer på, därav Request for comments. RFC är något som var en del av ARPANET projektet och det första RFC-dokumentet uppstod samma år som de första delarna av ARPANET kopplades upp (1969). Denna typ av dokument är lite mindre formell än en vetenskaplig artikel. Man kan säga att många av dessa RFC:er är Internet-standarder över hur saker och ting fungerar och bör användas på Internet. Dessa RFC:er distribuerades över ARPANET till andra som sysslade med detta projekt. Detta var en ganska stor omställning i hur information distribueras jämfört med tidigare. Denna utgivning har pågått sedan dess och nu finns det 5072 stycken RFCdokument utgivna. På den officiella RFC-hemsidan www.rfc-editor.org kan man läsa alla dessa dokument. Där kan man även läsa RFC nummer 2223, som är en RFC över hur man skriver RFC-dokument [Postel97, Wikipedia07b]. Usenet Usenet är en teknik att förmedla nyheter och diskussioner på Internet. Denna skapades 1979 och består av en mängd Usenet-servrar som synkroniserar diskussionsgrupperna med varandra så att samma information finns tillgänglig på alla Usenet-servrar (i bästa fall). Diskussionsgrupperna är uppdelade i olika hierarkier, till exempel diskussionsgrupper om datorer börjar sitt namn på comp., diskussioner som handlar om vetenskap börjar sitt namn på sci. Dessa diskussionsgrupper var ett väldigt bra sätt att sprida information på Internet. Numera har Usenet förlorat sin betydelse i och med att det nu finns Webbtjänster, Webbforum osv. istället. Usenet finns fortfarande kvar och används, i vissa fall har den blivit integrerad med Webbtjänster så att man kan komma åt diskussionsgrupperna via till exempel Google Groups [Wikipedia07d]. TCP/IP Som det har beskrivits tidigare i rapporten så användes protokollet NCP för att överföra data på ARPANET. NCP användes från ARPANET:s start fram till slutet på år 1982. 5 Arbete hade pågått med ett nyare och bättre protokoll sedan 1973. Runt denna tid (1978 – 1983) så hade TCP/IP version 6 kommit och var nu så pass stabilt att man kunde börja använda det i större och större utsträckning. Detta ledde till att man den 1 januari 1983 helt gick över till att använda TCP/IP på ARPANET. TCP/IP är det protokoll som används i störst utsträckning på Internet än idag. En säregen sak med TCP/IP är att det kan användas av många olika typer av nätverk, det beror alltså inte på hur nätverket fysiskt sett är uppbyggt, så länge de kör TCP/IP kan de kommunicera med varandra. Internet blev alltså ett ”nätverk av nätverk” som gjorde att alla typer av nätverk kunde kommunicera med varandra och man fick det som idag kallas Internet. De två personer som huvudsakligen utvecklade TCP/IP, Robert E Kahn och Vinton Cerf, fick 2005 medaljer från presidenten för deras bidrag till den amerikanska kulturen [Wikipedia07c, LivingInternet]. CERN & Internet i Europa CERN (Conseil Européen pour la Recherche Nucléaire, European Council for Nuclear Research) är den plats där det som de flesta menar när de säger Internet skapades. Det som man vanligtvis hänvisar till när man säger Internet är inte själva nätverket utan snarare tjänsten World Wide Web som tillhandahålls av diverse datorer som är kopplade till Internet. TCP/IP i Europa Under 1970-talet var datornätverken på CERN ett hopplock av olika överföringsmedia och protokoll. De nätverk som fanns kunde inte kopplas ihop då de använde protokoll från olika tillverkare eller hemmagjorda protokoll. Den som slutligen drog igång projektet som skulle lösa problemet med att koppla ihop nätverken var Ben Segal. I augusti 1984 skrev Segal ett förslag till mjukvarugruppen på CERN och föreslog att man skulle använda TCP/IP för att kunna koppla ihop nätverken. Detta ledde till att han i början av 1985 utnämndes till TCP/IP koordinator för CERN. Det stod dock fast att inga externa kopplingar skulle göras med hjälp av detta protokoll. I november 1987 fick Segal ett besök av Daniel Karrenberg som var administratör för den dator som hade hand om den transatlantiska kopplingen för USENET i Europa. Daniel var intresserad av att konvertera den europeiska sidan av USENET till TCP/IP, precis som många av de amerikanska servrarna höll på att göra. Användarna skulle inte märka något, men denna förändring skulle bidra till att man kunde använda kopplingen för annat än bara e-post och nyhetsgrupper. Det skulle bland annat bli möjligt att logga in på andra datorer och överföra filer. Karrenberg hade även kontakter inom NIC (Network Information Center) som skulle tillåta honom att ansluta till Internet när det behövdes. Det enda som egentligen saknades var något som tillät honom att skicka IP-trafik över de nätverk som fanns. Det var nu som Segal kom in i bilden. Han hade tidigare köpt två routers från ett litet företag som hette Cisco och de hade den hårdvara som behövdes i deras katalog. Över loppet av några månader fick de viktigaste punkterna i det europeiska nätverket routrar tillverkade av Cisco och de som skulle ha kunnat sätta stopp för konverteringen märkte inte av något [Segal95]. 6 Europa och Internet Under 1988 gick tillslut datahanteringsdivisionen på CERN med på att ge stöd för TCP/IP. Det ledde till att operationen fick fler anställda och blev ordentligt organiserat. Ett år senare började CERN öppna externa förbindelser till Internet. Detta innebar att de adresser som tidigare hade tilldelats datorer efter godtyckligt system nu var tvungna att ändras till officiella för att inte orsaka konflikter. World Wide Web Historia Nu när det fanns en global infrastruktur för att utbyta idéer och dokument via så behövdes ett medium för att överföra dessa. Den person som lade grunden för det som idag är World Wide Web var Tim Berners-Lee, en entreprenör vid CERN. Han hade tidigare experimenterat med en teknik som kallas Hypertext, ett sätt att låta ord eller fraser i en text peka på andra texter där ordet eller frasen förklaras mer ingående. I mars 1989 cirkulerade ett dokument på CERN där ett förslag till ett projekt involverande hypertext presenterades. Förslaget innehöll en beskrivning av ett system som skulle försöka finna ett sätt att förmedla information via ett standardiserat gränssnitt [Berners-Lee89, Berners-Lee90]. Detta projekt kom att utmynna i skapandet av den första webbsidan som annonserades i augusti 1991 [Berners-Lee91a]. Originalet av webbsidan är tyvärr inte tillgänglig längre, men en version från 1992 finns att tillgå. HTTP & Gopher 1991 skapade Berners-Lee ett protokoll för att överföra främst hypertextdokument. Protokollet i sig var ganska luddigt formulerat och beskrev endast hur en överföring skall gå till. Han döpte det passande till HTTP, Hypertext Transfer Protocol och det tillät endast att en klient hämtade ett dokument från den server den var ansluten till [BernersLee91b]. Ungefär samtidigt utvecklade en grupp på University of Texas ett liknande protokoll som de kallade Gopher. Till skillnad från HTTP var Gopher mycket striktare och förespråkade en strikt hierarkisk struktur, ungefär som på en hårddisk. En av de största skillnaderna med Gopher var att man istället för att vara begränsad till att klicka sig genom sidor hela tiden kunde komma åt själva strukturen med kataloger på servern [Gopher91]. Under de första åren var det en tät strid mellan Gopher och HTTP om vilket protokoll som var det som skulle användas. Än idag finns det stöd för båda protokollen i webbläsare med vissa undantag. Gopher var dock svårare att lära sig att använda och möjligheten att visa katalogers innehåll kopierades tidigt av webbläsare så att det även gick att göra detta på en HTTP-server, så länge administratören tillät det. Mot slutet av 1990-talet hade HTTP blivit det protokoll som majoriteten använde och Gopher kom att bli klassat som en kuriositet som endast en handfull entusiaster fortfarande använder [Wikipedia07e]. 7 Webbläsare När World Wide Web var ung behövdes det egentligen inga webbläsare för att kunna tillgodogöra sig stora delar av den information som fanns. Det enda som de egentligen bidrog med var formatering och hyperlänkning1 så en vanlig terminalklient kunde användas. Så fort som formateringen blev mer avancerad och bilder började användas blev man slutligen tvungen att använda en webbläsare. WorldWideWeb WorldWideWeb var den första webbläsaren som var utvecklad av Tim Berners-Lee och som endast kunde köras på datorer från NeXT. Det var en mycket enkel webbläsare som till en början endast kunde visa formaterad hypertext. Den hade även en inbyggd redigerare för sidor och kunde i senare versioner även visa bilder [Berners-Lee91a]. Mosaic Mosaic var en webbläsare skriven av Marc Andreessen vid University of Illinois at Urbana-Champaign, USA. Programmet släpptes i början av 1993 och kunde förutom text visa allt från bilder till videoklipp på samma sida. Mosaic gjorde mycket för att få in vanliga användare på World Wide Web. Med hjälp av MIME- formatet (Multipurpose Internet Mail Extensions) kunde man beskriva vilken typ av fil som hämtades från webbservern för att sedan inkludera den som en del av texten istället för att öppna filen i ett separat program eller fönster [Andreessen93]. Internet & World Wide Web I och med Berners-Lee’s inlägg på USENET-gruppen alt.hypertext den 6:e augusti 1991 gjordes World Wide Web publikt och har från denna enda sida vuxit över åren och innehåller nu ett så stort antal sidor att det i princip är omöjligt att få fram en egentlig siffra. Antalet sidor som går att finna med hjälp av söktjänster uppskattades dock till 11.5 miljarder år 2005. Utöver detta tillkommer ett okänt antal sidor som ej går att finna med hjälp av dessa söktjänster [GulliSignorini05]. Om vi utgår från att det fanns en enda sida i augusti 1991 och det fanns 11.5 miljarder i januari 2005, betyder detta att Internet under denna tid har växt i snitt 15,48% i månaden. 1 Det som inträffar när man aktiverar ett ord i ett hypertextdokument. Läsaren skickas till det dokument som ordet pekar på. 8 SLUTSATS Från att ha varit ett nätverk för militären och akademiker har Internet blivit ett sätt för allt från företag till privatpersoner att knyta kontakter, utbyta idéer eller helt enkelt fördriva tiden med. Ett av de största problemen som har uppkommit är att Internet har blivit ett bra sätt att sprida missinformation då vem som helst kan publicera i princip vad som helst utan någon form av kontroll. Detta kopplat med en växande tillit till vad som publiceras kan komma att bli ett stort problem i framtiden om personer inte får lära sig att kritiskt granska det som skrivs och försöka finna flera oberoende källor med hög trovärdighet som påstår samma sak [Leth97]. Referenser [Andreessen93] M. Andreessen, “NCSA Mosaic Technical Summary”, ftp://ftp.ncsa.uiuc.edu/Mosaic/Papers/mosaic.ps.Z (2007-10-25) [Berners-Lee89] T. Berners-Lee, “Information Management: A Proposal”, CERN Internal Circulation, http://www.w3.org/History/1989/proposal.rtf (2007-10-04) [Berners-Lee90] T. Berners-Lee, “WorldWideWeb: Proposal for a HyperText Project”, CERN Internal Circulation, http://www.w3.org/Proposal.html (2007-10-03) [Berners-Lee91a] T. Berners-Lee, “Re: Qualifiers on Hypertext links…”, alt.hypertext (2007-10-30) [Berners-Lee91b] T. Berners-Lee, “The Original HTTP as Defined in 1991”, http://www.w3.org/Protocols/HTTP/AsImplemented.html (2007-09-26) [FUNET98] “ARPANET”, http://www.nic.funet.fi/index/FUNET/history/internet/se/arpanet.html (2007-10-03) [Gopher91] Gopher Development Team, “Internet Gopher: a distributed campus-wide information system”, comp.sys.mac.annonce (2007-09-26) [GulliSignorini05] A. Gulli & A. Signorini 2005. “The indexable web is more than 11.5 billion pages.”, Special interest Tracks and Posters of the 14th international Conference on World Wide Web (Chiba, Japan, May 10 - 14, 2005). WWW '05. ACM Press, New York, NY, 902-903. [Leiner03] Barry M. Leiner, Vinton G. Cerf, David D. Clark, Robert E. Kahn, Leonard Kleinrock, Daniel C. Lynch, Jon Postel, Larry G. Roberts, Stephen Wolff, “A Brief History of the Internet”, http://www.isoc.org/internet/history/brief.shtml (2003) [Leth97] G. Leth, “Källkritik På Internet”, http://www.psycdef.se/Global/PDF/Publikationer/kallkritid%20for%20internet.pdf (2007-10-04) [LivingInternet07] ”TCP/IP Internet Protocol”, http://www.livinginternet.com/i/ii_tcpip.htm (2007-10-01) [NCSA97] NCSA Mosaic Development Team, “The History of NCSA Mosaic”, ftp://ftp.ncsa.uiuc.edu/Web/Mosaic/Windows/Archive/MosaicHistory.html (2007-10-03) 9 [NORSAR03] ”NORSAR and the Internet: Together since 1973”, http://www.norsar.no/NORSAR/history/internet.html (2007-10-03) [Postel97] J. Postel, J. Reynolds, “Instructions to RFC Authors”, ftp://ftp.rfceditor.org/in-notes/rfc2223.txt (2007-10-03) [Segal95] B. Segal, “A Short History of Internet Protocols at CERN”, http://ben.web.cern.ch/ben/TCPHIST.html (2007-09-26) [Walden03] D. Walden, ”Looking back at the ARPANET effort, 34 years later”, http://www.livinginternet.com/i/ii_imp_walden.htm (2007-10-01) [Wikipedia07a] “Wikipedia: ARPANET”, http://en.wikipedia.org/wiki/Arpanet (200710-01) [Wikipedia07b] “Wikipedia: Request for Comments”, http://en.wikipedia.org/wiki/Request_for_Comments (2007-10-03) [Wikipedia07c] ”Wikipedia: TCP/IP”, http://en.wikipedia.org/wiki/TCP_IP (2007-10-01) [Wikipedia07d] “Wikipedia: Usenet”, http://en.wikipedia.org/wiki/Usenet (2007-10-03) [Wikipedia07e] “Wikipedia: Gopher (Protocol)”, http://en.wikipedia.org/wiki/Gopher_(protocol) (2007-10-01) 10