Statistik från webbplatser 18 november 2002 Statistik från webbplatser – virtuella besök eller levererade sidor? Ulf Kronman Karolinska Institutet Universitetsbiblioteket Föredragets huvuddelar n n n Frågorna och motfrågorna n Vilka frågor ställer chefen, BIBSAM och ISO? n Varför ställer webmastern krångliga motfrågor? Tekniken bakom webben n Webbens funktion och webbsidornas uppbyggnad n Nätets komponenter och komplikationer Diskussion av begrepp n n Besökare, besök och sida Vad gör vi nästa år? n Hur levererar vi de uppgifter BIBSAM och ISO vill ha? 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 1 Statistik från webbplatser 18 november 2002 Frågorna från ledningen och BIBSAM Chefen n Hur många besökare hade vår webbplats under förra året? BIBSAM n Rapportera "Virtuella besök per år, i tusental" ISO (ISO 2789:2001) n Collect, if possible, the number of virtual visits n "A virtual visit is defined as a user's request of the library web site from outside the library premises regardless of the number of pages or elements viewed." 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Webbmasterns motfrågor Vad är en besökare ? Webbservern ser inga människor – bara IP-adresser Vad är ett besök ? Webbservern ser inga besök – bara hämtade datafiler Vad är en sida ? Webbservern ser inga sidor – bara datafiler 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 2 Statistik från webbplatser 18 november 2002 Tekniken bakom World Wide Web Besökare Webbläsare Dator IP-adress Webbserver HTTP-anrop GET /index.html HTTP/1.1 Host: vision.kib.ki.se 194.16.52.164 DNS-namn vision.kib.ki.se IP-adress Svar + datafil 130.237.122.58 HTTP/1.1 200 OK Server: Microsoft -IIS/5.0 Date: Fri, 10 May 2002 04:37:11 GMT Connection: close Content -Type: text/html Transaktionslogg En rad per förfrågan (levererad fil) 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:15 194.16.52.164 2002-04-03 17:10:26 194.16.52.164 18 november 2002 GET /index.html - 200 Mozilla/4.0 http://mail.student.lu.se/frame.html GET /_elements/css/vision2001.css - 200 Mozilla/4.0 http://vision.kib.ki.se/ GET /_elements/images/vision_logo_transp1.gif - 200 Mozilla/4.0 http://vision.kib.ki.se/ GET /_elements/images/ stair_rail.jpg - 200 Mozilla/4.0 ) http://vision.kib.ki.se/ GET /_elements/images/ osynlig.gif- 200 Mozilla/4.0 http://vision.kib.ki.se/ GET /_elements/images/ squares.gif - 200 Mozilla/4.0 http://vision.kib.ki.se/ GET /favicon.ico - 200 Mozilla/4.0 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Webbsidans uppbyggnad En webbsida är vanligen uppbyggd av en rad olika datafiler <html> <head> <title>Vision </title> <link rel="stylesheet " href="_elements/css/vision_2002.css" type="text/css"> <script type="text/javascript" src="_elements/scripts/display.js" charset="ISO -8859-1"></script> </head> <body> <table background="_elements/images/background.jpg"> <tr > <td><a href="index_se.html "> <img src="_elements/images/vision_2002.jpg"></a></td > <td><img src="_elements/images/spacer.gif " alt="" width="2"></td> </tr > … Varje leverans av en datafil blir en rad i transaktionsloggen 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 3 Statistik från webbplatser 18 november 2002 Cache och proxyservrar komplicerar Person Webbläsare Cache Person Webbläsare Cache Person Webbläsare Cache Webbtjänst Brandmur Person Webbläsare Cache Person Proxyserver Databas Webbläsare Cache Cache 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Cookies identifierar webbläsarna n En cookie är en liten textfil som lagras av webbläsaren n n Webbläsaren skickar med cookien vid varje förfrågan till servern Permanenta cookies kan identifiera en webbläsare n Även bakom brandmurar och proxyservrar n Temporära cookies kan skapa sessioner n Användning av cookies är komplicerad n Hantering av cookies kräver någon form av programmering n Registrering av cookies kräver utvidgad transaktionslogg n Analys av cookies kräver avancerade och kommersiella program 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 4 Statistik från webbplatser 18 november 2002 Vad är en besökare? n IP-besökare (datorbesökare) n En identifierad IP-adress – finns i webbserverns transaktionslogg n n Webbläsarbesökare n n n Många personer får samma IP-adress bakom en proxyserver Använd cookies för att identifiera webbläsarprogram Kräver cookiehantering, utvidgad transaktionslogg och avancerat analysprogram Söktjänsternas insamlingsprogram är inte besökare n Över 300 olika insamlingsprogram kan avläsas med uppgiften user agent i en utvidgad transaktionslogg 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Vad är ett besök? n En svit av leveranser av datafiler till samma besökare n n IP-besök (datorbesök) n n n Svit av datafiler levererade till samma IP-adress Problem med att olika personers besök blandas av proxyservrar Webbläsarbesök n n n Ett uppehåll mer än 30 minuter avslutar besöket Svit av datafiler levererade till samma webbläsare Kräver cookiehantering, utvidgad transaktionslogg och avancerat analysprogram Leveranser till söktjänsternas insamlingsprogram ska inte räknas som besök n Kräver utvidgad transaktionslogg med user agent 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 5 Statistik från webbplatser 18 november 2002 Vad är en sida? n Vår uppfattning av sidor och webbserverns data skiljer sig åt n I webbserverns transaktionslogg representeras varje sida av en rad leveranser av datafiler (anrop) n n Sortera bort datafiler som inte är innehåll n n Bara en av datafilerna representerar själva innehållet Bilder, stilmallar, JavaScript, ramar (framesets) Räkna inte sidor levererade till söktjänsternas insamlingsprogram n Kräver utvidgad transaktionslogg med user agent 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Relation besökare – besök – sidor - anrop Webbteknikerns verklighet BIBSAMs och ISOs verklighet Besökare 18 november 2002 [email protected] - http://kib.ki.se Besök Sidor Anrop Ulf Kronman - Karolinska Institutets Universitetsbibliotek 6 Statistik från webbplatser 18 november 2002 Vilken statistik är mest rättvisande? n IP-besök – relativt enkelt, men missvisande n n n Långt ifrån bilden av en besökande person Webbläsarbesök – rättvisande, men komplicerat n Mycket närmare bilden av en besökande person n Kräver cookiehantering och avancerad analys Sidleveranser – enkelt och rättvisande n Ingen cookiehantering och enkel analys n Se webbtjänsterna som system för dokumentleveranser 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Vad ska forskningsbiblioteken göra? n Rapportera "virtuella besök" enligt ISO? n Välj mellan felvisande IP-besök eller komplicerade webbläsarbesök n Rapportera sidleveranser i strid med ISO? n BIBSAM tillåter detta mått under en övergångsperiod n Kan vi få ISO att ändra sig? 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 7 Statistik från webbplatser 18 november 2002 Frågor & diskussion Åhörarkopior av föredraget http://vision.kib.ki.se/portfolio/statistics/ 18 november 2002 Ulf Kronman - Karolinska Institutets Universitetsbibliotek Vad kan BIBSAM göra? n n Ta fram omräkningstal n Omräkning mellan IP-besök, webbläsarbesök och sidleveranser n Omräkning mellan uppgifter med/utan insamlingsprogram Ta fram en centraliserad lösning? n Danska biblioteksstyrelsen planerar att samla in statistik på en central server (år 2003?) n Bearbeta ISO! n Kan vi få ISO att betrakta webbtjänsterna som system för dokumentleveranser snarare än virtuella biblioteksbyggnader? 18 november 2002 [email protected] - http://kib.ki.se Ulf Kronman - Karolinska Institutets Universitetsbibliotek 8