Statistik från webbplatser - pdf

Statistik från webbplatser
18 november 2002
Statistik från webbplatser
– virtuella besök eller levererade sidor?
Ulf Kronman
Karolinska Institutet Universitetsbiblioteket
Föredragets huvuddelar
n
n
n
Frågorna och motfrågorna
n
Vilka frågor ställer chefen, BIBSAM och ISO?
n
Varför ställer webmastern krångliga motfrågor?
Tekniken bakom webben
n
Webbens funktion och webbsidornas uppbyggnad
n
Nätets komponenter och komplikationer
Diskussion av begrepp
n
n
Besökare, besök och sida
Vad gör vi nästa år?
n
Hur levererar vi de uppgifter BIBSAM och ISO vill ha?
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
1
Statistik från webbplatser
18 november 2002
Frågorna från ledningen och BIBSAM
Chefen
n
Hur många besökare hade vår webbplats under förra året?
BIBSAM
n
Rapportera "Virtuella besök per år, i tusental"
ISO (ISO 2789:2001)
n
Collect, if possible, the number of virtual visits
n
"A virtual visit is defined as a user's request of the library web
site from outside the library premises regardless of the number
of pages or elements viewed."
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Webbmasterns motfrågor
Vad är en besökare ?
Webbservern ser inga människor – bara IP-adresser
Vad är ett besök ?
Webbservern ser inga besök – bara hämtade datafiler
Vad är en sida ?
Webbservern ser inga sidor – bara datafiler
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
2
Statistik från webbplatser
18 november 2002
Tekniken bakom World Wide Web
Besökare
Webbläsare
Dator
IP-adress
Webbserver
HTTP-anrop
GET /index.html HTTP/1.1
Host: vision.kib.ki.se
194.16.52.164
DNS-namn
vision.kib.ki.se
IP-adress
Svar + datafil
130.237.122.58
HTTP/1.1 200 OK
Server: Microsoft -IIS/5.0
Date: Fri, 10 May 2002 04:37:11 GMT
Connection: close
Content -Type: text/html
Transaktionslogg
En rad per förfrågan (levererad fil)
2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:14 194.16.52.164 2002-04-03 17:10:15 194.16.52.164 2002-04-03 17:10:26 194.16.52.164 18 november 2002
GET /index.html - 200 Mozilla/4.0 http://mail.student.lu.se/frame.html
GET /_elements/css/vision2001.css - 200 Mozilla/4.0 http://vision.kib.ki.se/
GET /_elements/images/vision_logo_transp1.gif - 200 Mozilla/4.0 http://vision.kib.ki.se/
GET /_elements/images/ stair_rail.jpg - 200 Mozilla/4.0 ) http://vision.kib.ki.se/
GET /_elements/images/ osynlig.gif- 200 Mozilla/4.0 http://vision.kib.ki.se/
GET /_elements/images/ squares.gif - 200 Mozilla/4.0 http://vision.kib.ki.se/
GET /favicon.ico - 200 Mozilla/4.0 Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Webbsidans uppbyggnad
En webbsida är vanligen uppbyggd av en rad olika datafiler
<html>
<head>
<title>Vision </title>
<link rel="stylesheet "
href="_elements/css/vision_2002.css" type="text/css">
<script type="text/javascript"
src="_elements/scripts/display.js" charset="ISO -8859-1"></script>
</head>
<body>
<table background="_elements/images/background.jpg">
<tr >
<td><a href="index_se.html ">
<img src="_elements/images/vision_2002.jpg"></a></td >
<td><img src="_elements/images/spacer.gif " alt="" width="2"></td>
</tr >
…
Varje leverans av en datafil blir en rad i transaktionsloggen
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
3
Statistik från webbplatser
18 november 2002
Cache och proxyservrar komplicerar
Person
Webbläsare
Cache
Person
Webbläsare
Cache
Person
Webbläsare
Cache
Webbtjänst
Brandmur
Person
Webbläsare
Cache
Person
Proxyserver
Databas
Webbläsare
Cache
Cache
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Cookies identifierar webbläsarna
n
En cookie är en liten textfil som lagras av webbläsaren
n
n
Webbläsaren skickar med cookien vid varje förfrågan till servern
Permanenta cookies kan identifiera en webbläsare
n
Även bakom brandmurar och proxyservrar
n
Temporära cookies kan skapa sessioner
n
Användning av cookies är komplicerad
n
Hantering av cookies kräver någon form av programmering
n
Registrering av cookies kräver utvidgad transaktionslogg
n
Analys av cookies kräver avancerade och kommersiella program
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
4
Statistik från webbplatser
18 november 2002
Vad är en besökare?
n
IP-besökare (datorbesökare)
n
En identifierad IP-adress – finns i webbserverns
transaktionslogg
n
n
Webbläsarbesökare
n
n
n
Många personer får samma IP-adress bakom en proxyserver
Använd cookies för att identifiera webbläsarprogram
Kräver cookiehantering, utvidgad transaktionslogg och
avancerat analysprogram
Söktjänsternas insamlingsprogram är inte besökare
n
Över 300 olika insamlingsprogram kan avläsas med uppgiften
user agent i en utvidgad transaktionslogg
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Vad är ett besök?
n
En svit av leveranser av datafiler till samma besökare
n
n
IP-besök (datorbesök)
n
n
n
Svit av datafiler levererade till samma IP-adress
Problem med att olika personers besök blandas av proxyservrar
Webbläsarbesök
n
n
n
Ett uppehåll mer än 30 minuter avslutar besöket
Svit av datafiler levererade till samma webbläsare
Kräver cookiehantering, utvidgad transaktionslogg och
avancerat analysprogram
Leveranser till söktjänsternas insamlingsprogram ska
inte räknas som besök
n
Kräver utvidgad transaktionslogg med user agent
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
5
Statistik från webbplatser
18 november 2002
Vad är en sida?
n
Vår uppfattning av sidor och webbserverns data skiljer
sig åt
n
I webbserverns transaktionslogg representeras varje sida av en
rad leveranser av datafiler (anrop)
n
n
Sortera bort datafiler som inte är innehåll
n
n
Bara en av datafilerna representerar själva innehållet
Bilder, stilmallar, JavaScript, ramar (framesets)
Räkna inte sidor levererade till söktjänsternas
insamlingsprogram
n
Kräver utvidgad transaktionslogg med user agent
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Relation besökare – besök – sidor - anrop
Webbteknikerns
verklighet
BIBSAMs
och ISOs
verklighet
Besökare
18 november 2002
[email protected] - http://kib.ki.se
Besök
Sidor
Anrop
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
6
Statistik från webbplatser
18 november 2002
Vilken statistik är mest rättvisande?
n
IP-besök – relativt enkelt, men missvisande
n
n
n
Långt ifrån bilden av en besökande person
Webbläsarbesök – rättvisande, men komplicerat
n
Mycket närmare bilden av en besökande person
n
Kräver cookiehantering och avancerad analys
Sidleveranser – enkelt och rättvisande
n
Ingen cookiehantering och enkel analys
n
Se webbtjänsterna som system för dokumentleveranser
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Vad ska forskningsbiblioteken göra?
n
Rapportera "virtuella besök" enligt ISO?
n
Välj mellan felvisande IP-besök eller komplicerade
webbläsarbesök
n
Rapportera sidleveranser i strid med ISO?
n
BIBSAM tillåter detta mått under en övergångsperiod
n
Kan vi få ISO att ändra sig?
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
7
Statistik från webbplatser
18 november 2002
Frågor & diskussion
Åhörarkopior av föredraget
http://vision.kib.ki.se/portfolio/statistics/
18 november 2002
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
Vad kan BIBSAM göra?
n
n
Ta fram omräkningstal
n
Omräkning mellan IP-besök, webbläsarbesök och sidleveranser
n
Omräkning mellan uppgifter med/utan insamlingsprogram
Ta fram en centraliserad lösning?
n
Danska biblioteksstyrelsen planerar att samla in statistik på en
central server (år 2003?)
n
Bearbeta ISO!
n
Kan vi få ISO att betrakta webbtjänsterna som system för
dokumentleveranser snarare än virtuella biblioteksbyggnader?
18 november 2002
[email protected] - http://kib.ki.se
Ulf Kronman - Karolinska Institutets Universitetsbibliotek
8