FÖ 2:
2 Databaskursen
D t b k
1.
2.
3.
4
4.
5.
6.
7.
8.
9
9.
10.
11.
Kvalitetsbegreppet
Kommunikation
Olika typer av data
Olika typer av datalagring
Databas
DBMS
Molntjänster
Tabeller
ANSI-SPARC
SQL
Oracle Arkitektur
Pär Douhan,
Douhan [email protected]
pdo@du se
1
K lit t?
Kvalitet?
Datakvalitet?
Informationskvalitet?
2
K lit t b
Kvalitetsbegreppet
t - definitioner
d fi iti
1. Ordböcker och lexikon: ”God beskaffenhet” eller ”goda egenskaper” (Swan, 1987)
2. En definition: ”Uppfyllandet av satta krav” (Crosby, 1979)
3 En annan definition: ”Alla
3.
Alla sammantagna egenskaper hos ett objekt eller företeelse som
ger dess förmåga att tillfredsställa uttalade eller underförstådda behov" (ISO9000
SS020104)
Termen kvalitet används, enligt Bo Sundgren, på två olika sätt:
1. På ett neutralt sätt – i det neutrala läget har kvalitet ungefär samma betydelse som
egenskap. Man kan alltså förse viss data med ett antal egenskaper som kan ses som
kvalitetsbeskrivningar för datat.
datat
2. På ett normativt sätt – i det normativa läget är det meningsfullt att prata om god kvalitet,
bättre kvalitet, sämre kvalitet och dålig kvalitet.
God kvalitet är relaterad till användaren och användningen. Det som i en situation kan vara bra
kvalitet, kan i en annan situation vara oacceptabelt dålig kvalitet.
3
Tjä t k lit t - egenskaper
Tjänstekvalitet
k
Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar tjänstekvalitet:
1.
2.
3.
4.
5.
6.
Omgivning – miljön som tjänsten presenteras i
Pålitlighet – hur tillförlitligt tjänsten utförs av leverantören
Tillgänglighet – Hur lätt det är för kunden att få kontakt med leverantören
Tjänstvillighet – Viljan hos leverantören att hjälpa kunden
Artighet – leverantörens uppförande i form av artighet och vänlighet
g – förmåga
g att tala med kunden på
p ett sätt som kunden
Kommunikationsförmåga
förstår
Testa själv
j att utvärdera t. ex. köp
p och installation av ett kök, eller en
totalrenovering av tvättstugan med hjälp av ovanstående kvalitetskriterier!
4
P d ktk lit t - egenskaper
Produktkvalitet
k
Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar produktkvalitet:
1.
2.
3.
4.
Prestanda – hur produkten tillfredsställer kundens förväntningar på prestanda
Driftsäkerhet– hur ofta det blir fel på produkten och hur alvarliga felen är
Underhållsmässighet – hur lätt det är att underhålla och reparera produkten
Säkerhet – hur säker produkten är att använda
Citat av okänd 90-åring:
g ”Om jjagg ändå vetat att livet består av 90% underhåll”
5
A ä db h t - egenskaper
Användbarhet
k
Egenskaper som, enligt Stefan Cronholm, karaktäriserar användbarhet:
(Användbarhet är ett centralt forskningstema inom MDI-området)
MDI området)
1.
2
2.
3.
4.
5
5.
6.
7.
8
8.
Relevans – hur väl IS tillgodoser användarens behov
Eff kti it t – hur
Effektivitet
h effektivt
ff kti t eller
ll produktivt
d kti t arbetsuppgifterna
b t
ift
kan
k utföras
tfö
Användarens attityd – användarens subjektiva känslor mot systemet
Lärbarhet – hur lätt systemet är att lära sig
Flexibilitet – hur IS klarar anpassningar till verksamhetsförändringar
Funktionalitet – hur väl stödjer IS de arbetsuppgifter som användaren utför
Samtidighet – olika användare ska kunna använda IS samtidigt
Lättanvänt – hur lätt IS är att lära sig och hur nöjd användaren är med IS
Analysera Fronter utifrån ovanstående kriterier…
6
K lit t
Kvalitetsegenskaper
k
NVDB
Innehållsorienterad
metadata
7
Indirekt metadata
K
Kommunikation
ik ti
Direkt kommunikation: Hans frågar Pär med ett lismande tonfall:
Får jag låna en
femhundring?
1.
2.
3.
4.
Pär varseblir meddelandet med sina sinnen
Tolkar meddelandet
g med sin Frame off Reference
f
Redogör
Svarar: Ja
Kommunikation via IT-system: Hans skriver ett meddelande:
Får jag låna en
femhundring?
8
ITsystem
Får jag låna en
femhundring?
K
Kommunikationskvalitet
ik ti
k lit t
Generiska kriterier för kommunikationskvalitet enligt Owen Eriksson:
1. Informationen ska gå att förstå samt vara relevant för användaren
1
2. Relevant och begriplig handlingsaspekt - Den illukutionära beståndsdelen (verbet) i
handlingen måste vara begriplig. Är det ett erbjudande? En order? En bekräftelse? Ett önskemål?
Ett avtal? En fråga?
3. Trovärdig information – Användaren måste kunna lita på att informationen är trovärdig
9
T
Trovärdig
ä di iinformation
f
ti
i NVDB
Hög trovärdighet
Låg trovärdighet
Ofta är det bristen på rutiner som gör att användare börjar tro att informationen inte är trovärdig. Om detta väl inträffar spelar
det ingen roll om datakvaliteten är hög eller inte, det räcker med att man tror att den är dålig. Man kan öka trovärdigheten
genom att lagra information om vem som har uppdaterat viss information och när det gjordes.
(Gustavsson och Sörman, 2004)
10
D t k lit t - informationskvalitet
Datakvalitet
i f
ti
k lit t
Data
Information
Information
Data
Data
11
Information
Låg datakvalitet medför låg
informationskvalitet.
Hög datakvalitet kan medföra låg
informationskvalitet Otillräckligt med
informationskvalitet.
metadata, låg trovärdighet, otillräcklig
frame of reference etc. hos användaren.
Högg datakvalitet kan medföra högg
informationskvalitet. Tillräckligt med
metadata, hög trovärdighet, tillräcklig
frame of reference etc. hos användaren.
K
Konsekvenser
k
Information
låg informationskvalitet
Beslut fattas med hjälp av information. Om informationen (beslutsunderlaget) är
otillräckligt föreligger stor risk för dåliga beslut.
beslut
Några
g exempel
p p
på konsekvenser kan vara:
1. Avgrävning av kablar. Om det är otillräcklig lägesnoggrannhet på geografiska
koordinater
2. I krigssituationer kan flyktingförläggningar och sjukhus bombas istället för
militära mål, om lägesnoggrannheten är för låg eller om den är felaktig
3. Patienter kan felbehandlas i vården
4. Oskyldiga människor kan dömas för brott
12
Olik typer
Olika
t
av data
d t
13
Olik typer
Olika
t
av datalagring
d t l
i
14
I f
Informationsbehov
ti
b h
All fö
Alla
företag eller
ll organisationer
i i
hhar ett informationsbehov
i f
ti
b h
15
D t l
Datalagring
i
På 60-talet dominerades datalagringen
av s.k. enkla filsystem.
Fortran
Cobol
kundfiler
personalfiler
Varje program bearbetade sina egna
datafiler.
Hög nivå av beroende mellan program
och datafiler.
16
D t b
Databas
En databas är en organiserad
samling information.
Data
Dictionary
En databas innehåller alltid
en beskrivning av lagrad
information. Denna brukar
kallas för Data Dictionary.
Ibland även för metadatabasen.
metadatabasen
Det skall vara enkelt att läsa
och manipulera
information i databasen.
17
DBMS
DBMS = Database
Management System
DBMS är ett system som
lagrar, modifierar och
hämtar data i databasen.
Olika termer används:
ORDBMS RDBMS och
ORDBMS,
DBMS.
18
Olik typer
Olika
t
av databaser
d t b
Relationsdatabaser,
R
l ti
d t b
kom
k
påå 1970-talet.
1970 t l t LLagrar masterdata,
t d t
transaktionsdata och analytisk data. Det är detta kursen
handlar om.
NoSQL databaser, kom en bit in på 2000-talet. Lagrar Big Data,
data från bl. a. sociala medier, från sensorer, från webbloggar etc.
19
Olik leverantörer
Olika
l
tö
Det finns olika leverantörer av databaser. Exempel
på några vanligt förekommande databaser:
20
Olik molntjänster
Olika
l tjä t
Data as a service (DaaS)
http://www gapminder org
http://www.gapminder.org
Database as a service (Cloud Database)
21
Hans Rosling
Ed
Edgar
"T
"Ted"
d" Codd
C dd
Edgar Frank
Ed
F
k "Ted"
"T d" Codd
C dd (19 Augusti
A
ti 1923 - 18 A
Aprilil 2003)
var en engelsk datavetare som, när han arbetade för IBM, 1965
uppfann relationsmodellen för databashantering, den teoretiska
grunden för relationsdatabaser.
Data organiseras
g
i tabeller på
p de logiska
g
nivåerna.
Hög nivå av program/data oberoende.
oberoende
Klientprogram behöver inte veta hur data fysiskt
är lagrat i databasen.
Detta realiseras av en tre lager(schema)arkitektur enligt ANSI/SPARC, med två logiska
och
h en fysisk
f k nivå.
å
22
T b ll
Tabeller
En relationsdatabas är
samling av relationer eller
tvådimensionella tabeller.
tabeller
En relationsdatabas
E
l ti
d t b
använder dessa tvådimensionella tabeller för
att lagra data.
23
ANSI SPARC Arkitekturen
ANSI-SPARC
A kit kt
Vy 1
Vy 2
Del av helheten
Vy 3
Extern nivå
Logiskt dataoberoende
Alla objekt i databasen med
metadata om dessa
Hela logiska vyn av
databasen
Konceptuell nivå
Fysiskt dataoberoende
Hur dessa objekt fysiskt är
lagrade i databasen
Fil -och
postbeskrivningar
OS
24
Fysisk
y
nivå
D t (111000111001)
Data
G
Gemensamt
t för
fö alla
ll databaser
d t b
Alla databaser består av:
1. Memory (minne)
2. Processes (processer)
3 Storage (lagring,
3.
(lagring filer på disk)
25
SQL
SQL, Structured Query Language
SQL
DB
DBMS
Resultat
Databas: Består av olika filer; datafiler
datafiler, kontrollfiler och redo loggfiler
lagrade på disk.
DBMS: Mjukvara,
Mjukvara t.
t ex.
ex Oracle eller MySQL,
MySQL som via SQL tillhandahåller åtkomst
till filerna i databasen. Består av olika minnesareor och bakgrundsprocesser.
I Oracle's arkitektur kallas DBMS för Oracle Instance.
26
Oracle Server
O
Oracle
l
klient
Oracle Instance
SGA
Shared pool
User process
unik session
SQL
Resultat
database
buffer cache
Library
cache
Redo
edo log
og
buffer
DBMS
Dictionary
cache
Server process
PMON
Bakgrundsprocesser
B
k
d
(Tasks)
Datafiler
SMON
DBWR
Kontrollfiler
LGWR
redo logg 1a
CKPT
redo logg 1b
DB
Datafiler
27
Kontrollfiler
Olik roller
Olika
ll
DBA, Databasadministratör, ansvarar för säkerhet,
drift och underhåll av databasen.
Developers,
De
elopers de
d
som utvecklar
applikationer
End
E
d users, de
d som
använder databasens
tjänster
28
SQL fem
SQL,
f
olika
lik delar
d l
SQL
SQL-språket
åk består
b å av fem
f
olika
lik delar:
d l
1.
2.
3.
4.
5
5.
29
Data Retrivial Language

select
DML, Data Manipulation Language

insert, update och delete
DDL, Data Definition Language

create, alter och drop
DCL, Data Control Language

grant och revoke
TCL T
TCL,
Transaction
ti C
Control
t lL
Language

commit och rollback