Arkiveringsperspektiv
{
Informationsarkivering för operativ
och strategisk verksamhet
Operativa databaser
z
F5
{
Strategiska databaser
z
2006-10-09
Gk/ÖK:ITO, MH
1
2006-10-09
Används för att arkivera information
som används för att utföra dagligt
arbete och att fatta beslut som har
med det dagliga arbetet att göra
Används för att arkivera information
som behövs för att kunna fatta
strategiska beslut dvs. beslut på längre
sikt
Gk/ÖK:ITO, MH
2
Dagens föreläsning
{
Arkivering av information för operativa
ändamål
z
{
Arkivering av information för strategiska
ändamål
z
{
{
Beslutsfattande, Data Warehousing, Data
Warehouse, Datamining
Kunskapshantering
SQL
z
2006-10-09
Operativ informationsarkivering
Informationsbehov, databas(er), Database
Management System, datamodellering, E-R
diagram
Insert, update, delete, select
Gk/ÖK:ITO, MH
3
2006-10-09
Gk/ÖK:ITO, MH
4
1
Informationsbehov?
Mina vänners intressen
{
Jag vill gå på aktivitet X, vem av
mina vänner skall jag be om att
följa med?
z
Informationsbehov;
det som jag behöver känna till om mina
vänner för att kunna välja ut rätt vän att
kontakta för att gå på aktivitet X.
{ Var hittar jag den informationen?
{
2006-10-09
Gk/ÖK:ITO, MH
5
Entitet (företeelse)
{
2006-10-09
Gk/ÖK:ITO, MH
Vad behöver jag veta om en entitet?
Entitet; något som jag behöver
information om
Aktivitet
Vän
Namn
Gatuadress
Postnr
Postort
telnr
namn
Ex
Kalle
Ex
Tennis
samband
Aktiviteter
Vänner
2006-10-09
6
Gk/ÖK:ITO, MH
7
2006-10-09
Gk/ÖK:ITO, MH
8
2
Var hittar jag informationen ?
Databas - definition enligt Alter
Dator
Ej dator
{
Bok
Bokhylla
Bok (fil)
Bokhyllan
(filhanteringssystem)
Bibliotek (databas)
Dator
Böcker
(tabeller i en databas)
”Structured collection of
electronically stored
data that is controlled
and accessed through
computers…”
Bibliotekarie (DBMS)
(DataBase Management System)
2006-10-09
Gk/ÖK:ITO, MH
9
Gk/ÖK:ITO, MH
”…based on predefined relationships
between predefined types of data
items related to a specific business,
situation or problem”
{
Lagringen av
data
z
z
z
z
z
2006-10-09
Gk/ÖK:ITO, MH
10
Olika typer av databaser
Databas - definition enligt Alter, forts..
{
2006-10-09
11
2006-10-09
{
Typ av data
z
z
Hierarkiska
z
databaser
Nätverksbaserade z
databaser
Relationsdatabase
r
Objektorienterade
databaser
Multidimensionell
a databaser
Gk/ÖK:ITO, MH
Geografiska databaser
Textdatabaser
Bilddatabaser
Hypertextdatabaser
12
3
DataBase Management System (DBMS)
{
Bibliotek kontra databas
{
Det är ett antal integrerade
program som används för att
definiera, uppdatera och
kontrollera databaser.;
Bibliotek
z
{
lägga in ny data
ändra i data
{ radera data
{ hämta data
{
Kategoriserad
Ämnesområden
t.ex. biologi
Databas
z
Kategoriserad
{
Företeelser som
man behöver
samla in
information om
t.ex. människor
{
{
2006-10-09
Gk/ÖK:ITO, MH
z
{
13
2006-10-09
Teknik;
1.
Datamodellering
(variant av konceptuell modellering)
z
{
2.
Resultat;
Entity-Relationship (E-R) Diagrams,
datamodeller
(exempel på ett konceptuellt schema
eller en konceptuell modell)
z
2006-10-09
Gk/ÖK:ITO, MH
Författarenamn
t.ex. Karin
Wahlberg
Gk/ÖK:ITO, MH
z
Sorterad
{
Primär nyckel t.ex.
personnummer
14
Data modellering
Definiera och organisera data i en
databas
{
Sorterad
3.
15
2006-10-09
Vilka företeelser (entiteter)
behöver man information om?
Vilken information måste
databasen innehålla för varje
företeelse (entitetstyp)?
Vilka relationer finns det mellan de
olika företeelserna (entiteterna)
Gk/ÖK:ITO, MH
16
4
Vändatabas
{
{
Entitesbeskrivning
E-R modell (diagram) som innehåller den
information som du behöver för att hitta
rätt vän för att besöka aktivitet X.
E-R diagrammet behöver innehålla
information om
z
z
z
Vänner
Aktiviteter
Vilka aktiviteter som mina vänner deltar i
2006-10-09
Gk/ÖK:ITO, MH
Entitetsnamn
Medlem
Primär nyckel
17
E-R diagram
2006-10-09
Lärare
Tex Gudrun
2006-10-09
6
20
30
40
5
10
18
Relationstyper
M:1-relation
Kardinalitet
Attribut 1
Attribut 2
Attribut 3
etc
num
anum
anum
anum
num
anum
medlemsnr
fnamn
enamn
gadr
postnr
postadr
Gk/ÖK:ITO, MH
Entitet
Entitetsnamn 1
Databas deklaration behöver dessutom
för varje attribut:
typ av tecken t.ex. bokstäver, tal
Antal tecken per typ, tex. 30
Attribut 1
Attribut 2
Attribut 3
etc
betalar
Medlem
Avgift
Entitetsnamn 2
namn
Relation
Attribut 1
Attribut 2
Attribut 3
etc
Elev:
Tex Kalle, Lisa
Gk/ÖK:ITO, MH
1:1-relationer
har
tränar
M:M-relation
Elev:
Kalle
Kontaktperson
19
2006-10-09
Gk/ÖK:ITO, MH
Sport
20
5
Upplösning av M:M-relation
Realisering av relation i tabellerna
Avgift
medlem
betalar
Medlem
Modell:
Avgift
medlemsnr
avgiftsnr
medlemsnr
tabeller:
sportdeltagare
Primär
Nyckel
avgiftsnr
Medlemsnr
sportnr
2006-10-09
Sport
21
2006-10-09
Gk/ÖK:ITO, MH
22
Kvalitetsaspekter
{
Avgift
Normalisering
z
avgiftsnr
medlemsnr
avgiftsnr
Främmande nyckel:
realiserar relationen mellan två olika entiter
Referensintegritet
medlem
Avgift
avgiftsnr
sportnr
Gk/ÖK:ITO, MH
medlem
medlemsnr
-
Regler för att uppnå ”god” design
undvika redundans
avgiftsnr
{
{
2006-10-09
Gk/ÖK:ITO, MH
23
2006-10-09
Åtkomst
Säkerhet
Gk/ÖK:ITO, MH
24
6
Databas Vänner
(E-R diagram/Databasmodell)
Vad behöver jag veta om en entitet?
Aktivitet
Van
vannr
fnamn
enamn
gadr
postnr
mtelnr
2006-10-09
Van
vannr
vfnamn
venamn
gadr
postnr
mtelnr
Aktivitet
aktnr
aktnamn
aktnr
aktnamn
Gk/ÖK:ITO, MH
25
2006-10-09
Databas Vänner
(E-R diagram/Databasmodell)
Gk/ÖK:ITO, MH
Tabellbeskrivning av en entitet
Van
Van
vannr
vfnamn
venamn
gadr
postnr
mtelnr
26
Aktivitet
vannr
aktnr
aktnamn
10001
10002
10003
Entitetstyp
attribut
vfnamn
venamn
gadr
postnr
mtel
Eva
Per
Lotta
Åström
Älvström
Byström
Storg 1
Byg 1
Gåg 10
91436
72048
34091
070886777
070777777
070987654
Post
Instans
objekt
Van/akt
Vannr
aktnr
2006-10-09
Gk/ÖK:ITO, MH
27
2006-10-09
Gk/ÖK:ITO, MH
28
7
Sammanfattning
{
Sammanfattning
E-R diagram/databasmodell
z
z
z
z
z
E-R Diagram/databasmodell:
Beskriver strukturen samt innehållet i
databasen genom:
Entiteter
Attribut
Primärnycklar
Relationer
Van
vannr
vfnamn
venamn
gadr
postnr
mtelnr
Aktivitet
aktnr
aktnamn
Van/akt
Vannr
aktnr
2006-10-09
Gk/ÖK:ITO, MH
29
Sammanfattning
Van
vannr
10001
10002
10003
Entitetstyp
attribut
Med relationer:
vfnamn
venamn
gadr
postnr
mtel
Eva
Per
Lotta
Åström
Älvström
Byström
Storg 1
Byg 1
Gåg 10
91436
72048
34091
070886777
Gk/ÖK:ITO, MH
Gk/ÖK:ITO, MH
30
Sammanfattning
Vän/Aktivitet
070777777
070987654
Post
Instans
objekt
2006-10-09
2006-10-09
31
Aktivitet
Aktnr
Aktnamn
2001
tennis
2006-10-09
Aktnr
Vannr
2001
1001
Vän
Gk/ÖK:ITO, MH
Vannr
Vfnamn
1001
Eva
32
8
Beslutsprocessen
Strategisk
informationsarkivering
Precisera problemet
Hitta problemet
Problemlösning
Intelligence
- Samla och
analysera data
om problemet
Design
Choice
Implementation
- Skapa alternativ,
skapa kriterier för
utvärdering, utvärdera
resultat av alternativ
- Välj
prioriterat/optimalt
alternativ
-Informera om
beslut, genomför
valt alternativ
Resultat
2006-10-09
Gk/ÖK:ITO, MH
33
2006-10-09
Beslutsteorier – om hur beslut går
till/bör gå till
{
{
{
{
2006-10-09
34
Alters definition av
beslutsstödssystem
Rationella – objektivt, analytiskt,
optimerande
{
Satisfactory – tillräckligt bra alternativ
väljs
Carbage can – olika problem, lösningar
och idéer släng ihop, subjektiva,
slumpartade beslut
Political model – beslut som fattas beror
på kompromisser mellan grupper
Gk/ÖK:ITO, MH
Gk/ÖK:ITO, MH
35
2006-10-09
”Beslutsstödssystem är ett
interaktivt informationssystem som
tillhandahåller information,
modeller, datamanipuleringsverktyg
för att stödja beslutsfattande i
semistrukturerade och
ostrukturerade situationer när ingen
vet exakt hur beslut ska tas”
Gk/ÖK:ITO, MH
36
9
DW
Definition av DW (Alter)
“Ett data warehouse (datalager) är en
kombination av en databas och en
mjukvara som är utformad för att stödja
verksamhetsanalys och beslutsfattande på
ledningsnivå snarare än att stödja minut till
minut-processande av
verksamhetstransaktioner”
• Data som lagras i ett data warehouse laddas ned
periodiskt från transaktionsdatabaser, och laddas i en
separat databas som ofta finns på en separat dator och
som använder en speciell OLAP-server (On-Line
Analytical Processing)
• Genom att ha ett DW undviker man att störa
transkationssystemens dagliga verksamhet
• Möjliggör strukturering av data så att användare kan
få snabba svar (stjärnstrukturer och kuber)
2006-10-09
Gk/ÖK:ITO, MH
37
2006-10-09
Varför behövs ett DW?
DB
DBMS
OLAP
servers
End user
application A
Data warehouse
DBMS
End user
application B
DB
DBMS
DB
DBMS
2006-10-09
38
Data warehousing arkitektur
External källor
DB
Gk/ÖK:ITO, MH
End user
application C
Det finns behov av att samla data som finns
utspridd på flera databaser/IT-system – som
underlag
för strategiska
och taktiska beslut
Gk/ÖK:ITO,
MH
39
Operational DBs/
TPS/OLTP
Transaktionssystem
(TPS) som sköter
den dagliga
verksamheten +
2006-10-09
externa källor
Extract
Consolidation
Filtering
Cleansing
Transformation
Aggregation
Updating
Analysis/OLAP
Productt
Serve
Data marts
Time1
Value1
Value11
Product2
Time2
Value2
Value21
Product3
Time3
Value3
Value31
Product4
Time4
Value4
Value41
Query/Reporting
Data mining
OLAP
servers
Data staging area
”The data warehouse”
OLAP servers
ETL process
(Extract, Transform,
Load)
Gk/ÖK:ITO, MH
Falö aöldf
flaöd aklöd
falö alksdf
Slutanvändarverktyg
Business Intelligence tools
40
10
Spreadsheet (kalkylblad)
output från OLAP-verktyg
Vad är OLAP?
Akronym för “On-line Analytical Processing”
mounth
quarter
product
product group
OLAP-system fanns redan på 1970-talet, innan det talades om
data warehousing. Idag är OLAP nära knutet till data warehousing.
Column headers
(join constraints)
OLAP är ett beslutsstödssystem som stödjer ad-hoc frågor
Idén är att låta användare enkelt och snabbt manipulera och
visualisera data genom multidimensionella vyer, det vill säga ur
olika dimensioner eller perspektiv
office
region
Dimensioner/Vyer
Column header
(application constraint)
Product Group
Group A
Group A
Group B
Group B
Region
ABC
XYZ
ABC
XYZ
Answer set
representing focal
e ent
Dimensioner/Vyer
First Quarter - 1997
1245
34534
45543
34533
Fakta
Row headers
Gk/ÖK:ITO, MH
41
2006-10-09
Gk/ÖK:ITO, MH
The data cube:
Spreadsheets:
En populär konceptuell modell som influerat utformning av:
e
fic
of
• slutanvändarverktyg (OLAP-klienter)
quarter
• modellering av databasschema (dimensionell modellering)
The data cube:
130
e
fic
of
2 300
2 300
5 024
200
service
- Numeriska fakta (e.g. antal, summa) beror på en mängd
dimensioner/vyer/perspektiv
200
Gk/ÖK:ITO, MH
5 024
200
service
2006-10-09
130
130
2 300
5 024
42
Kuben: “multidimensionell” vy av data
Kuben: “multidimensionell” vy av data
quarter
2006-10-09
43
2006-10-09
Gk/ÖK:ITO, MH
44
11
Dimensional modelling - Star-join schema
Dimensional modelling - Star-join schema
Service Dimension
Service used
Time
Key
S1
S2
S3
S4
- date
- month
- quarter
- year
- service name
- service group
Service
group
Group A
Group A
Group B
Group C
Service
Local call
Intern. call
SMS
WAP
Telephone calls
- sum ($)
- number of calls
- seller name
- office
Key
F11
F12
F13
Gk/ÖK:ITO, MH
45
Seller
Anders C
Lisa B
Janis B
Month
9910
9910
Quarter
4 - 99
4 - 99
Year
99
99
Fact table - Transactions
S1
S3
S2
S1
S4
F11
F11
F13
F13
F13
Office Dimension
- customer name
- address
- region
- income group
2006-10-09
Date/
Key
991011
991012
C210
C210
C212
C213
C214
Customer
Office Dimension
Time Dimension
Office
Sundsvall
Sundsvall
Kista
2006-10-09
991011
991011
991011
991011
991012
Sum
25:00
05:00
89:00
12:00
08:00
Number
of calls
3
1
1
1
1
Customer Dimension
Key
C210
C211
C212
C213
C214
Customer
Anna N
Lars S
Erik P
Danny B
Åsa S
Address
Stockholm
Malmö
Rättvik
Stockholm
Stockholm
Region
Stockholm
Skåne
Dalarna
Stockholm
Stockholm
Income
group
B
B
C
A
A
Gk/ÖK:ITO, MH
46
Två star-join scheman
Data mining
Quarter
Service
Calls
Office
{
Data Mart B
Customer
Quarter
Service
{
Data Mart A
Subscription
Office
Data Warehouse = Data Mart A + Data Mart B
2006-10-09
Gk/ÖK:ITO, MH
orders
Data mining är användning av
dataanalysverktyg för att finna
mönster i stora
(transaktions)databaser
Särskilda algoritimer används för
att hitta dessa mönster
Customer
47
2006-10-09
Gk/ÖK:ITO, MH
48
12
Regression
”Klustring”
{
{
Vid regression försöker hitta en linje eller kurva
genom en mängd data, se figur
{
Ålder
”Klustring” identifierar grupperingar
Ett kluster är en grupp av objekt som grupperas
tillsammans på grund av likheter, till exempel likartat
beteende
Skulder
X
X
XX
XX
XX
X
XX
X X
X X
XX
Gk/ÖK:ITO, MH
49
Kunskapshantering
Fakta
2006-10-09
Lönsamma
kunder!
XX
XXX
Lönsamma kunder
Data
XX
X
X
XXX
2006-10-09
XXX
X
XX
XXX
Information
Kontext
Gk/ÖK:ITO, MH
2006-10-09
Inkomster
Gk/ÖK:ITO, MH
50
Tyst och explicit kunskap
Tyst och explicit kunskap kräver olika
former av kunskapshantering och
kunskapshanteringssystem
{ Tyst kunskap – är kunskap förstådd och
tillämpad omedvetet. Erhålls och delas
genom erfarenhet och social interaktion
{ Explicit kunskap – är kunskap precist
och formellt artikulerad. Ofta kodifierad
som går att spara i dokument och
databaser. Mera oberoende av individen
Kunskap
Erfarenhet
51
2006-10-09
Gk/ÖK:ITO, MH
52
13
Mål med kunskapshanteringssystem
Kunskapshanteringsaktiviteter
{
{
{
{
{
Inhämtning
Representation
Lagring
Formalisering – från tyst till explicit
kunskap
Problem: hur motiverar man
kunskapsutbyte?
z
2006-10-09
Kunskapshanteringssystem är
kommunikationssystem som
ska underlätta delande av
kunskap, snarare än
information
Hur kan man mha IT stödja
kunskapsutbyte/återanvändning?
Gk/ÖK:ITO, MH
53
2006-10-09
Gk/ÖK:ITO, MH
54
Principer att hålla i minnet (Alter)
{
{
{
{
2006-10-09
Den viktigaste kunskapen är tyst
kunskap
Tyst kunskap utbyts bäst genom
personlig interaktion
Allt arbete är ”kunskapsarbete" i dagens
ekonomi
Organisationer förlorar kunskap när de
människor slutar
Gk/ÖK:ITO, MH
55
14