Arkiveringsperspektiv { Informationsarkivering för operativ och strategisk verksamhet Operativa databaser z F5 { Strategiska databaser z 2006-10-09 Gk/ÖK:ITO, MH 1 2006-10-09 Används för att arkivera information som används för att utföra dagligt arbete och att fatta beslut som har med det dagliga arbetet att göra Används för att arkivera information som behövs för att kunna fatta strategiska beslut dvs. beslut på längre sikt Gk/ÖK:ITO, MH 2 Dagens föreläsning { Arkivering av information för operativa ändamål z { Arkivering av information för strategiska ändamål z { { Beslutsfattande, Data Warehousing, Data Warehouse, Datamining Kunskapshantering SQL z 2006-10-09 Operativ informationsarkivering Informationsbehov, databas(er), Database Management System, datamodellering, E-R diagram Insert, update, delete, select Gk/ÖK:ITO, MH 3 2006-10-09 Gk/ÖK:ITO, MH 4 1 Informationsbehov? Mina vänners intressen { Jag vill gå på aktivitet X, vem av mina vänner skall jag be om att följa med? z Informationsbehov; det som jag behöver känna till om mina vänner för att kunna välja ut rätt vän att kontakta för att gå på aktivitet X. { Var hittar jag den informationen? { 2006-10-09 Gk/ÖK:ITO, MH 5 Entitet (företeelse) { 2006-10-09 Gk/ÖK:ITO, MH Vad behöver jag veta om en entitet? Entitet; något som jag behöver information om Aktivitet Vän Namn Gatuadress Postnr Postort telnr namn Ex Kalle Ex Tennis samband Aktiviteter Vänner 2006-10-09 6 Gk/ÖK:ITO, MH 7 2006-10-09 Gk/ÖK:ITO, MH 8 2 Var hittar jag informationen ? Databas - definition enligt Alter Dator Ej dator { Bok Bokhylla Bok (fil) Bokhyllan (filhanteringssystem) Bibliotek (databas) Dator Böcker (tabeller i en databas) ”Structured collection of electronically stored data that is controlled and accessed through computers…” Bibliotekarie (DBMS) (DataBase Management System) 2006-10-09 Gk/ÖK:ITO, MH 9 Gk/ÖK:ITO, MH ”…based on predefined relationships between predefined types of data items related to a specific business, situation or problem” { Lagringen av data z z z z z 2006-10-09 Gk/ÖK:ITO, MH 10 Olika typer av databaser Databas - definition enligt Alter, forts.. { 2006-10-09 11 2006-10-09 { Typ av data z z Hierarkiska z databaser Nätverksbaserade z databaser Relationsdatabase r Objektorienterade databaser Multidimensionell a databaser Gk/ÖK:ITO, MH Geografiska databaser Textdatabaser Bilddatabaser Hypertextdatabaser 12 3 DataBase Management System (DBMS) { Bibliotek kontra databas { Det är ett antal integrerade program som används för att definiera, uppdatera och kontrollera databaser.; Bibliotek z { lägga in ny data ändra i data { radera data { hämta data { Kategoriserad Ämnesområden t.ex. biologi Databas z Kategoriserad { Företeelser som man behöver samla in information om t.ex. människor { { 2006-10-09 Gk/ÖK:ITO, MH z { 13 2006-10-09 Teknik; 1. Datamodellering (variant av konceptuell modellering) z { 2. Resultat; Entity-Relationship (E-R) Diagrams, datamodeller (exempel på ett konceptuellt schema eller en konceptuell modell) z 2006-10-09 Gk/ÖK:ITO, MH Författarenamn t.ex. Karin Wahlberg Gk/ÖK:ITO, MH z Sorterad { Primär nyckel t.ex. personnummer 14 Data modellering Definiera och organisera data i en databas { Sorterad 3. 15 2006-10-09 Vilka företeelser (entiteter) behöver man information om? Vilken information måste databasen innehålla för varje företeelse (entitetstyp)? Vilka relationer finns det mellan de olika företeelserna (entiteterna) Gk/ÖK:ITO, MH 16 4 Vändatabas { { Entitesbeskrivning E-R modell (diagram) som innehåller den information som du behöver för att hitta rätt vän för att besöka aktivitet X. E-R diagrammet behöver innehålla information om z z z Vänner Aktiviteter Vilka aktiviteter som mina vänner deltar i 2006-10-09 Gk/ÖK:ITO, MH Entitetsnamn Medlem Primär nyckel 17 E-R diagram 2006-10-09 Lärare Tex Gudrun 2006-10-09 6 20 30 40 5 10 18 Relationstyper M:1-relation Kardinalitet Attribut 1 Attribut 2 Attribut 3 etc num anum anum anum num anum medlemsnr fnamn enamn gadr postnr postadr Gk/ÖK:ITO, MH Entitet Entitetsnamn 1 Databas deklaration behöver dessutom för varje attribut: typ av tecken t.ex. bokstäver, tal Antal tecken per typ, tex. 30 Attribut 1 Attribut 2 Attribut 3 etc betalar Medlem Avgift Entitetsnamn 2 namn Relation Attribut 1 Attribut 2 Attribut 3 etc Elev: Tex Kalle, Lisa Gk/ÖK:ITO, MH 1:1-relationer har tränar M:M-relation Elev: Kalle Kontaktperson 19 2006-10-09 Gk/ÖK:ITO, MH Sport 20 5 Upplösning av M:M-relation Realisering av relation i tabellerna Avgift medlem betalar Medlem Modell: Avgift medlemsnr avgiftsnr medlemsnr tabeller: sportdeltagare Primär Nyckel avgiftsnr Medlemsnr sportnr 2006-10-09 Sport 21 2006-10-09 Gk/ÖK:ITO, MH 22 Kvalitetsaspekter { Avgift Normalisering z avgiftsnr medlemsnr avgiftsnr Främmande nyckel: realiserar relationen mellan två olika entiter Referensintegritet medlem Avgift avgiftsnr sportnr Gk/ÖK:ITO, MH medlem medlemsnr - Regler för att uppnå ”god” design undvika redundans avgiftsnr { { 2006-10-09 Gk/ÖK:ITO, MH 23 2006-10-09 Åtkomst Säkerhet Gk/ÖK:ITO, MH 24 6 Databas Vänner (E-R diagram/Databasmodell) Vad behöver jag veta om en entitet? Aktivitet Van vannr fnamn enamn gadr postnr mtelnr 2006-10-09 Van vannr vfnamn venamn gadr postnr mtelnr Aktivitet aktnr aktnamn aktnr aktnamn Gk/ÖK:ITO, MH 25 2006-10-09 Databas Vänner (E-R diagram/Databasmodell) Gk/ÖK:ITO, MH Tabellbeskrivning av en entitet Van Van vannr vfnamn venamn gadr postnr mtelnr 26 Aktivitet vannr aktnr aktnamn 10001 10002 10003 Entitetstyp attribut vfnamn venamn gadr postnr mtel Eva Per Lotta Åström Älvström Byström Storg 1 Byg 1 Gåg 10 91436 72048 34091 070886777 070777777 070987654 Post Instans objekt Van/akt Vannr aktnr 2006-10-09 Gk/ÖK:ITO, MH 27 2006-10-09 Gk/ÖK:ITO, MH 28 7 Sammanfattning { Sammanfattning E-R diagram/databasmodell z z z z z E-R Diagram/databasmodell: Beskriver strukturen samt innehållet i databasen genom: Entiteter Attribut Primärnycklar Relationer Van vannr vfnamn venamn gadr postnr mtelnr Aktivitet aktnr aktnamn Van/akt Vannr aktnr 2006-10-09 Gk/ÖK:ITO, MH 29 Sammanfattning Van vannr 10001 10002 10003 Entitetstyp attribut Med relationer: vfnamn venamn gadr postnr mtel Eva Per Lotta Åström Älvström Byström Storg 1 Byg 1 Gåg 10 91436 72048 34091 070886777 Gk/ÖK:ITO, MH Gk/ÖK:ITO, MH 30 Sammanfattning Vän/Aktivitet 070777777 070987654 Post Instans objekt 2006-10-09 2006-10-09 31 Aktivitet Aktnr Aktnamn 2001 tennis 2006-10-09 Aktnr Vannr 2001 1001 Vän Gk/ÖK:ITO, MH Vannr Vfnamn 1001 Eva 32 8 Beslutsprocessen Strategisk informationsarkivering Precisera problemet Hitta problemet Problemlösning Intelligence - Samla och analysera data om problemet Design Choice Implementation - Skapa alternativ, skapa kriterier för utvärdering, utvärdera resultat av alternativ - Välj prioriterat/optimalt alternativ -Informera om beslut, genomför valt alternativ Resultat 2006-10-09 Gk/ÖK:ITO, MH 33 2006-10-09 Beslutsteorier – om hur beslut går till/bör gå till { { { { 2006-10-09 34 Alters definition av beslutsstödssystem Rationella – objektivt, analytiskt, optimerande { Satisfactory – tillräckligt bra alternativ väljs Carbage can – olika problem, lösningar och idéer släng ihop, subjektiva, slumpartade beslut Political model – beslut som fattas beror på kompromisser mellan grupper Gk/ÖK:ITO, MH Gk/ÖK:ITO, MH 35 2006-10-09 ”Beslutsstödssystem är ett interaktivt informationssystem som tillhandahåller information, modeller, datamanipuleringsverktyg för att stödja beslutsfattande i semistrukturerade och ostrukturerade situationer när ingen vet exakt hur beslut ska tas” Gk/ÖK:ITO, MH 36 9 DW Definition av DW (Alter) “Ett data warehouse (datalager) är en kombination av en databas och en mjukvara som är utformad för att stödja verksamhetsanalys och beslutsfattande på ledningsnivå snarare än att stödja minut till minut-processande av verksamhetstransaktioner” • Data som lagras i ett data warehouse laddas ned periodiskt från transaktionsdatabaser, och laddas i en separat databas som ofta finns på en separat dator och som använder en speciell OLAP-server (On-Line Analytical Processing) • Genom att ha ett DW undviker man att störa transkationssystemens dagliga verksamhet • Möjliggör strukturering av data så att användare kan få snabba svar (stjärnstrukturer och kuber) 2006-10-09 Gk/ÖK:ITO, MH 37 2006-10-09 Varför behövs ett DW? DB DBMS OLAP servers End user application A Data warehouse DBMS End user application B DB DBMS DB DBMS 2006-10-09 38 Data warehousing arkitektur External källor DB Gk/ÖK:ITO, MH End user application C Det finns behov av att samla data som finns utspridd på flera databaser/IT-system – som underlag för strategiska och taktiska beslut Gk/ÖK:ITO, MH 39 Operational DBs/ TPS/OLTP Transaktionssystem (TPS) som sköter den dagliga verksamheten + 2006-10-09 externa källor Extract Consolidation Filtering Cleansing Transformation Aggregation Updating Analysis/OLAP Productt Serve Data marts Time1 Value1 Value11 Product2 Time2 Value2 Value21 Product3 Time3 Value3 Value31 Product4 Time4 Value4 Value41 Query/Reporting Data mining OLAP servers Data staging area ”The data warehouse” OLAP servers ETL process (Extract, Transform, Load) Gk/ÖK:ITO, MH Falö aöldf flaöd aklöd falö alksdf Slutanvändarverktyg Business Intelligence tools 40 10 Spreadsheet (kalkylblad) output från OLAP-verktyg Vad är OLAP? Akronym för “On-line Analytical Processing” mounth quarter product product group OLAP-system fanns redan på 1970-talet, innan det talades om data warehousing. Idag är OLAP nära knutet till data warehousing. Column headers (join constraints) OLAP är ett beslutsstödssystem som stödjer ad-hoc frågor Idén är att låta användare enkelt och snabbt manipulera och visualisera data genom multidimensionella vyer, det vill säga ur olika dimensioner eller perspektiv office region Dimensioner/Vyer Column header (application constraint) Product Group Group A Group A Group B Group B Region ABC XYZ ABC XYZ Answer set representing focal e ent Dimensioner/Vyer First Quarter - 1997 1245 34534 45543 34533 Fakta Row headers Gk/ÖK:ITO, MH 41 2006-10-09 Gk/ÖK:ITO, MH The data cube: Spreadsheets: En populär konceptuell modell som influerat utformning av: e fic of • slutanvändarverktyg (OLAP-klienter) quarter • modellering av databasschema (dimensionell modellering) The data cube: 130 e fic of 2 300 2 300 5 024 200 service - Numeriska fakta (e.g. antal, summa) beror på en mängd dimensioner/vyer/perspektiv 200 Gk/ÖK:ITO, MH 5 024 200 service 2006-10-09 130 130 2 300 5 024 42 Kuben: “multidimensionell” vy av data Kuben: “multidimensionell” vy av data quarter 2006-10-09 43 2006-10-09 Gk/ÖK:ITO, MH 44 11 Dimensional modelling - Star-join schema Dimensional modelling - Star-join schema Service Dimension Service used Time Key S1 S2 S3 S4 - date - month - quarter - year - service name - service group Service group Group A Group A Group B Group C Service Local call Intern. call SMS WAP Telephone calls - sum ($) - number of calls - seller name - office Key F11 F12 F13 Gk/ÖK:ITO, MH 45 Seller Anders C Lisa B Janis B Month 9910 9910 Quarter 4 - 99 4 - 99 Year 99 99 Fact table - Transactions S1 S3 S2 S1 S4 F11 F11 F13 F13 F13 Office Dimension - customer name - address - region - income group 2006-10-09 Date/ Key 991011 991012 C210 C210 C212 C213 C214 Customer Office Dimension Time Dimension Office Sundsvall Sundsvall Kista 2006-10-09 991011 991011 991011 991011 991012 Sum 25:00 05:00 89:00 12:00 08:00 Number of calls 3 1 1 1 1 Customer Dimension Key C210 C211 C212 C213 C214 Customer Anna N Lars S Erik P Danny B Åsa S Address Stockholm Malmö Rättvik Stockholm Stockholm Region Stockholm Skåne Dalarna Stockholm Stockholm Income group B B C A A Gk/ÖK:ITO, MH 46 Två star-join scheman Data mining Quarter Service Calls Office { Data Mart B Customer Quarter Service { Data Mart A Subscription Office Data Warehouse = Data Mart A + Data Mart B 2006-10-09 Gk/ÖK:ITO, MH orders Data mining är användning av dataanalysverktyg för att finna mönster i stora (transaktions)databaser Särskilda algoritimer används för att hitta dessa mönster Customer 47 2006-10-09 Gk/ÖK:ITO, MH 48 12 Regression ”Klustring” { { Vid regression försöker hitta en linje eller kurva genom en mängd data, se figur { Ålder ”Klustring” identifierar grupperingar Ett kluster är en grupp av objekt som grupperas tillsammans på grund av likheter, till exempel likartat beteende Skulder X X XX XX XX X XX X X X X XX Gk/ÖK:ITO, MH 49 Kunskapshantering Fakta 2006-10-09 Lönsamma kunder! XX XXX Lönsamma kunder Data XX X X XXX 2006-10-09 XXX X XX XXX Information Kontext Gk/ÖK:ITO, MH 2006-10-09 Inkomster Gk/ÖK:ITO, MH 50 Tyst och explicit kunskap Tyst och explicit kunskap kräver olika former av kunskapshantering och kunskapshanteringssystem { Tyst kunskap – är kunskap förstådd och tillämpad omedvetet. Erhålls och delas genom erfarenhet och social interaktion { Explicit kunskap – är kunskap precist och formellt artikulerad. Ofta kodifierad som går att spara i dokument och databaser. Mera oberoende av individen Kunskap Erfarenhet 51 2006-10-09 Gk/ÖK:ITO, MH 52 13 Mål med kunskapshanteringssystem Kunskapshanteringsaktiviteter { { { { { Inhämtning Representation Lagring Formalisering – från tyst till explicit kunskap Problem: hur motiverar man kunskapsutbyte? z 2006-10-09 Kunskapshanteringssystem är kommunikationssystem som ska underlätta delande av kunskap, snarare än information Hur kan man mha IT stödja kunskapsutbyte/återanvändning? Gk/ÖK:ITO, MH 53 2006-10-09 Gk/ÖK:ITO, MH 54 Principer att hålla i minnet (Alter) { { { { 2006-10-09 Den viktigaste kunskapen är tyst kunskap Tyst kunskap utbyts bäst genom personlig interaktion Allt arbete är ”kunskapsarbete" i dagens ekonomi Organisationer förlorar kunskap när de människor slutar Gk/ÖK:ITO, MH 55 14