FÖ 2: 2 Databaskursen D t b k 1. 2. 3. 4 4. 5. 6. 7. 8. 9 9. 10. 11. Kvalitetsbegreppet Kommunikation Olika typer av data Olika typer av datalagring Databas DBMS Molntjänster Tabeller ANSI-SPARC SQL Oracle Arkitektur Pär Douhan, Douhan [email protected] pdo@du se 1 K lit t? Kvalitet? Datakvalitet? Informationskvalitet? 2 K lit t b Kvalitetsbegreppet t - definitioner d fi iti 1. Ordböcker och lexikon: ”God beskaffenhet” eller ”goda egenskaper” (Swan, 1987) 2. En definition: ”Uppfyllandet av satta krav” (Crosby, 1979) 3 En annan definition: ”Alla 3. Alla sammantagna egenskaper hos ett objekt eller företeelse som ger dess förmåga att tillfredsställa uttalade eller underförstådda behov" (ISO9000 SS020104) Termen kvalitet används, enligt Bo Sundgren, på två olika sätt: 1. På ett neutralt sätt – i det neutrala läget har kvalitet ungefär samma betydelse som egenskap. Man kan alltså förse viss data med ett antal egenskaper som kan ses som kvalitetsbeskrivningar för datat. datat 2. På ett normativt sätt – i det normativa läget är det meningsfullt att prata om god kvalitet, bättre kvalitet, sämre kvalitet och dålig kvalitet. God kvalitet är relaterad till användaren och användningen. Det som i en situation kan vara bra kvalitet, kan i en annan situation vara oacceptabelt dålig kvalitet. 3 Tjä t k lit t - egenskaper Tjänstekvalitet k Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar tjänstekvalitet: 1. 2. 3. 4. 5. 6. Omgivning – miljön som tjänsten presenteras i Pålitlighet – hur tillförlitligt tjänsten utförs av leverantören Tillgänglighet – Hur lätt det är för kunden att få kontakt med leverantören Tjänstvillighet – Viljan hos leverantören att hjälpa kunden Artighet – leverantörens uppförande i form av artighet och vänlighet g – förmåga g att tala med kunden på p ett sätt som kunden Kommunikationsförmåga förstår Testa själv j att utvärdera t. ex. köp p och installation av ett kök, eller en totalrenovering av tvättstugan med hjälp av ovanstående kvalitetskriterier! 4 P d ktk lit t - egenskaper Produktkvalitet k Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar produktkvalitet: 1. 2. 3. 4. Prestanda – hur produkten tillfredsställer kundens förväntningar på prestanda Driftsäkerhet– hur ofta det blir fel på produkten och hur alvarliga felen är Underhållsmässighet – hur lätt det är att underhålla och reparera produkten Säkerhet – hur säker produkten är att använda Citat av okänd 90-åring: g ”Om jjagg ändå vetat att livet består av 90% underhåll” 5 A ä db h t - egenskaper Användbarhet k Egenskaper som, enligt Stefan Cronholm, karaktäriserar användbarhet: (Användbarhet är ett centralt forskningstema inom MDI-området) MDI området) 1. 2 2. 3. 4. 5 5. 6. 7. 8 8. Relevans – hur väl IS tillgodoser användarens behov Eff kti it t – hur Effektivitet h effektivt ff kti t eller ll produktivt d kti t arbetsuppgifterna b t ift kan k utföras tfö Användarens attityd – användarens subjektiva känslor mot systemet Lärbarhet – hur lätt systemet är att lära sig Flexibilitet – hur IS klarar anpassningar till verksamhetsförändringar Funktionalitet – hur väl stödjer IS de arbetsuppgifter som användaren utför Samtidighet – olika användare ska kunna använda IS samtidigt Lättanvänt – hur lätt IS är att lära sig och hur nöjd användaren är med IS Analysera Fronter utifrån ovanstående kriterier… 6 K lit t Kvalitetsegenskaper k NVDB Innehållsorienterad metadata 7 Indirekt metadata K Kommunikation ik ti Direkt kommunikation: Hans frågar Pär med ett lismande tonfall: Får jag låna en femhundring? 1. 2. 3. 4. Pär varseblir meddelandet med sina sinnen Tolkar meddelandet g med sin Frame off Reference f Redogör Svarar: Ja Kommunikation via IT-system: Hans skriver ett meddelande: Får jag låna en femhundring? 8 ITsystem Får jag låna en femhundring? K Kommunikationskvalitet ik ti k lit t Generiska kriterier för kommunikationskvalitet enligt Owen Eriksson: 1. Informationen ska gå att förstå samt vara relevant för användaren 1 2. Relevant och begriplig handlingsaspekt - Den illukutionära beståndsdelen (verbet) i handlingen måste vara begriplig. Är det ett erbjudande? En order? En bekräftelse? Ett önskemål? Ett avtal? En fråga? 3. Trovärdig information – Användaren måste kunna lita på att informationen är trovärdig 9 T Trovärdig ä di iinformation f ti i NVDB Hög trovärdighet Låg trovärdighet Ofta är det bristen på rutiner som gör att användare börjar tro att informationen inte är trovärdig. Om detta väl inträffar spelar det ingen roll om datakvaliteten är hög eller inte, det räcker med att man tror att den är dålig. Man kan öka trovärdigheten genom att lagra information om vem som har uppdaterat viss information och när det gjordes. (Gustavsson och Sörman, 2004) 10 D t k lit t - informationskvalitet Datakvalitet i f ti k lit t Data Information Information Data Data 11 Information Låg datakvalitet medför låg informationskvalitet. Hög datakvalitet kan medföra låg informationskvalitet Otillräckligt med informationskvalitet. metadata, låg trovärdighet, otillräcklig frame of reference etc. hos användaren. Högg datakvalitet kan medföra högg informationskvalitet. Tillräckligt med metadata, hög trovärdighet, tillräcklig frame of reference etc. hos användaren. K Konsekvenser k Information låg informationskvalitet Beslut fattas med hjälp av information. Om informationen (beslutsunderlaget) är otillräckligt föreligger stor risk för dåliga beslut. beslut Några g exempel p p på konsekvenser kan vara: 1. Avgrävning av kablar. Om det är otillräcklig lägesnoggrannhet på geografiska koordinater 2. I krigssituationer kan flyktingförläggningar och sjukhus bombas istället för militära mål, om lägesnoggrannheten är för låg eller om den är felaktig 3. Patienter kan felbehandlas i vården 4. Oskyldiga människor kan dömas för brott 12 Olik typer Olika t av data d t 13 Olik typer Olika t av datalagring d t l i 14 I f Informationsbehov ti b h All fö Alla företag eller ll organisationer i i hhar ett informationsbehov i f ti b h 15 D t l Datalagring i På 60-talet dominerades datalagringen av s.k. enkla filsystem. Fortran Cobol kundfiler personalfiler Varje program bearbetade sina egna datafiler. Hög nivå av beroende mellan program och datafiler. 16 D t b Databas En databas är en organiserad samling information. Data Dictionary En databas innehåller alltid en beskrivning av lagrad information. Denna brukar kallas för Data Dictionary. Ibland även för metadatabasen. metadatabasen Det skall vara enkelt att läsa och manipulera information i databasen. 17 DBMS DBMS = Database Management System DBMS är ett system som lagrar, modifierar och hämtar data i databasen. Olika termer används: ORDBMS RDBMS och ORDBMS, DBMS. 18 Olik typer Olika t av databaser d t b Relationsdatabaser, R l ti d t b kom k påå 1970-talet. 1970 t l t LLagrar masterdata, t d t transaktionsdata och analytisk data. Det är detta kursen handlar om. NoSQL databaser, kom en bit in på 2000-talet. Lagrar Big Data, data från bl. a. sociala medier, från sensorer, från webbloggar etc. 19 Olik leverantörer Olika l tö Det finns olika leverantörer av databaser. Exempel på några vanligt förekommande databaser: 20 Olik molntjänster Olika l tjä t Data as a service (DaaS) http://www gapminder org http://www.gapminder.org Database as a service (Cloud Database) 21 Hans Rosling Ed Edgar "T "Ted" d" Codd C dd Edgar Frank Ed F k "Ted" "T d" Codd C dd (19 Augusti A ti 1923 - 18 A Aprilil 2003) var en engelsk datavetare som, när han arbetade för IBM, 1965 uppfann relationsmodellen för databashantering, den teoretiska grunden för relationsdatabaser. Data organiseras g i tabeller på p de logiska g nivåerna. Hög nivå av program/data oberoende. oberoende Klientprogram behöver inte veta hur data fysiskt är lagrat i databasen. Detta realiseras av en tre lager(schema)arkitektur enligt ANSI/SPARC, med två logiska och h en fysisk f k nivå. å 22 T b ll Tabeller En relationsdatabas är samling av relationer eller tvådimensionella tabeller. tabeller En relationsdatabas E l ti d t b använder dessa tvådimensionella tabeller för att lagra data. 23 ANSI SPARC Arkitekturen ANSI-SPARC A kit kt Vy 1 Vy 2 Del av helheten Vy 3 Extern nivå Logiskt dataoberoende Alla objekt i databasen med metadata om dessa Hela logiska vyn av databasen Konceptuell nivå Fysiskt dataoberoende Hur dessa objekt fysiskt är lagrade i databasen Fil -och postbeskrivningar OS 24 Fysisk y nivå D t (111000111001) Data G Gemensamt t för fö alla ll databaser d t b Alla databaser består av: 1. Memory (minne) 2. Processes (processer) 3 Storage (lagring, 3. (lagring filer på disk) 25 SQL SQL, Structured Query Language SQL DB DBMS Resultat Databas: Består av olika filer; datafiler datafiler, kontrollfiler och redo loggfiler lagrade på disk. DBMS: Mjukvara, Mjukvara t. t ex. ex Oracle eller MySQL, MySQL som via SQL tillhandahåller åtkomst till filerna i databasen. Består av olika minnesareor och bakgrundsprocesser. I Oracle's arkitektur kallas DBMS för Oracle Instance. 26 Oracle Server O Oracle l klient Oracle Instance SGA Shared pool User process unik session SQL Resultat database buffer cache Library cache Redo edo log og buffer DBMS Dictionary cache Server process PMON Bakgrundsprocesser B k d (Tasks) Datafiler SMON DBWR Kontrollfiler LGWR redo logg 1a CKPT redo logg 1b DB Datafiler 27 Kontrollfiler Olik roller Olika ll DBA, Databasadministratör, ansvarar för säkerhet, drift och underhåll av databasen. Developers, De elopers de d som utvecklar applikationer End E d users, de d som använder databasens tjänster 28 SQL fem SQL, f olika lik delar d l SQL SQL-språket åk består b å av fem f olika lik delar: d l 1. 2. 3. 4. 5 5. 29 Data Retrivial Language select DML, Data Manipulation Language insert, update och delete DDL, Data Definition Language create, alter och drop DCL, Data Control Language grant och revoke TCL T TCL, Transaction ti C Control t lL Language commit och rollback