Ett strukturerat datalager – vinster och utmaningar Ulf Durnell ROS Internationella/nationella initiativ Data warehouse-lösningar har tagits fram och håller på att utvecklas bl.a. i: • Australien, • Finland (Individ) samt • National Agricultural Statistics Service i USA • Slovenien • Eurostat Utvecklingen av användningen datalager nationellt Pågår bl.a. i: • Vetenskapsrådet • Energimyndigheten • Försäkringskassan • Trafikanalysmyndigheten Intentions for Statistic Sweden Survey A Survey B Survey C Data store A Data store B Data store C Dissemination Publishing Dissemination Publishing Dissemination Publishing • Support process oriented production • Active Communication with suppliers • Use of registers when possible • Standardization Survey A Survey B Survey C Input data warehouse Output data warehouse Dissemination Publishing Dissemination Publishing Dissemination Publishing MÅL OCH SYFTE Juridik Teknik Kund/Användare Statistisk metod Nytt arbetssätt Strukturerat datalager Handlingsberedskap Effektivare Nya datakällor Uppgiftslämnarklimat et Nyckelord • • • • • • • • • Standardisering (grad) Återanvändning Konsistens och jämförbarhet Samanvändbarhet Spårbarhet Tillgänglighet Tillrättaläggande Longitudinella perspektivet Arbetssätt SCB:s strategi för samordnad statistikproduktion Utvärdera och återkoppla Fastställ behov Designa och planera Skapa och testa Samla in Bearbeta Analysera Redovisa och kommunicera Stöd och infrastruktur VST Behörighet Frågor Plattform Dataåtkomst Variabler Termer Metadata Verktyg Klassifikationer Processflöde Processdata Datalager Publicering Direktinsamling Indatalager Mikrodatalager Administrativa data Basregister Makrodatalager Presentationsdatalager Spridning Genomförandetakt 2011 2012 2013 2014 2015 2016 - 2020 Projektstart - fas 1 Inledningsfas Genomförandefas 1 Genomförandefas 2 • Inledningsfas 2012-2013 (utreda förutsättningar för genomförandet och en mer operativ del) • Genomförandefas I 2014 – 2015 (nyutveckling för att förverkliga datalagerstrategin enligt förutsättningarna i inledningsfasen) • Genomförandefas II 2016 – 2020 (implementering för datalagerstrategin nås fullt ut) Förutsättningar 1. Att arbetet blir en integrerad del av övriga SCB – Portföljstyrningen 2. Arbetssätt med innehållsdrivna prioriteringar – Nyttorealisering 3. Juridiska frågor är identifierade och ett gemensamt förhållningssätt kring hanteringen av datalagren framtaget 4. Kartläggning av kompetensbehovet 5. En organisatorisk och administrativ lösning för genomförande Förstärkning av metadata “Metadata is the DNA of the data warehouse” Enhetlig beskrivning av metadata (begrepp) (återanvändning) Tillgängliggör centrala beskrivningar Göra metadata enkelt sökbart Beskriv metadata genom processtegen (spårbarhet) Förstärka datalagret Driftsätt kopplingarna mellan/inom basregistren. Skapa miljöer för en gemensam granskningsprocess för administrativa data Leverantörskontakter - nya administrativa data (Big Data), metadata, kvalitetsindikatorer (CoP) Friställ stora delar av nuvarande datalager genom arkivering och/eller backuptagning/friställning. Inför krav på re-design av undersökningar som kan ha en potential att ersätta direktinsamlade data från datalagret (internt/externt) Utveckla designstegets betydelse ur ett helhetsperspektiv