SCB:s strategi för samordnad statistikproduktion

Ett strukturerat datalager –
vinster och utmaningar
Ulf Durnell
ROS
Internationella/nationella initiativ
Data warehouse-lösningar har tagits fram och håller på att
utvecklas bl.a. i:
• Australien,
• Finland (Individ) samt
• National Agricultural Statistics Service i USA
• Slovenien
• Eurostat
Utvecklingen av användningen datalager nationellt
Pågår bl.a. i:
• Vetenskapsrådet
• Energimyndigheten
• Försäkringskassan
• Trafikanalysmyndigheten
Intentions for Statistic Sweden
Survey A
Survey B
Survey C
Data store A
Data store B
Data store C
Dissemination
Publishing
Dissemination
Publishing
Dissemination
Publishing
• Support process oriented
production
• Active Communication with
suppliers
• Use of registers when
possible
• Standardization
Survey A
Survey B
Survey C
Input data
warehouse
Output data
warehouse
Dissemination
Publishing
Dissemination
Publishing
Dissemination
Publishing
MÅL OCH SYFTE
Juridik
Teknik
Kund/Användare
Statistisk metod
Nytt arbetssätt
Strukturerat
datalager
Handlingsberedskap
Effektivare
Nya datakällor
Uppgiftslämnarklimat
et
Nyckelord
•
•
•
•
•
•
•
•
•
Standardisering (grad)
Återanvändning
Konsistens och jämförbarhet
Samanvändbarhet
Spårbarhet
Tillgänglighet
Tillrättaläggande
Longitudinella perspektivet
Arbetssätt
SCB:s strategi för samordnad
statistikproduktion
Utvärdera och återkoppla
Fastställ
behov
Designa och
planera
Skapa och
testa
Samla in
Bearbeta
Analysera
Redovisa och
kommunicera
Stöd och infrastruktur
VST
Behörighet
Frågor
Plattform
Dataåtkomst
Variabler
Termer
Metadata
Verktyg
Klassifikationer
Processflöde
Processdata
Datalager
Publicering
Direktinsamling
Indatalager
Mikrodatalager
Administrativa
data
Basregister
Makrodatalager
Presentationsdatalager
Spridning
Genomförandetakt
2011
2012
2013
2014 2015 2016 - 2020
Projektstart - fas 1
Inledningsfas
Genomförandefas 1
Genomförandefas 2
• Inledningsfas 2012-2013 (utreda förutsättningar för
genomförandet och en mer operativ del)
• Genomförandefas I 2014 – 2015 (nyutveckling för
att förverkliga datalagerstrategin enligt
förutsättningarna i inledningsfasen)
• Genomförandefas II 2016 – 2020 (implementering
för datalagerstrategin nås fullt ut)
Förutsättningar
1. Att arbetet blir en integrerad del av övriga SCB –
Portföljstyrningen
2. Arbetssätt med innehållsdrivna prioriteringar –
Nyttorealisering
3. Juridiska frågor är identifierade och ett
gemensamt förhållningssätt kring hanteringen av
datalagren framtaget
4. Kartläggning av kompetensbehovet
5. En organisatorisk och administrativ lösning för
genomförande
Förstärkning av metadata
“Metadata is the DNA of the data warehouse”
 Enhetlig beskrivning av metadata (begrepp)
(återanvändning)
 Tillgängliggör centrala beskrivningar
 Göra metadata enkelt sökbart
 Beskriv metadata genom processtegen
(spårbarhet)
Förstärka datalagret
 Driftsätt kopplingarna mellan/inom basregistren.
 Skapa miljöer för en gemensam granskningsprocess
för administrativa data
 Leverantörskontakter - nya administrativa data (Big
Data), metadata, kvalitetsindikatorer (CoP)
 Friställ stora delar av nuvarande datalager genom
arkivering och/eller backuptagning/friställning.
 Inför krav på re-design av undersökningar som kan ha
en potential att ersätta direktinsamlade data från
datalagret (internt/externt)
 Utveckla designstegets betydelse ur ett
helhetsperspektiv