2015-03-26
1
Seminarium om datalager
2015-03-26
Ingemar Svensson, Analysavdelningen
2015-03-26
2
Lite bakgrund om Pensionsmyndigheten
2015-03-26
3
Pensionsyndigheten bildades 2010-01-01
Sammanslagning av
o premiepensionsmyndigheten (PPM)
o pensionsverksamheten vid
Försäkringskassan
• Vi finns på 8 orter:
Luleå, Söderhamn, Gävle, Stockholm, Karlstad
Växjö, Halmstad och Visby
• Cirka 1 000 medarbetare
• Det finns drygt 100 servicekontor
• Servicekontoren är ett samarbete mellan:
- Försäkringskassan
- Skatteverket
- Pensionsmyndigheten
2015-03-26
4
• Pensionsmyndighetens IT-system är en
vidareutveckling av PPM:s IT-system
System för
–
–
–
–
Ärendehantering
Premiepensionen (Pluto)
Telefoni och e-post
Webb
• Många tunga IT-system ligger kvar på Försäkringskassan
De kommer inte att flyttas
– Stora kostnader för att bygga nytt på Pensionsmyndigheten
– Samordningsvinster mellan Pensionsmyndigheten och
Försäkringskassan
• Under överskådlig framtid kommer vi att ha källsystem för
datalagret både på Pensionsmyndigheten (i Stockholm) och
på Försäkringskassan (i Sundsvall)
2015-03-26
5
Varför vi behöver ett datalager
2015-03-26
6
1. Pensionsmyndigheten är officiell statistikmyndighet
Ansvarsområde: stöd vid ålderdom
2. Pensionsmyndigheten ska följa, analysera och förmedla
ålderspensionssystemets utveckling och effekter för
enskilda och samhälle (instruktionen 2 §)
3. Statistik och statistiska analyser behövs för andra
ändamål på myndigheten: kvalitetsförbättringar,
information mm
T.ex. kundsegmentering, prediktionsmodeller
1-2 ingår i den särskilda verksamheten för framställning av
statistik. Statistiksekretessen gäller.
2015-03-26
7
• Försäkringsstatistik
– antal pensionärer och pensionssparare, pensionsbelopp,
pensionsbehållningar, fondinnehav och deras marknadsvärde etc
• Produktionsstatistik
– uppgifter för resultatuppföljning med ”kund”-perspektiv
t.ex. handläggningstider, utbetalningsprecision, andel besvarade
telefonsamtal i tid
– uppgifter för produktionsuppföljning, produktionsstyrning,
produktionsplanering t.ex. volymer av inkomna och avslutade ärenden,
antal genomförda arbetsmoment av olika slag
Stort fokus på produktionsstatistiken under de första åren
2015-03-26
8
Vägledande principer och ambitioner
2015-03-26
9
Transparens, stöd för öppen källkod och öppna data
• I princip all statistik och resultatinformation ska bli
tillgänglig via externwebben
• Egen sida på GitHub (samarbetsplattform för öppen
källkodsutveckling)
https://github.com/SwedishPensionsAgency
– Kolumnorienterad databashanterare för R-användare (Coldbir)
– R-paket för automatisk generering och design av dokument (rapporter
med text, tabeller och diagram)
• Öppen källkod i Excel/VBA-baserade simuleringsmodeller
– Pensionsmodellen:
Finansiella simuleringar av pensionssystemet på makronivå
– Typfallsmodellen:
Pensionsutfallet för en individ med specificerade egenskaper
2015-03-26
10
Våra nuvarande datalager
Pågående och planerat utvecklingsarbete
2015-03-26
11
Nuvarande datalager:
• Store (Försäkringskassan)
• Asta (arv från PPM)
• Kopia av Pluto (källsystemet) (arv från PPM)
Alla ska ersättas med ett nytt sammanhållet datalager:
PEnsionsmyndigheterns DAtaLager - Pedal
4-5 år för att ersätta pensionsdelen av Store med Pedal
Filer med historiska data började levereras i augusti 2013
Troligen slutar Pensionsmyndigheten använda Store 2016-01-01
2015-03-26
12
Utvecklingsplaner (i urval) för Pedal
1. Använd den befintliga datafångsten från källsystemen på
Försäkringskassan. Styr om filerna som idag går till Store
så att de i stället går till Pedal.
2. Ersätt alla viktiga produkter från Store (statistikrapporter
mm) med motsvarande produkter via Pedal.
Måltidpunkter 1/7 2015 och 1/9 2015.
3. Vidareutveckla statistiken och analysdatabaser
4. Datafångst från andra myndigheter för statistikändamål
(t.ex. sjuk- och aktivitetsersättning, egenlivräntor)
5. Utöka datafångsten från pensionsmyndighetens
källsystem (t.ex. levnadsintyg)
2015-03-26
13
Organisation, utvecklingsmetodik och arkitektur
2015-03-26
14
Organisation och utvecklingsmetodik
• Agila metoder. Tonvikt på informella metoder för att styra
och bedriva arbetet. Desto större fokus på god
dokumentation av slutprodukter
• Alla nödvändiga kompetenser samlade i en organisatorisk
enhet (processorienterad snarare än funktionsorienterad
organisation). ”Business Intelligence Competence Center”
• 2 breda yrkesroller:
– Dataanalytiker: kravanalys, dokumentation
– Utvecklare: utveckling och förvaltning av produktionskod, drift
av datalagret
2015-03-26
15
Utgångspunkter för arkitektur och organisation
1. Komplexa och innehållsrika administrativa data - skapar
både möjligheter och utmaningar
2. Råa administrativa data svåra att använda. Data kräver
omfattande förädling för att bli relevanta och användbara
för statistik och analysändamål
3. Att skapa lättanvända och relevanta förädlade data
kräver detaljkunskaper om pensionssystemets regelverk,
arbetsrutiner i ärendehandläggningen, egenheter hos ITsystemen mm
4. Det är tidskrävande att bygga upp dessa kunskaper och
analysera källdatat för att avgöra hur det ska förädlas
5. Förändringar i datafångsten från källsystemen kan bara
göras fyra gånger per år
2015-03-26
16
• Pedal består av flera databaser med olika syften
• Lagring av data med olika förädlingsgrad
• Stöd för inkrementell utveckling: vi ska kunna leverera det
viktigaste först
• Stöd för flexibilitet
Obearb
Källsystem
Filer
Grund
Analyser
Ad hoc-statistik
Dim
Statistikunderlag
Statistikrapporter
2015-03-26
17
Våra verktyg
•
•
•
•
•
•
SAS Data Integration Studio (ETL-verktyg)
Microsoft SQL Server (datalagring, databearbetningar)
Microsofts rapporteringsverktyg
R (databearbetningar, statistiska analyser, visualisering)
SAS Base (databearbetningar)
Shiny (R-paket) och javascript (statistikpresentation på
externwebben)
• Git/Stash/Jira/Confluence (pattform för samarbete,
versionshantering av kod och ärendehantering)
2015-03-26
18