2015-03-26 1 Seminarium om datalager 2015-03-26 Ingemar Svensson, Analysavdelningen 2015-03-26 2 Lite bakgrund om Pensionsmyndigheten 2015-03-26 3 Pensionsyndigheten bildades 2010-01-01 Sammanslagning av o premiepensionsmyndigheten (PPM) o pensionsverksamheten vid Försäkringskassan • Vi finns på 8 orter: Luleå, Söderhamn, Gävle, Stockholm, Karlstad Växjö, Halmstad och Visby • Cirka 1 000 medarbetare • Det finns drygt 100 servicekontor • Servicekontoren är ett samarbete mellan: - Försäkringskassan - Skatteverket - Pensionsmyndigheten 2015-03-26 4 • Pensionsmyndighetens IT-system är en vidareutveckling av PPM:s IT-system System för – – – – Ärendehantering Premiepensionen (Pluto) Telefoni och e-post Webb • Många tunga IT-system ligger kvar på Försäkringskassan De kommer inte att flyttas – Stora kostnader för att bygga nytt på Pensionsmyndigheten – Samordningsvinster mellan Pensionsmyndigheten och Försäkringskassan • Under överskådlig framtid kommer vi att ha källsystem för datalagret både på Pensionsmyndigheten (i Stockholm) och på Försäkringskassan (i Sundsvall) 2015-03-26 5 Varför vi behöver ett datalager 2015-03-26 6 1. Pensionsmyndigheten är officiell statistikmyndighet Ansvarsområde: stöd vid ålderdom 2. Pensionsmyndigheten ska följa, analysera och förmedla ålderspensionssystemets utveckling och effekter för enskilda och samhälle (instruktionen 2 §) 3. Statistik och statistiska analyser behövs för andra ändamål på myndigheten: kvalitetsförbättringar, information mm T.ex. kundsegmentering, prediktionsmodeller 1-2 ingår i den särskilda verksamheten för framställning av statistik. Statistiksekretessen gäller. 2015-03-26 7 • Försäkringsstatistik – antal pensionärer och pensionssparare, pensionsbelopp, pensionsbehållningar, fondinnehav och deras marknadsvärde etc • Produktionsstatistik – uppgifter för resultatuppföljning med ”kund”-perspektiv t.ex. handläggningstider, utbetalningsprecision, andel besvarade telefonsamtal i tid – uppgifter för produktionsuppföljning, produktionsstyrning, produktionsplanering t.ex. volymer av inkomna och avslutade ärenden, antal genomförda arbetsmoment av olika slag Stort fokus på produktionsstatistiken under de första åren 2015-03-26 8 Vägledande principer och ambitioner 2015-03-26 9 Transparens, stöd för öppen källkod och öppna data • I princip all statistik och resultatinformation ska bli tillgänglig via externwebben • Egen sida på GitHub (samarbetsplattform för öppen källkodsutveckling) https://github.com/SwedishPensionsAgency – Kolumnorienterad databashanterare för R-användare (Coldbir) – R-paket för automatisk generering och design av dokument (rapporter med text, tabeller och diagram) • Öppen källkod i Excel/VBA-baserade simuleringsmodeller – Pensionsmodellen: Finansiella simuleringar av pensionssystemet på makronivå – Typfallsmodellen: Pensionsutfallet för en individ med specificerade egenskaper 2015-03-26 10 Våra nuvarande datalager Pågående och planerat utvecklingsarbete 2015-03-26 11 Nuvarande datalager: • Store (Försäkringskassan) • Asta (arv från PPM) • Kopia av Pluto (källsystemet) (arv från PPM) Alla ska ersättas med ett nytt sammanhållet datalager: PEnsionsmyndigheterns DAtaLager - Pedal 4-5 år för att ersätta pensionsdelen av Store med Pedal Filer med historiska data började levereras i augusti 2013 Troligen slutar Pensionsmyndigheten använda Store 2016-01-01 2015-03-26 12 Utvecklingsplaner (i urval) för Pedal 1. Använd den befintliga datafångsten från källsystemen på Försäkringskassan. Styr om filerna som idag går till Store så att de i stället går till Pedal. 2. Ersätt alla viktiga produkter från Store (statistikrapporter mm) med motsvarande produkter via Pedal. Måltidpunkter 1/7 2015 och 1/9 2015. 3. Vidareutveckla statistiken och analysdatabaser 4. Datafångst från andra myndigheter för statistikändamål (t.ex. sjuk- och aktivitetsersättning, egenlivräntor) 5. Utöka datafångsten från pensionsmyndighetens källsystem (t.ex. levnadsintyg) 2015-03-26 13 Organisation, utvecklingsmetodik och arkitektur 2015-03-26 14 Organisation och utvecklingsmetodik • Agila metoder. Tonvikt på informella metoder för att styra och bedriva arbetet. Desto större fokus på god dokumentation av slutprodukter • Alla nödvändiga kompetenser samlade i en organisatorisk enhet (processorienterad snarare än funktionsorienterad organisation). ”Business Intelligence Competence Center” • 2 breda yrkesroller: – Dataanalytiker: kravanalys, dokumentation – Utvecklare: utveckling och förvaltning av produktionskod, drift av datalagret 2015-03-26 15 Utgångspunkter för arkitektur och organisation 1. Komplexa och innehållsrika administrativa data - skapar både möjligheter och utmaningar 2. Råa administrativa data svåra att använda. Data kräver omfattande förädling för att bli relevanta och användbara för statistik och analysändamål 3. Att skapa lättanvända och relevanta förädlade data kräver detaljkunskaper om pensionssystemets regelverk, arbetsrutiner i ärendehandläggningen, egenheter hos ITsystemen mm 4. Det är tidskrävande att bygga upp dessa kunskaper och analysera källdatat för att avgöra hur det ska förädlas 5. Förändringar i datafångsten från källsystemen kan bara göras fyra gånger per år 2015-03-26 16 • Pedal består av flera databaser med olika syften • Lagring av data med olika förädlingsgrad • Stöd för inkrementell utveckling: vi ska kunna leverera det viktigaste först • Stöd för flexibilitet Obearb Källsystem Filer Grund Analyser Ad hoc-statistik Dim Statistikunderlag Statistikrapporter 2015-03-26 17 Våra verktyg • • • • • • SAS Data Integration Studio (ETL-verktyg) Microsoft SQL Server (datalagring, databearbetningar) Microsofts rapporteringsverktyg R (databearbetningar, statistiska analyser, visualisering) SAS Base (databearbetningar) Shiny (R-paket) och javascript (statistikpresentation på externwebben) • Git/Stash/Jira/Confluence (pattform för samarbete, versionshantering av kod och ärendehantering) 2015-03-26 18