RISE DATA SCIENCE Framtiden är datadriven. Vi har en del att göra! EN NATIONELL KRAFTSAMLING När våra maskiner blir tillräckligt intelligenta för att göra saker för oss så som vi önskar, utan att vi behöver programmera varenda liten detalj, kommer vår värld att expandera med ett jättekliv, på samma sätt som Internet gjorde för kommunikation. DATADRIVEN INNOVATION RISE Data Science AFFÄRSDRIVEN FORSKNING NYA TEKNOLOGIER Sverige satsar på avancerad digitalisering och datadriven innovation Sverige har länge legat långt framme när det gäller digitalisering genom tillgången på datorer, bredband och relevanta data. Men i den nya eran av datadriven innovation går det inte längre att leva på gammal kunskap och infrastruktur. Det måste till visioner och resurser för att utveckla teknologi och metoder att sätta de lärande maskinerna i arbete. Målet är att snabbt ge näringslivet och samhället tillgång till de kunskaper och insikter som ligger dolda i stora datamängder. Det gäller att stärka Sveriges konkurrenskraft med artificiell intelligens – från åkern och pappersbruket till Skatteverket och framtidens tjänsteleverantörer. BRANSCHKUNSKAP RISE Data Science bedriver avancerad forskning inom skalbara plattformar, maskininlärning och artificiell intelligens. Med utgångspunkt från forskningsmiljön SICS Learning Machines i Kista skapar vi framtidens teknologier och tillämpningar som utvinner värde ur stora datamängder. Vi samarbetar med ledande partners inom akademi och näringsliv. Vårt viktigaste uppdrag är innovation som drivs ur data. Datadriven innovation har en oöverträffad potential att förändra i princip 2 RISE DATA SCIENCE allting – hur vi lever, hur vi arbetar och hur vi tänker. Data är en resurs som finns tillgänglig, som ligger och väntar på oss, och som vi kan börja bearbeta för att göra användbar. Den kommer att kunna användas på alla tänkbara sätt, kombineras med andra data och ge helt nya insikter. De som kan använda den bäst kommer att få ett försprång. Forskningsarbetet som bedrivs inom RISE Data Science ger ytterligare verktyg för avancerad digitalisering av det svenska näringslivet och stödjer företags och myndigheters arbete med datadriven innovation. Den starka position och den mångfald i projekt och samarbeten som vi har idag kommer att leda till nya innovationer och nya lösningar. Dessa bygger på kunskap om vår verklighet baserad på stora datamängder, och effektivitet och nya tjänster sprungna ur avancerad automation. Tillämpningarna som området möjliggör kommer att få enormt värde för alla. Sverker Janson, initiativledare, RISE Data Science Daniel Gillblad, forskningsledare, RISE Data Science 3 Datadriven innovation vänder ut och in på verksamheten Idag befinner vi oss i början av ett globalt paradigmskifte för hur information och data genereras och hanteras, ett skifte som pekar mot nya smarta tjänster och en helt ny nivå av intelligent automatisering av näringsliv och samhälle och hur vi lever. Världens teknikföretag lägger enorma resurser på att ta ledningen i denna utveckling. I kärnan av denna teknikvåg finns data science. Digitaliseringen har redan gjort hela världen till data, en djup källa till kunskap som kan användas för att uppgradera hela näringslivet. Det innebär inte bara nya sätt att göra det gamla vanliga utan även helt nya sätt att göra helt andra saker. Avancerade algoritmer kan tränas med massiva datamängder till extrema förmågor. Lärande maskiner och AI ersätter tidigare lösningar i område efter område och skapar helt nya möjligheter för tjänster, produkter och system, som självkörande fordon, självhanterande 5G-nätverk, smarta fabriker och mycket annat. Lösningar som var science fiction igår är inom räckhåll för innovativ verksamhetsutveckling idag. Och det går snabbt. För forskningen inom data science har det stora genombrottet drivits av dramatiskt ökad tillgång på data och beräkningskraft och av nya algoritmer för maskininlärning. Där problemen blir för komplexa och parametrar och möjliga värden för omfattande för att programmeras, kan maskiner ofta på egen hand lösa problemen genom att studera och lära sig av massiva datamängder. Brädspelet Go ansågs länge vara för komplext och kreativt för maskiner, till skillnad från schack där schackdatorn Deep Blue redan 1997 besegrade mästaren Garry Kasparov. Våren 2016 besegrades Go-mästaren Lee Se-dol av AI-programmet AlphaGo. Det hade först tränats på miljontals positioner från mänskliga partier och sedan finslipats på långt fler partier där programmet spelat mot sig själv. För de företag som kommit längst är data deras viktigaste resurs och intelligenta dataprogram arbetar med den dygnet runt. Spotify arbetar med musik men deras arbetssätt fungerar på tjänster av helt andra slag. Algoritmerna som övervakar och styr musiktjänsten, och som hanterar rekommendationer och topplistor, är snart lika viktiga för affären som innehållet. Google är redan mer än ett sökföretag, det är ett AIföretag som levererar tjänster baserade på maskininlärning och artificiell intelligens. Globala IT-företag satsar idag enorma belopp på att ta ledningen och dammsuger marknaden i jakten på expertis. Även De tillämpningar som data science möjliggör är av enormt värde, transformerar affärer och flyttar företag uppåt i sina värdekedjor. Ledande svenska företag ser stora möjligheter med området och uttrycker ett intensivt intresse för utvecklingen. VOLVO CARS ERICSSON RESEARCH SPOTIFY SCANIA – Vi håller redan koll på allt i fordonet. Vi är nu angelägna om att höra berättelserna om verkligheten som är gömda i den insamlade datan. – Ericssson arbetar aktivt med både forskning och utveckling inom data science. Maskinintelligens är ett mycket viktigt område där vi behöver arbeta med de bästa akademiska partners som finns i området. – Vi samarbetar med forskare på SICS och använder Spotify’s petabytes av anonymiserad data för att testa nya algoritmer och dela kunskap. Att vara “data first” är ett centralt begrepp för Spotify. Data science vägleder utveckling och affärsbeslut och låter oss bygga smarta funktioner som rekommendationer. Det handlar om att förstå användarupplevelsen och att använda data på ett intelligent sätt för att bygga världens bästa musiktjänst. – Med SICS som partner, och Learning Machines som center, får vi på Scania tillgång till state-of-the-art kompetens och metoder inom Data Science, vilket vi tillsammans med andra världsledande svenska företag kan omsätta till praktiskt tillämpning. Genom att kombinera Sveriges långa industriella tradition med modern Data Science är vi övertygade om att vi kan konkurrera på den globala marknaden. Per Werthén, Senior Project Manager, Volvo Cars Sara Mazur, Vice President, Head of Ericsson Research Anders Arpteg, PhD, Head of Analytics Research Stockholm 4 andra ledande företag satsar stort och deras affärer transformeras av datadrivna metoder. Mediebolagen använder data science och AI för att anpassa såväl bildoch ljudkvalitet som innehåll efter tittarnas beteenden. Bolag som Netflix analyserar tittarmönster för att producera nytt innehåll som tittarna gillar, t ex serien House of Cards. Detaljhandeln analyserar köpbeteenden online men också rörelse- och köpmönster i fysiska butiker. Dessa kopplas sedan till logistik, marknadsföring och inköp. Transportindustrin utvecklar också sitt erbjudande. Ett företag som Scania ska kanske inte leverera lastbilar utan tjänster i ett globalt intelligent transportsystem. RISE DATA SCIENCE Staffan Persson, Manager Software and Services Development, Scania 5 Varje minut på internet läggs det upp och skickas: Visste du att..? 216 000 instagrambilder 277 000 tweets 204 000 000 mail 72h YouTube video Apple använder maskininlärning för att förbättra Siri. Tio startups inom maskininlärning och data science har valts ut till årets acceleratorverksamhet hos Microsoft. 2,5 I juni 2016 köpte Twitter sin tredje AI-startup på lika många år, Magic Pony. I teamet ingår 11 doktorer med expertis inom bildsensorer, maskininlärning, avancerad dataanalys och hjärnprocesser. KVINTILJONER Vad är data science? Data science handlar om hur vi använder matematik, algoritmer och kraftfulla datorer för att behandla, analysera och utvinna nya kunskaper och smarta funktioner ur mycket stora datamängder. Historiskt är detta statistikens roll, men med digitaliseringen har området vuxit samman med maskininlärning och artificiell intelligens och till vår hjälp har vi fått ofattbart stor lagringskapacitet och extremt snabba datorer. I takt med den växande mängden data blir data science allt viktigare för att ge oss redskap och nya möjligheter att samla in, bearbeta och skapa värde ur data. När datan ger oss möjlighet att se helt nya mönster i hur saker fungerar kan det ge upphov till värdefulla innovationer. Arbetar du på hög nivå inom data science behöver du kunskaper i statistik och databaser, skalbara beräkningsplattformar, matematik och algoritmutveckling, maskininlärning och artificiell intelligens. Du måste ha insikt i hur data genereras och samlas in, och hur man jämför äpplen och päron, Edvard Munchs penseldrag och hur trafiken påverkas när Beyoncé är i Stockholm. För att skapa nytta behövs också förståelse för affärsmodeller och innovation. 6 RISE DATA SCIENCE Varje dag skapar vi 2,500,000,000,000,000,000 (2,5 kvintiljoner) bytes vilket motsvarar 10 miljoner blueray skivor. Det motsvarar höjden av fyra Eiffeltorn staplade ovanpå varandra. Internet of Things växer snabbare än smartphones. Mobiloperatörerna i USA adderade fler bilar än telefoner till sina nätverk under Q2 2016. Washington Post använde en automatisk storytellingbot (@wpolympicsbot) för att snabbt publicera resultat från OS i Rio 2016. Global Pulse har utvecklats av FN för att analysera innehållet i stora mängder statusuppdateringar i sociala nätverk för att bland annat förutse förändringar i arbetsmarknaden och utbrott av sjukdomar runt om i världen. 4X Mängden lagrad data växer fyra gånger snabbare än världsekonomin. 0 Shack vs Go Ett spels komplexitet kan uttryckas som det totala antal spel som är möjliga (spelträd): Schack: 10123 - Go: 10360 AlphaGo använde ca 1200 CPU:er och 175 GPU:er i matcherna mot Lee Se-dol. Tänk dig att upptäcka att lärarassistenten på kursen egentligen är en robot. De flesta studenter på Georgia Institute of Technology märkte aldrig att “Jill Watson” inte var människa. 1 1 0 1 “Data first” är ett centralt begrepp för Spotify. Det styr inte bara byggandet av nya tjänster utan vägleder utvecklingen och affärsbeslut i företaget. 7 STATISTIK MASKININLÄRNING RISE Data Science ALGORITMER RISE Data Science är ett nationellt initiativ för avancerad digitalisering av svensk industri och samhälle med datadrivna metoder. Initiativet leder hela RISE Research Institutes of Sweden i en kraftsamling kring forskning, utveckling, utbildning och information för att driva detta helt affärstransformerande område. Intiativet tar fram nästa generations data science-teknologier och tillämpningar i ett avancerat forskningsprogram med ledande företag, universitet och myndigheter. Målet är att dramatiskt öka takten för datadriven innovation och avancerad digital transformation över hela landet och placera Sverige i täten för detta globala paradigmskifte. RISE Data Science kombinerar den tekniska expertisen i en världsledande forsknings- och innovationsmiljö i data science vid SICS i Kista med kraften i RISE Research Institutes of Sweden breda och djupa områdesexpertis och industriella och geografiska täckning. Initiativet samlar 100 forskare från alla delar av RISE och spänner över alla branscher: process, produktion, telekom, stadsutveckling, fordon, hälsovård, life science, med mera. Tillsammans skapar de nya lösningar och innovationer och går i bräschen för att stärka Sveriges konkurrenskraft. Geografiskt befinner sig forskningsteamen på platser från Luleå i norr till Lund i söder. Initiativet har nära samarbete med universitet och högskolor över hela landet och har många internationella forskningssamarbeten. Bland partners finns ledande företag och myndigheter som Ericsson, Husqvarna, King, Saab, Scania, Skatteverket, Spotify med flera. 8 RISE DATA SCIENCE – Enda chansen att konkurrera är att skapa en plats och gemenskap där forskare kan träffas, prata om metoder och tillämpningar, för att hitta fram till vad som faktiskt måste lösas, vad är värt mest. Mycket händer vid kaffemaskinen. Daniel Gillblad, SICS Swedish ICT AI PLATTFORMAR – Genom vårt samarbete med näringslivet och vår branschkunskap har vi möjligheter att finna synergier. Kanske sitter musikindustrin på en lösning som skogsindustrin behöver? Ragne Emardson, SP Mätteknik – Med ett samarbete inom RISE kan vi komplettera varandra. Vi är få på Viktoria, men vi har bra domänkunskap om fordonsindustrin och har samlat data i åratal. På SICS finns en djup kunskap om dataanalys. Det ger goda möjligheter att hjälpa industrin. Cristofer Englund, Viktoria Swedish ICT 9 RISE Data Science nationell bredd med globala insikter Vi erbjuder expertis, kompetens, nätverk och innovativa sammanhang och miljöer. Forskningsmiljön Learning Machines vid SICS i Kista är navet i RISE Data Science, med över 30 forskare inom nästa generations data science-teknologier och tillämpningar. 18+ PLATSER I SVERIGE 14+ PARTNERLÄNDER 10 RISE DATA DATA SCIENCE SCIENCE 22+ UNIVERSITET & HÖGSKOLOR SICS ICE i Luleå är världens första öppna datacenter för experimentell forskning och innovation. Den fungerar som en test- och demoanläggning för att öka kompetensen inom big data och molnområdet. 11 Det här gör vi idag! Framtiden för fordonsindustrin finns i algoritmer – Urban informatik har stor potential att bidra med kunskap om sociologi, data science, informationsdesign och processer. Området kommer att bidra till att städer blir smartare, med hjälp av interaktiva kartor och stora datamängder om miljö. Fler dödsfall varje år kan kopplas till stress och buller än till trafiken. Arianit Kurti, Interactive Institute Swedish ICT 12 RISE DATA DATA SCIENCE SCIENCE Forskarna vid Viktoria Swedish ICT i Göteborg använder sig av maskininlärning för att förstå och planera trafik och städer. Data samlas in från hela världen och struktureras för att se vilka parametrar som påverkar trafikflödena samt hur dessa parametrar varierar med plats och tid. Bilarnas användning jämförs med alternativ som kollektivtrafik, cykel och gång. Dessa insikter kan ge stadsutvecklare och transportföretag kunskap om när och hur de kan utveckla olika mobilitetstjänster. Ett projekt som rör bilpooler finansieras av Energimyndigheten och drivs tillsammans med Chalmers. Målet är att genom avancerad dataanalys studera beteenden och förutsättningar för friflytande bilpooler, som till exempel Car2Go och Drive Now, där förare kan hämta upp en hyrbil på en plats och lämna den på annan, utan att i förväg behöva boka bilen en viss tid. Forskarna letar efter allmänna karaktäristiska tendenser som till exempel under vilka förutsättningar det är lönsamt med en friflytande bilpool och matchar detta med städer där det verkar fungera bra. – Exempelvis så ser vi att det verkar fungera bra med elbilar i en bilpool i Madrid. I många andra städer är det svårt att få lönsamhet med elbilar då det krävs en väl utbyggd laddningsinfrastruktur, säger Johan Wedlin, affärsutvecklare på Viktoria Swedish ICT. 13 Det här gör vi idag! Jämnare yta på kartong Realtidsmätning och analys av ytjämnhet på kartong under produktion, med data från ett stort antal mätpunkter och i hög hastighet. Smarta mjukvarusensorer för sulfatmassa Lösningar för datadriven automation Rätt träd till rätt träprodukt Analys av stora mängder processdata kring sodapannor för att skapa mjukvarusensorer som kan indikera funktion och underhållsbehov i en miljö där fysiska sensorer inte kan användas. Projektet skapar en verktygslåda för nästa generations automationslösningar som kombinerar automatiserad övervakning med datadriven diagnos, planering och optimering i befintliga system. Multivariata datadrivna metoder för att hitta relationer mellan området där trädet växer, stockarnas egenskaper och plankornas egenskaper och vilka produkter som timret passar bäst till. Förstå och planera komplexa miljöer Ett kartbaserat 3D-verktyg har utvecklats ur ett behov att visualisera datamängder om extrema klimatförändringar. Verktyget används av stadsplanerare i bland annat Göteborg, Uppsala och Stockholm. Djupare förståelse av brandutveckling Storskaliga simuleringar av bränder i stora byggnader, skogsbränder och liknande genererar enorma datamängder som ger fördjupade kunskaper genom dataanalys. Säkrare gruvdrift Bedömning av hälsostatus Ett klädesplagg med integrerade sensorer för insamling av rörelseoch fysiologiska data på personer drabbade av neurologiska sjukdomar som epilepsi, Parkinsons sjukdom och stroke. Genom avancerad signalbehandling beräknas personernas hälsostatus utifrån en stor mängd insamlad sensordata. 14 RISE DATA SCIENCE Intelligent riskbedömningssystem för säkrare gruvdrift. En vidareutveckling av verktyg och system för att identifiera fordonsrelaterade brandrisker i gruvmiljö. 15 Det här gör vi idag! Data i rörelse och data i vila Företag ställer allt större krav på att kunna analysera data i realtid. De alternativ som finns idag är separata för strömmande data och lagrade data. Det gör att det är tidskrävande och komplext att skapa sådana system. För att förenkla detta skapar EU-projektet Streamline en gemensam plattform, baserad på Apache Flink, för att analysera både strömmande data och lagrade data. framgångsrika metoden för en mängd olika problem som översättning, bildoch taligenkänning. Den centrala idén med Deep Learning är att modellen löser problem i flera steg, där varje steg bygger på kunskap från det föregående. Just detta att problemlösandet går i flera steg har gett metoden namnet ”Deep Learning”, och gör att modeller effektivt kan lösa väldigt svåra problem genom att känna igen sammansatta mönster. Dataanalys för ett smartare samhälle Tillsammans med högskolorna i Halmstad och Skövde bygger vi framtidens teknologier för analys och maskininlärning av de massiva datamängder som ett samhälle genererar. Framtidens kommunikationsteknologi Genom smarta lösningar och avancerad maskininlärning möjliggör vi robust drift av nästa generations programmerbara telekomnätverk med tuffa krav på tillgänglighet, kapacitet och energieffektivitet. Smartare datacenter Nästa generations intelligenta automatiseringssystem för datacenter. Maskininlärning används för att upptäcka avvikelser och förutsäga framtida hanteringsproblem. 16 RISE DATA SCIENCE Intelligenta maskiner med Deep Learning – Framtidens maskiner kommer att programmeras genom att vi undervisar dem, säger Erik Ylipää, som forskar på maskininlärning på SICS Swedish ICT. Det vanligaste sättet att lösa problem med datorer är genom att formulera otvetydiga regler i ett programspråk som talar om för datorn exakt hur lösningen skall utföras. Men för mycket av det vi vill att en maskin skall kunna göra, som att känna igen saker i bilder eller översätta tal till text vet vi inte hur vi skall kunna beskriva med exakta regler. Människor är bättre på sådan problemlösning eftersom vi är bra på att känna igen mönster, men vi klarar inte att överblicka hur stora datamängder som helst. Maskininlärning är ett sätt att lösa problem utan att bestämma exakta regler. Det handlar istället om att bygga flexibla modeller som lär sig lösa problem genom att titta på exempel. Deep Learning är en viss typ av maskininlärning som under de senaste åren har blivit den mest Metoden har blivit alltmer framgångsrik på grund av tillgången på stora mängder data. En annan nyckelfaktor är datorkraften hos moderna grafikkort. Dessa utvecklades ursprungligen för att accelerera 3D-spel men har visat sig fungera mycket bra för den typ av parallella beräkningar som används vid Deep Learning. En stor del av aktuell forskning inom Deep Learning undersöker allt mer komplexa, djupare modeller för att ta sig an allt svårare uppgifter som att lära sig beskriva bilder med språk, att lära sig tala, känna igen tonen i text eller förstå en trafiksituation. En viktig tillämpning är som en komponent i kritikerledd inlärning där en maskin på egen hand lär sig lösa problem med hjälp av belöningar. Andra vetenskapsområden såsom fysik, biologi och medicin har också börjat använda Deep Learning för att urskilja mönster och avvikelser. På SICS Learning Machines är målet att bygga lärande maskiner som kan resonera kring problemen de är utformade för att lösa och interagera med sin omgivning för att lära sig mer. – Vi är övertygade om att Deep Learning i kombination med statistiska modeller kommer att vara en viktig del av framtidens intelligenta maskiner, säger Erik Ylipää. 17 Det här gör vi idag! Säkrare livsmedel genom sekvensering av bakteriernas arvsmassa – Genom att samla in och analysera stora mängder data från vår verklighet kan vi spegla tillbaka den till oss på ett nytt sätt och dra nya slutsatser. Åsa Rudström, RISE Data Science Center Charlotta Löfström är forskare på SP Sveriges Tekniska Forskningsinstitut. Hon arbetar med livsmedelssäkerhet och utvecklar nya och bättre analysmetoder för bakterier i livsmedel och hygienprodukter. Ett mål med forskningen är att hjälpa företagen förstå och använda de nya mikrobiologiska analysteknikerna som bygger på sekvensering av mikroorganismernas arvmassa. Med hjälp av den nya tekniken kan de till exempel se om det är samma bakterie som orsakat sjukdom som finns i ett visst livsmedel. Här kan SP fungera som en brygga mellan myndigheter och företag. Forskningen är välbehövlig för att föra samman dessa två världar. – Det sker idag ett skifte i hur man analyserar data. Vi ser att myndigheter har kapacitet att använda sekvenseringsteknik för att analysera dessa nya mängder data, något som företagen ofta saknar. Som forskningsinstitut kan vi få tillgång till data. Vi kan exempelvis analysera stora datamängder i en produktionsanläggning och därmed hjälpa företag hitta och åtgärda problemet med farliga bakterier, säger Charlotta Löfström. 18 RISE DATA SCIENCE 19 – RISE Data Science omfattar avancerade teknik- och metodområden inom dataforskning och ska erbjuda såväl kompetensutveckling som värdeskapande IKT-tillämpningar för alla näringsgrenar. Vårt uppdrag är att stödja utvecklingen av svensk industri och samhälle med forskning och utveckling inom datadrivna metoder och lösningar. Här finns både djup och bred expertis, infrastruktur och förutsättningar för avancerad dataforskning. Pia Sandvik, vd RISE Leif Ljungqvist, divisionschef RISE ICT (Ny teknik nr 36, 7 sept 2016) 20 RISE DATA SCIENCE 21 RISE Data Science Kontakta oss! – Sverige har goda förutsättningar att vara världsbäst på digitalisering. Vi är redan en IT-nation och vårt näringsliv har alltid varit bra på att samarbeta. – Många företag genererar stora mängder data. Det första steget för att skapa värde är att använda all den här datan för att kunna fatta bättre beslut. Andra steget är att skapa helt nya tjänster baserade på data. Sista och kanske viktigaste steget är att använda data för automation. Den stora vinsten kommer ofta från intelligenta, lärande system som sköter komplexa system helt själva. Åsa Rudström koordinator, [email protected] Daniel Gillblad forskningsledare, [email protected] – Potentialen och möjligheterna med intelligenta system är svindlande. Vi vill hjälpa industrin att spänna bågen på olika områden. Det handlar om att nå disruptiv digitalisering, ett paradigmskifte i ordets rätta bemärkelse, då företagen går igenom varje hörn av sin verksamhet och frågar sig: Vad kan automatiseras? Vilka nya tjänster kan vi erbjuda? Sverker Janson initiativledare, [email protected] 22 RISE DATA SCIENCE 23 Nu händer det! RISE DATA SCIENCE Kontakt: Åsa Rudström koordinator, [email protected]