Sveriges forum för it-proffs 5 största farorna med big data – och så undviker du dem E xclusiv e 2 Guide Mikael Söderlind TE CHWORLD mars 2015 It-skribent på heltid sedan 2000, först anställd på Mikrodatorn och IT Pro, men sedan 2006 på frilansbasis. Hans fokus ligger på nyhetsbevakning av bland annat nätverk, lagring, Windows och server. [email protected] Analyser av big data har sina givna fördelar men det finns också stora risker. Så här skyddar du dig och dina anställda. I nsamlandet och hanteringen av big data har verkligen sina fördelar i det verkliga livet: annonser som visar sådant du faktiskt är intresserad av att köpa, bilar med förmågan att ringa 112 om du hamnar i en olycka, bärbara enheter eller implantat som övervakar din hälsa och meddelar en läkare om dina värden ser märkliga ut – det är bara några exempel. Ett problem är att du får offra en stor del av din personliga integritet. Det är ganska självklart med tanke på att du genererar mängder med data under en normal dag. Olika typer av system registrerar var du går, vem du kommunicerar med, vad du läser och skriver, vad du köper, vad du äter, vad du tittar på, hur mycket du tränar, hur du sover och så vidare. Informationen kan missbrukas på sätt som man inte hade en tanke på för en generation sedan. I händerna på marknadsförare, finansiella institut, arbetsgivare och myndigheter finns risken för att sådan detaljerad information påverkar allt från förhållanden till möjligheterna att få ett jobb, ta ett lån eller till och med resa med flyg. Trots att både myndigheter och experter på personlig integritet hela tiden varnar för riskerna har det inte gjorts särskilt mycket för att uppdatera integritetsskyddet på nätet. 3 Guide TE CHWORLD mars 2015 5 faror med big data De två amerikanska organisationer Consumer Federation America (CFA) och Electronic Privacy Information Center (EPIC) har tillsammans med experten Rebecca Herold, vd på Privacy Professor, har listat flera allvarliga risker med analyser av big data. De ser det i första hand ur ett amerikanskt perspektiv, men problematiken gäller till stor del även i andra länder. Rebecca Herold 1. Diskriminering I ett uttalande skriver EPIC att ”prediktiva analyser nu kan användas av myndigheter och företag för att avgöra om vi ska få flyga, få jobb, hantera känsliga uppgifter eller kreditkort. Användningen av insamlade data från fler håll för att ta beslut kan ha en direkt negativ påverkan på individers frihet”. Rebecca Herold skriver också i en artikel på SecureWorld att diskriminering visserligen har varit olagligt under ett flertal årtionden, men att analyser av big data automatiserar processen och därför gör det svårare att upptäcka och bevisa. Hon påpekar även att den amerikanska diskrimineringslagen är otydlig, snäv och beroende av mycket specifikt bevismaterial. 2. 3. 4. 5. Pinsamma dataläckage Säg hej då till anonymiteten Undantag för myndigheter Dina data säljs vidare Under de senaste åren har det uppstått ett flertal omskrivna dataläckage hos myndigheter, universitet, e-handelsplattformar och mediahus runt om i världen. Nyligen hackades också Sony, något som resulterade i att opublicerade filmer och privat information om tusentals anställda läckte ut. Aldrig någonsin tidigare har det skrivits så mycket om identitetsstölder och kontokortsbedrägerier. Rebecca Herold menar att om det inte finns några regler för anonymiserade datafiler så är det möjligt att individer kan identifieras när olika datauppsättningar kombineras med varandra. Det kan till exempel vara nödvändigt att radera vissa data innan datauppsättningar slås ihop, och det görs långt ifrån alltid. EPIC hävdar att amerikanerna aldrig någonsin tidigare har varit registrerade i så många databaser. FBI är ett bra exempel. De registrerar bland annat namn, smeknamn, ras, kön, födelsedata, personnummer, pass- och körkortsnummer, adress, telefonnummer, fotografier, fingeravtryck och finansiell information som till exempel bankkonton, anställningar och företagsinformation. Anmärkningsvärt nog har FBI undantagits från kraven i Privacy Act – den amerikanska lagen för att skydda den personliga integriteten – som kräver att informationen som sparas ska vara korrekt, relevant och komplett. Enligt EPIC finns det ett flertal företag som samlar in och säljer ”konsumentprofiler som inte är helt skyddade med dagens lagstiftning”. Det finns heller inga garantier för att informationen är korrekt. – Datafiler som används för dataanalys innehåller ofta felaktiga data om personer, använder datamodeller som är inkorrekta eftersom de relaterar till specifika personer, eller helt enkelt bristfälliga algoritmer, säger Rebecca Herold. 4 Guide TE CHWORLD mars 2015 7 tips – både för organisationer och privatpersoner Donna Wilson Vad kan man då göra för att undvika de värsta fallgroparna med big data, eller åtminstone minimera problemen? Joseph Jerome vid Future of Privacy Forum, Donna Wilson, advokat vid Manatt Phelps & Philips med inriktning på personlig integritet och datasäkerhetsrisker, och Rebecca Herold delar med sig av sina bästa tips. Joseph Jerome 3 De flesta tipsen vänder sig till privatpersoner – det beror på att omsorgen för personlig integritet måste börja i den änden. Men notera att arbetsgivare och it-avdelningen i många fall också har mycket att tjäna på att de anställda ser över sitt beteende ute på internet. Läs igenom sekretessregler och avtal för produkter och tjänster, särskilt för webbtjänster där du delar med dig av mycket information. Om alla verkligen gjorde det skulle problemen minska avsevärt. 1 Sluta dela så mycket på sociala medier. Vill du bara visa dina bilder för ett fåtal personer? Skicka dem i så fall direkt till de personerna i stället för att lägga ut dem för allmän beskådan. Utnyttja analyser av stora data för att påvisa problem. På många sätt kan big data hjälpa oss att ta bättre och mer rättvisa beslut. Big data kan fungera som ett kraftfullt verktyg för att bekämpa diskriminering – med statistik av stora datamängder går det att tydliggöra var diskriminering sker. 2 Använd inte big data i annat syfte än det var tänkt från början. Det finns flera exempel på företag som gjort detta, och många gånger har det resulterat i intrång i den personliga integriteten. Glöm inte att läsa igenom det finstilta när du registrerar dig för en ny tjänst. Där hittar du bland annat information om hur dina personliga uppgifter hanteras. 4 5 Guide TE CHWORLD mars 2015 5 Dela inte med dig av information till företag eller andra organisationer såvida det inte är helt nödvändigt för att du ska kunna göra affärer med dem. Tänk efter om de verkligen behöver din adress och ditt telefonnummer. 6 Använd en anonymiseringstjänst som exempelvis Hotspot Shield eller en anpassad webbläsare såsom Tor när du besöker sajter som skulle kunna dela med sig av information som gör att folk drar felaktiga slutsatser om dig. Tänk ett varv extra när du skaffar en tjänst. Är det verkligen nödvändigt att ange till exempel telefonnummer? 7 Be dina vänner och bekanta att låta bli att dela information om dig på nätet utan att vet något. Det kan kännas konstigt men är helt nödvändigt. n Hotspot Shield är ett exempel på en tjänst som gör dig anonym på nätet. Det finns gott om snarlika varianter. Mer om big data tinytw.se/hadooptar ”Hadoop tar över” – TechWorlds expert Jan Hedström förklarar storheten i det mest populära big data-verktyget just nu. tinytw.se/hadoopguide ”Kom igång med Hadoop” – Lär dig grunderna med övningsexempel. tinytw.se/netflixapor Netflix stresstestar sina big data med en armé av apor. Dessutom: TechWorld 03-2015 har stort big data-tema. Inte missa! Sveriges forum för it-proffs www.techworld.se Ta chansen och vinn! Vinn Raspberry Pi 2 Model B Nu har du och två andra chansen att vinna nya Raspberry Pi 2 Model B (värde 350 kr) Tävlingen pågår t.o.m. den 30 april 2015 Surfa in och tävla på: tinytw.se/raspberry Tävlingen är gratis. Eventuell vinstskatt betalas av vinnaren. Vinnarna presenteras via e-post och utses av en jury bestående av TechWorlds redaktion. Anställda och medarbetare på IDG AB får ej deltaga i tävlingen.