Compliance of Data Lake Enterprise Architecture Model with the General Data Protection Regulation (GDPR)

University essay from Luleå/Department of Computer science, Electrical and Space engineering

Author: Vuk Kadenic; [2015]

Keywords: ;

Abstract: Syftet med denna avhandling är att avgöra om Data Lake Enterprise Arkitektur modell är förenlig med den kommande EU:s allmänna dataskydds förordning (General Data Protection Regulation - GDPR), samt att föreslå utformningen av eventuella förändringar som skulle förbättra modellens kompatibilitet med förordningen. Även om Capgemini-Pivotal:s Business Data Lake användes som referent Data Lake modell, resultaten av denna avhandling är tillämpliga på Data Lake arkitekturer i allmänhet. Det kan även argumenteras att andra lösningar för data hantering i en Big Data miljö kommer att ha nytta av den föreslagna designen för hantering av personlig data.
Under arbetets gång har nulägets arkitektur av Business Data Lake kartlagts på samtliga tre nivåer av Enterprise Arkitekturen, för att vidare fortsätta med utvecklingen av målarkitekturen och genomförandet av gapanalys som avslöjade klyftor (gaps) mellan två arkitekturslägen. Gapanalysen effektivt påvisade de problemen som nulägets arkitektur har med att uppnå förenlighet med GDPR och har lett till urvalet av en nyckel gap som överbryggdes genom den föreslagna utformningen av en särskild lagringsplats för personlig metadata. Själva designen är baserad på en grafdatabas som på ett revolutionärt sätt förbättrar prestanda av hanteringen av personlig data. Slutligen, den föreslagna lösningen demonstrerades genom en fungerande prototyp av en grafdatabas-baserat lagringsplats för personlig metadata.
Avhandlingen och dess resultat utvärderades av Capgemini Sverige som projektets beställare och har bedömds att till en stor del uppfyller och i vissa områden till och med överstiger de uppsatta målen för projektet. Andra, viktiga aspekter av Data Lake:s kompatibilitet med GDPR, som inte tas upp i avhandlingen, har också förklarats.
Det konstaterades i slutsatsen att avhandlingen har uppnått sitt syfte genom att fastställa att Data Lake arkitektursmodell, i dess nuvarande skick, avviker från GDPR. Dessutom, klyftor (gaps) som behöver överbryggas för att avvikelser skall upphöras har identifierats och lösningen till en nyckel gap föreslogs och gjordes en prototyp av. I slutsatsen vidare konstaterades att avhandlingen utgör en bra bas för fortsättningen av designarbetet, samt att ytterligare designprojekt är nödvändiga för att förenlighet av Data Lake Enterprise Arkitektur modell med GDPR skall kunna uppnås.

  CLICK HERE TO DOWNLOAD THE WHOLE ESSAY. (in PDF format)