CNS introduceert het CNS Data Lake

Het CNS Data Lake is een aanvulling op Business Insight Online, waarmee zowel de brondata als de bewerkte data uit het datawarehouse beschikbaar komen voor gebruik buiten Business Insight.

Wat is een data lake?

Een data lake vangt grote hoeveelheden gestructureerde en ongestructureerde data op en stelt deze ter beschikking. Behalve het toevoegen van metadata, wordt de inkomende data in principe niet bewerkt. Samen met technieken voor snelle en goedkope opslag van data, maakt dat een data lake tot een hele efficiënte technologie voor het verzamelen van grote hoeveelheden data vanuit verschillende bronnen.

Data lake versus datawarehouse

Het is belangrijk om het verschil tussen een datawarehouse en een data lake goed voor ogen te houden.  Een datawarehouse bevat de data die nodig is voor rapportage en analyse. De data wordt gecontroleerd, geïntegreerd, bewerkt, aangevuld en gemodelleerd zodat deze eenduidig is, goed van kwaliteit en gemakkelijk toegankelijk voor een grote groep medewerkers. Het data lake bevat alleen de data en niet de bewerkingen zoals in een datawarehouse. Dit biedt veel flexibiliteit voor het gebruik van data, maar het vergt wel veel meer tijd, kennis en kunde om van die data informatie te maken. James Dixon van Pentaho, die de term data lake heeft geïntroduceerd in zijn blog vergelijkt het datawarehouse met een winkel voor flesjes water. Het water is schoon, verpakt, georganiseerd en direct klaar om te drinken. Het data lake is te vergelijken met de grote hoeveelheid water in een meer. Je zou het kunnen drinken, maar voordat je dat veilig kunt doen, moet je nog wel een flink aantal (dure) stappen doorlopen. Daar staat tegenover dat je het water in het meer op veel meer manieren kunt gebruiken, bijvoorbeeld om in te zwemmen, te vissen of voor irrigatie.

Het datawarehouse en het data lake zijn aanvullende concepten. De keuze voor een van de twee hangt heel erg af van de toepassing die voor ogen staat.

CNS Data Lake

In het CNS Data Lake plaatsen wij alle brondata en alle bewerkte data die in Business Insight wordt gebruikt. Hierdoor komt deze data beschikbaar voor verdere verwerking en gebruik buiten het standaard product Business Insight. We gebruiken hiervoor het Microsoft Azure Data Lake. Klanten kunnen het CNS Data Lake op zichzelf gebruiken om aanvullingen te maken op Business Insight, al dan niet met data uit extra databronnen. Ook kunnen zij het CNS Data Lake gebruiken om informatie uit te wisselen met andere applicaties, bijvoorbeeld voor klanttevredenheidsonderzoek. Uiteraard kan de data ook worden gebruikt voor innovatieve projecten met behulp van data science technologieën. Kortom, het staat de klant van CNS Business Insight Online vrij om deze data naar eigen inzicht in te zetten.

Heb ik het CNS Data Lake altijd nodig?

Wanneer een corporatie voldoende heeft aan de informatie en functionaliteit binnen Business Insight, dan is het CNS Data Lake niet nodig. Binnen Business Insight kunnen corporaties rapporten maken en aanpassen, zolang deze gebruikmaken van de data en modellen die in Business Insight aanwezig zijn. Bij klantspecifieke uitbreiding van deze modellen (maatwerk) of als de data binnen Business Insight Online nodig is voor andere doeleinden, biedt het CNS Data Lake uitkomst. Een andere belangrijke reden om te kiezen voor het CNS Data Lake is de beschikbaarheid van data uit bronsystemen (en met name het ERP) wanneer deze zijn gemigreerd naar de cloud. Met het CNS Data Lake zorgen we ervoor dat de ruwe brondata altijd beschikbaar is.

Wat kost het CNS Data Lake?

CNS heeft gekozen voor het Micrsoft Azure Data Lake om de bovenstaande functionaliteit te realiseren, mede om de lage kosten. CNS kan daarom het Data Lake aanbieden als onderdeel van Business Insight Online, zonder extra licentiekosten. We plaatsen het data lake in de Microsoft Tenant van de klant. Het gebrúik van het data lake kan wel extra kosten opleveren, maar deze zijn zeer gering. Denk aan enkele euro’s per maand tot enkele tientallen euro’s per maand bij zeer zwaar gebruik.

Beschikbaarheid

Het CNS Data Lake komt in april 2021 beschikbaar voor alle Business Insight Online klanten van CNS.