Inzoomen op: IoT
logo

Inzoomen op: IoT

Module 1 Module 2 Module 3 Module 4 Module 5 Module 6

Gestructureerde versus ongestructureerde data



Voor we nadenken over hoe we data gaan analyseren, maken we eerst een onderscheid tussen twee types data.

Gestructureerde data:


  • is doorgaans alfanumerische data;
  • is gemakkelijk te categoriseren;
  • leent zich voor weergave in een model;
  • is gemakkelijk op te slaan in een database;
  • is vlot te doorzoeken.

Ongestructureerde data:


  • bestaat uit data die in allerlei vormen kunnen voorkomen;
  • is moeilijk te categoriseren;
  • heeft extra bewerkingen nodig om de nuttige informatie te extraheren.

Geschat wordt dat 80% van de gegenereerde data ongestructureerde data is. Daartoe behoren satellietbeelden, dronebeelden, beveiligingscamera’s, stemopnames, telefoongesprekken, socialmediacomments... Om al deze data op te slaan zijn grote datacenters nodig, je kan er zelf één bezitten of je kan in de cloud opslaan. Ongeacht je keuze, is het belangrijk dat je goed nadenkt over wat het nut is van de data waarin je geïnteresseerd bent.

Voor we nadenken over hoe we de data gaan analyseren, willen we eerst een onderscheid maken tussen de types data.

  Opdracht 1

Kan jij de data volgens type indelen?

 
 

Wanneer we data verzamelen moeten we ons altijd de vraag stellen wat we er van willen leren.
We meten bijvoorbeeld het waterpeil om te kunnen anticiperen op overstroming.
We laten drones boven de haven circuleren en filmen om abnormaliteiten zoals olievlekken of brand op te sporen, zodat ze ons kunnen verwittigen wanneer en waar we moeten ingrijpen.

Data leiden tot beslissingen, acties. Het is dan ook belangrijk om de informatie die je nodig hebt uit de data te halen.

Vaak kan een keuze gemaakt worden om niet alle data naar de cloud te sturen. Dan worden bepaalde verwerkingen of berekeningen in de edge uitgevoerd en enkel de relevante data worden doorgestuurd en opgeslaan in de cloud. Dit bespaart geld en tijd.