Combineren van data is best tricky. Het gaat niet alleen om technische integratie, maar ook over de betekenis van de data.
Er is veel data. Binnen organisaties, maar ook daarbuiten (open data). De komende jaren komt er nog veel meer data beschikbaar. Met al die data zijn prachtige innovaties mogelijk (denk bijvoorbeeld aan Google Maps), maar in veel gevallen zijn die lastig te realiseren. Recent onderzoek van Gartner (Big Data and Analytics Strategy Essentials – Doug Laney) laat zien dat in de praktijk de variëteit van data de grootste uitdaging is, oftewel het combineren van verschillende datasets. Variëteit is daarmee een grotere uitdaging dan het volumeaspect van big data.
Dat combineren van data is best tricky. Het gaat niet alleen om technische integratie, maar ook over de betekenis van de data. Kleine interpretatiefouten in het combineren van data kunnen al snel tot desastreuze gevolgen leiden. Bekende voorbeelden zijn de crash van NASA Mars Climate Orbiter (schade ‘slechts’ 327 miljoen dollar), of het bombarderen van de verkeerde doelen in Irak, door een interpretatiefout rond coördinaten. Dataproblemen kunnen ook leiden tot bijvoorbeeld het niet of onterecht toekennen van toeslagen door de Belastingdienst; een probleem waarvan de gevolgen groot en schrijnend kunnen zijn, maar waarvan we eigenlijk de omvang niet weten.
Platform Linked Data Nederland
De overheid, vooral gemeenten, beschikken over grote bergen data (wetten, plannen, kaarten, historische data, afvaldata, infrastructuur, evenementendata, et cetera), maar u wilt waarschijnlijk niet dat anderen (burgers, bedrijven) door interpretatiefouten dat soort blunders maken. Dat is precies het belang van het ’toevoegen van semantiek’ bij het publiceren van data, oftewel het toevoegen van gegevens over de betekenis, de context, en de totstandkoming van de data.
Ik hoor u denken: hoe doe ik dat, en hoe complex is het? Het vergt inderdaad wat denkwerk. Zo moet er een goed datamodel worden gemaakt. Gelukkig is er een set van ‘Linked Data Standaarden’ voorhanden en sinds deze zomer is er ook een community in Nederland waar veel kennis beschikbaar is: Platform Linked Data Nederland. In die community werken overheidsinstanties, kennisinstellingen en bedrijfsleven aan het delen van kennis over het maken en gebruiken van de zogenaamde ‘Linked Data’. Zie bijvoorbeeld de gemeente Nijmegen. Zij zijn aan de slag gegaan met hun monumentendata, voor onder meer de ontwikkeling van een monumentenapp.
Uiteindelijk snijdt het mes aan drie kanten: gemeenten kunnen hun data beter en tegen lagere kosten beschikbaar stellen. De ontwikkelaars/toepassers kunnen betere data gebaseerde toepassingen maken. De eindgebruikers krijgen betere toepassingen en dienstverlening. Wat willen we nog meer…?
Over de auteur: Erwin Folmer is projectleider van het Platform Linked Data Nederland en is werkzaam voor Geonovum, TNO en Universiteit Twente.
Geef een reactie