Column: Maak van linked data serious business!

9 november 2017

Linked data en geo-informatie

Vanuit mijn achtergrond als informatiemodelleur kijk ik meestal van een afstand naar linked data-toepassingen voor de publicatie van geo-informatie. Ik ben eigenlijk meer van het publiceren van geo-informatie via services en GML-gestructureerde data. Allemaal proven technology, met een hoge implementatiegraad in zowel open als niet-open software. Dat is op zich al een krachtig argument om het te gebruiken. Het is ook technologie van mijn generatie. Maar mijn generatie is niet meer de nieuwe generatie van vandaag. Linked data en geo-informatie hebben zich gestaag ontwikkeld tot partners in een stabiele relatie en het wordt tijd om de gemaakte terreinwinst te gaan benutten. Ik voorzie dan ook een bredere toepassing van linked data in de geo-wereld.

Linked data complementair inzetten

Op de INSPIRE-conferentie in Straatsburg, eerder dit jaar, waren er voorbeelden van linked data-toepassingen boven op de INSPIRE-dataservices. Een experiment met een linked data-proxyserver boven op de WFS van de INSPIRE infrastructuur. Dit is een elegante oplossing om linked data complementair in te zetten naast of op een operationele data-infrastructuur. En waarom zou je dat dan doen? Om de typische eigenschappen van linked data, zoals vindbaarheid op het web en gebruiksvriendelijkheid voor eenvoudig gebruik, te combineren met typische eigenschappen van de zogenaamde service en object oriented aanpak, zoals gecontroleerde datakwaliteit en performance.

Laat Google helpen

De bottleneck van die service en object oriented aanpak is dat de data zelf niet vindbaar is. Je moet eerst naar een metadataserver en op basis daarvan een keuze maken tussen datasets. De gegevens die in de datasets staan - jouw huis, jouw straat, de plaatselijke monumentale kerk enzovoort - zie je pas als je via een WFS of WMS de data bekijkt. Die weg is vaak alleen toegankelijk voor specialisten en, nog belangrijker, niet vindbaar voor web-zoekmachines. Het web kent die objecten immers niet. En dat is jammer, want zo blijven we hangen in goede bedoelingen en worden de data zelf nooit mainstream: vindbaar, toegankelijk en herbruikbaar.

Daarom zou ik zeggen, maak gebruik van de combinatie met linked data en laat Google je helpen. Ik vind dat een mooie oplossing. En waarom doen we dit ook niet gelijk voor PDOK?

Van aanbodgerichte data naar vindbare data

Wat we nu als overheid doen is data aanbodgericht aanbieden. Met goede bedoelingen natuurlijk en afgestemd op werkprocessen waar die data een rol in spelen. Die werkprocessen hebben ook het aanbod bepaald, de vorm en inhoud, maar het zijn wel overheidswerkprocessen. En alleen het voorziene gebruik is meegenomen. Je kan immers geen oplossingen bedenken voor problemen die je niet kent. Toch is het ook een doel om de gegevens buiten het voorziene gebruik zo breed mogelijk inzetbaar te maken. Het aanbod creëert daarbij de vraag. Er is daarbij een rol en kans voor de private sector om vervolgens zogenaamde value added services aan te bieden op basis van de betrouwbare overheidsdata-infrastructuur. Maar hoe ver kom je daarin als zelfs Google je niet kan vinden?

Mij lijkt het vrij eenvoudig. Zorg dat je wél gevonden wordt. Dat je wel onderdeel van het web van data wordt. Wat er daarna gebeurt is moeilijk te sturen, maar dat hoeft ook niet. De business kan zijn eigen ding doen. En hoe mooi is het als overheidsdata de basis voor hergebruik en andere creatieve toepassingen gaat worden? Zo is het toch ook bedoeld? Natuurlijk gaat dit alleen op voor data die openbaar zijn en niet privacygevoelig etc. Dat is echter geen nieuw issue en geldt ook al voor de huidige data-infrastructuur.

Linked data-profiel op NEN 3610

Als beheerder van NEN 3610 Basismodel voor geo-informatie zie ik hier aanknopingspunten. We gaan de linked data en object oriented datastandaarden aan elkaar schakelen en complementair inzetten. Nu is GML nog de voorkeursimplementatie van NEN 3610. De codeerregels van een binnen NEN 3610 opgesteld UML is met standaard vertaalregels om te zetten naar GML-specificaties. Voor linked data of beter voor een toepassing van RDF zijn die regels er niet. Wel in experimentele projecten, maar nog niet geformaliseerd. De komende maanden gaan we daar wat aan doen in een NEN 3610 – linked data werkgroep. Met de ervaringen opgedaan in het Platform Linked Data Nederland gaan we een linked data-profiel maken op NEN 3610. Zo helpen we om van linked data serious business te maken. De ontwikkelingen hierin zijn te volgen op https://geonovum.github.io/NEN3610-Linkeddata/

Paul Janssen is informatiemodelleur en social architect bij Geonovum

 

Comments are closed.