Home -> Online artikelen -> Geodata Rijkswaterstaat door geo-scan

04-11-2009

Kwaliteit metadata inzichtelijk
Geodata Rijkswaterstaat door geo-scan


Door: Lambert-Jan Koops

Het Project Geoservices is er op gericht om binnen Rijkswater­staat (RWS) een framework op te bouwen op basis van open standaarden en open source software voor de opslag en distributie van geo-informatie binnen de organisatie.

De technische opbouw van het Geoservices-systeem is inmiddels grotendeels afgerond, nu moet het nog gevuld worden met data die kwalitatief van hoog niveau zijn. Dat betekent dat alle geo-gegevens binnen de verschillende RWS-afdelingen tegen het licht moeten worden gehouden.
Boy Haenen is vanuit de Data-ICT-Dienst van RWS (DID) projectleider van het Geoservices Project. Hij legt uit waarom dit project noodzakelijk is binnen RWS. “Rijks­wa­ter­staat is onderverdeeld in vijf landelijke diensten, tien regionale diensten met onderliggende districten en drie projectdirecties. Die gebruiken allemaal hun eigen geo-informatie. Dat wil zeggen: bepaalde brongegevens worden na aanvraag vanaf een centraal punt, de DID, verstrekt, maar elke dienst maakt vervolgens eigen bewerkingen met deze data. Deze worden vervolgens lokaal gebruikt, waar­door er uiteenlopende producten ontstaan op basis van enkele bronbestanden. Het is niet altijd even makkelijk om het overzicht te bewaren binnen deze organisatie, omdat er soms weer nieuwe versies van de bronbestanden bij een dienst worden ingehaald, zodat het voor kan komen dat er onbedoeld verschillende varianten van hetzelfde bestand ontstaan.”
Naast een toenemende behoefte aan overzicht speelt er ook nog een andere kwestie rondom de geo-informatie binnen RWS. Haenen: “In 2004 is op Europees niveau besloten om de norm voor metadata CEN98 te vervangen door ISO 19115. In 2006 is deze verandering overgenomen door RWS. Dat is een vrij lastige zaak, want metadata zijn toch wel het stiefkindje van de geo-wereld: iedereen weet wel dat ze nodig zijn en erbij horen, maar weinigen zorgen voor een goed beheer. Dit fenomeen is een landelijk beeld ondanks het vele werk dat een organisatie als Geonovum momenteel verzet op dit gebied. Een belangrijke reden daarvoor is dat men vaak (lokaal) wel weet met welke data men te maken heeft. Het wordt pas echt gemist als de data gedeeld worden met mensen die geen direct contact hebben met de leverancier van de data (bijvoorbeeld via internet). We hadden dan ook het vermoeden dat een groot deel van de geo-bestanden niet of niet volledig van metadata voorzien waren binnen onze organisatie. Dat is een probleem dat uiteraard ook aangepakt moet worden bij het implementeren van een nieuwe norm.”

Geonovum
In Nederland wordt de standaardisatie binnen de geo-informatie met name gereguleerd door Geonovum. Deze in 2007 opgerichte stichting, voortgekomen uit de RAVI, wordt financieel gesteund door de ministeries van VROM, LNV en V&W, het Kadaster en TNO en heeft als één van haar taken om kwalitatief goede en breed inzetbare standaarden te ontwikkelen en het gebruik daarvan te monitoren. In dit kader heeft Geonovum onder andere de werkgroep Metadata opgericht, die zich bezighoudt met de uitwisseling van kennis en ervaring over het beheer en de implementatie van de metadata-standaarden zoals ISO 19115. Daarnaast onderhoudt Geonovum ook contact met INSPIRE, de Europese organisatie voor metadata-standaarden.

Vragen
Om een goed overzicht te krijgen van de hoeveelheid geo-informatie binnen RWS en de kwaliteit van deze gegevens, moest er een onderzoek plaatsvinden. Daarbij ging het om voor de hand liggende vragen zoals: Hoeveel geodata zijn er aanwezig? Wie is de eigenaar van de geodata? Hoe zijn de geodata georganiseerd? Welke typen geodata worden er gebruikt? Uit welk jaar zijn de geodata afkomstig? Hoeveel geodata komen dubbel voor? Van welke geodata is meta-informatie beschikbaar? Is de meta-informatie compleet ingevuld? En, is de meta-informatie eenduidig?
De opdracht voor het onderzoek werd uitbesteed aan Grontmij GIS & ICT. Dit bedrijf heeft speciaal voor dergelijke inventarisaties de GeoScanner ontwikkeld en deze werd in oktober 2007 dan ook ingezet om de servers van RWS te doorzoeken. Met een snelheid van tien tot tachtig gigabyte per uur, al naar gelang de systeemconfiguratie, netwerksnelheid en voor­komende formaten, werden de servers van de verschillende directies van Rijkswaterstaat doorlopen. Hierbij moesten de medewerkers van Grontmij op bezoek in alle vestigingen om een fysieke koppeling te maken tussen de GeoScanner en de server. In totaal werd meer dan twintig terabyte aan geo- en metadata in kaart gebracht bij de landelijke en regionale diensten.
Marcel Steenis, projectmanager bij Grontmij, vertelt: “De GeoScanner inventariseert alle gangbare formaten geodata variërend van CAD-bestanden van ontwerpprogramma’s als AutoCAD of MicroStation tot shapefiles, ArcInfo coverages, GRID, TIFF, ECW en MXD mapdocuments. Ook ondersteunt de Geo­Scanner gegeorefereerd beeldmateriaal zoals jpg, ecw en tiff. Naast informatie over individuele bestanden wordt de relatie tussen geodata en mapdocumenten geïnventariseerd. Verder brengt de scan ook de metadata in kaart. Het resultaat van het onderzoek is dan ook een database met de resultaten over de hoeveelheid bestanden, de bestandsformaten en alle metadata van de geo-bestanden.”

Data opschonen
Haenen en zijn collega’s hebben van tevoren geprobeerd een reële inschatting te maken van de volledigheid van de metadata. “De verwachtingen waren niet al te hoog gespannen en dat bleek een juiste voorstelling van de situatie. Belangrijk daarbij is wel dat het ontbreken van metadata niets zegt over de kwaliteit van de (geo)data zelf. De kwaliteit van RWS-geodata is doorgaans goed tot uitstekend. Maar met name in lokale werkprocessen is de behoefte aan metadata minder groot en worden deze minder zorgvuldig ingevuld. Dat vermoeden hadden we al, maar zagen we nu ook terug in harde getallen. Omdat we na de scan exacte cijfers in handen hadden, konden we in kaart brengen hoe de stand van zaken was. Er is dan ook een aantal diensten geweest die direct na de rapportage aan de slag zijn gegaan om hun data op te schonen en die nu werken aan het verbeteren van de kwaliteit van de metadata. En dat is natuurlijk een goede zaak, want de scan is een relatief klein project: het werk na de scan is de echte klus. Zo moeten we bijvoorbeeld nog veel CEN-metadata aanpassen en aanvullen voordat deze te converteren zijn naar ISO 19115. Dat kost veel menskracht. Elke dienst moet dan ook capaciteit vrijmaken om de inhaalslag te kunnen maken”, zo stelt Haenen.

Inkoopgedrag
“De met de Geoscanner uitgevoerde scan levert concrete resultaten op over de metadata waar de verschillende RWS-diensten direct mee aan de slag kunnen”, vertelt Marcel Steenis. De scangegevens zijn echter ook bruikbaar voor andere zaken. Zo zijn er analyses mee uit te voeren die te gebruiken zijn voor het inrichten van datamanagement processen, zoals Dienst Zuid-Holland die momenteel laat uitvoeren door Grontmij. Ook kan op basis van analyses bijvoorbeeld besloten worden om sommige producten centraal in te kopen. Haenen voorziet dat er in de toekomst nog vaker geoscans uitgevoerd zullen worden binnen RWS. “Ik weet dat Directie Limburg en Zeeland inmiddels al een nieuwe scan hebben aangevraagd, om op die manier de doorgevoerde wijzigingen te kunnen controleren. Voor de omzetting van de metadata van CEN naar ISO is een snapshot genoeg, maar als de scan meerdere malen wordt uitgevoerd, biedt het een handvat om de data te kunnen managen. Daarmee is immers een verandering in de tijd inzichtelijk te maken. En omdat het scannen niet zo heel veel tijd in beslag neemt, kan het een handige tool zijn voor het monitoren en beheren van geo-gegevens.” Marcel Steenis is projectmanager Grontmij GIS & ICT Boy Haenen is projectleider RWS Data en ICT Dienst

Lambert-Jan Koops lkoops@gismagazine.nl is freelance schrijver van CAD-GIS gerelateerde artikelen.

Internet: www.rws.nl