Verslag Linking Geospatial Data

De standaardenorganisaties W3C en OGC hielden op 5 en 6 maart een gezamenlijke workshop in Londen getiteld “Linking geospatial data”. De goedbezochte workshop werd gehost door Google. Nederland was met vijf bezoekers, waarvan er drie presentaties gaven en ikzelf als voorzitter optrad van een sessie, goed vertegenwoordigd in dit diverse veld van geo-wetenschappers en geo-veteranen uit de publieke sector, tot web specialisten en mensen die zich al 15 jaar met linked data bezig houden.

Met ruim 100 deelnemers die stuk voor stuk interessante dingen te melden hadden, was het onmogelijk om iedereen uitgebreid te laten vertellen. De presentaties werden dan ook streng getimed op 10 danwel 5 minuten.Vooral de 5 minuten durende ‘lightning talks’ waren soms zo gecomprimeerd dat ze weinig informatief waren, hoewel anderen toch wel hun boodschap wisten over te dragen. Er was wel ruim tijd voor vragen zodat op interessante aspecten kon worden doorgevraagd. En heel belangrijk waren de koffie, lunch en theepauzes waarin iedereen uitgebreid aan de praat kon raken met elkaar.

Terwijl de eerste dag nog vooral overweldigend was, begon zich op de tweede dag een richting te manifesteren. De tendens was dat men niet veel nieuwe standaarden wil, maar wel dat een keuze voor één geovocabulaire en die te standaardiseren, zeer wenselijk is. Er zijn wat aspecten van bestaande standaarden die geadresseerd zouden moeten worden. Veel genoemd werd bijvoorbeeld de geometrie encoding van GeoSPARQL waar de verwijzing naar het gebruikte CRS verweven zit met de coordinaten zelf in één veld en niet gemakkelijk op te halen is. Een opvallend probleem was dat het voor gebruikers, gegeven geo-data in een bepaald coordinatensysteem, heel moeilijk te achterhalen is wat eerst komt: de lon of de lat. En als je dat niet weet is de data niet te gebruiken. GeoJSON kwam, onder andere door de bevlogen pitch van PiLOD-er Rein van ’t Veer, naar voren als een interessante mogelijkheid om geo-data naar het web te brengen. W3C ziet mogelijkheden om dit community formaat te gaan standaardiseren. Wellicht worden andere vocabulaires, zoals SSN voor sensordata en de Time ontology, ook gestandaardiseerd. Verder is het volgens veel aanwezigen vooral een kwestie van de standaarden beter ondersteunen met cookbooks en best practices en voldoende goede implementaties. Andere zaken die genoemd werden waren een manier om de complexe aspecten van een dataset, zoals metadata per coordinatenpaar (denk aan de beruchte plaatsbepalingspunten van de BGT), weg te houden bij de meeste gebruikers en alleen uit te leveren aan de expertgebruikers die dat wel willen. Ook kan er gekeken worden naar standaardisatie van een compressietechniek voor geometrieën, die immers behoorlijk groot kunnen zijn.

Onze mannen van de PiLOD hielden mooie presentaties. Rein was de enige met een live demo, en die gedroeg zich voorbeeldig. Hij liet een prototype website zien met archeologische data, die we in de PiLOD gaan combineren met grondwaterstanden (peilbuisdata). Frans Knibbe kreeg de hele zaal aan het lachen met zijn prachtige slides over ‘miss Globe’ en ‘mister Cube’, hun wederzijdse aantrekkingskracht, en de hobbels die zij tegenkomen op weg naar een lang en gelukkig leven. Bert Spaan had zeer mooie slides die zijn verhaal over de CitySDK illustreerden.

De tweedaagse eindigde met een serie ‘bar camp talks’. Een leuk format waarbij wie dat maar wil in één minuut een idee kan pitchen. Na alle pitches kon iedereen diegene opzoeken waar hij/zij graag mee verder zou willen praten. Zo vormden zich groepjes van maximaal 10 personen waar men wat meer de diepte in kon gaan.

Phil Archer van W3C sloot de dag af met een aantal conclusies. De W3C en OGC gaan een gezamenlijke werkgroep oprichten die die zich in ieder geval zal buigen over de standaardisatie van een geovocabulaire, en mogelijk ook over standaardisatie van GeoJSON en andere zaken die naar voren kwamen. Het resultaat zal een zowel door W3C als OGC gesteunde standaard zijn.

Meer opgemerkte punten:

  • Kerry Taylor (van CSIRO, uit Australië, collega van Simon Cox) waarschuwde dat automatisch genereren van OWL uit UML geen goed idee is. Ze hebben het gedaan met water standaarden maar het resultaat was een overgecompliceerde, niet door reasoners bruikbare, en slecht te onderhouden ontologie (en onderhoudbaarheid is juist het doel van MDA). Te veel handmatig werk nodig, begreep ik er uit.
  • Er waren vrij veel presentaties uit de hoek van sensoren. Bijvoorbeeld een interessante presentatie uit de oceanografie, waar ze onderwaterrobots hebben met sensoren die hun data meteen in OGC standaarden teruggeven inclusief semantiek. Was een leuke spreker. Slideshare.net/adamleadbetter
  • Ook een hele leuke over sensoren op fietsen die de nabijheid van andere voertuigen meten en zo informatie opleveren over waar het gevaarlijk is voor fietsers.
  • SSN is een veel genoemde bestaande vocabulaire voor linked sensor data.
  • Er was vooral de eerste dag veel te horen over dat het moeilijk is om goede persistente URIs te verzinnen vooral als je met versies te maken hebt. Maar Phil Archer merkte op dat de manier die W3C zelf hanteert goed werkt. Dus de vraag is of dat wel echt een probleem is. JRC ziet wel issues.
  • Een interessante vraag was: gaat Google GeoJSON indexeren? JSON schijnt moeilijk te indexeren te zijn, omdat er geen semantiek in zit, maar JSON-LD zou dit op kunnen lossen. Het zou erg mooi zijn als geo-data op het web door Google geïndexeerd wordt!
  • Er werd een samen met IGN ontwikkeld CRS transformatie service gedemonstreerd. En een CRS register.
  • Leukste quote: If you are a web developer, ajax is not a cleaning product; if you are a geospatial developer a polygon is not a dead parrot.