BGT Linked Data

  1. Projectbeschrijving 2014 BGT-LD-PvA2014
  2. Werkdocument BGT-LD bronbestanden
  3. Werkend prototype BGT-LD-prototype

Inhoud

Proof of Concept

Dit project is een Proof of Concept in opdracht van het ministerie van Infrastructuur en Milieu (I&M). Hieronder volgt een korte beschrijving van de inhoud en aanpak van dit project.

Betrokkenen:

Uitgangspunten

Doel van de PoC is te onderzoeken wat Linked Data kan betekenen voor de BGT. Meer specifiek:

  • Is Linked Data een goede technologie om data in het stelsel van basisregistraties over de grenzen van registraties heen te gaan verbinden, op zo’n manier dat deze data kan worden gebruikt om allerlei vragen te beantwoorden?
  • Waar liggen de grenzen op het gebied van zaken als performance en opslag waar het grote hoeveelheden data betreft, zoals bijvoorbeeld in de Basisregistratie Grootschalige Topografie (BGT)?
  • Is het LD concept geschikt om verrijking toe te passen?


Het BGT Linked Data project is gekoppeld aan het Platform Linked Data Nederland. Er wordt gebruik gemaakt van de hier aanwezige kennis en infrastructuur, zoals het beschikbare Data Platform LOD waar de tooling aanwezig is om linked data te publiceren en toegankelijk te maken. Over de PoC wordt gepresenteerd tijdens bijeenkomsten van het Platform Linked Data Nederland. Wellicht vinden er ook enkele conceptual fridays plaats over dit onderwerp.

Het project wordt vormgegeven door bronbestanden van verschillende basisregistraties te ontsluiten als linked data, verwijzingen aan te brengen tussen deze data, vragen te bedenken die aan deze combinaties van data gesteld kunnen worden, en een user interface te ontwikkelen die dit op een toegankelijke manier mogelijk maakt en demonstreert.

Bronbestanden

In het project wordt data uit verschillende basisregistraties aan elkaar gekoppeld. Daarom zijn er meerdere bronbestanden nodig. Naast data uit basisregistraties is het bovendien interessant om te experimenteren met verrijking van BGT data met meer gedetailleerde informatie, bijvoorbeeld met bronhouder-specifieke beheerinformatie (BOR data).


We denken aan:

  • BGT: grootschalige topografie
  • BAG: adressen en gebouwen
  • BRK kadaster: kadastrale percelen en rechten daarop; en gemeentegrenzen
  • WOZ: waarde van onroerende zaken
  • BRV: voertuigen; dit is het kentekenregister van het RDW
  • NHR: handelsregister / KvK
  • BOR: beheer openbare ruimte (verrijken van BGT met extra informatie)

Catalogi

Niet alleen data, maar ook een beschrijving van de semantiek kan helpen bij het verbinden van basisregistraties. Binnen het project willen we daarom gebruik maken van een aantal catalogi die de semantiek van registraties ontsluit. Dit zijn:

Gebied

De BGT is nog niet als data voor heel Nederland beschikbaar. Er is dus een keuze voor een specifiek gebied gemaakt: Leiden. Voor dit gebied wordt ook data van de andere bronbestanden verzameld.

Interessante vragen

Binnen het project wordt een aantal (5 tot 10) leuke, interessante vragen bedacht die door gecombineerd te kunnen zoeken in de data uit de verschillende bronbestanden, te beantwoorden zijn.

Publiceren Linked Data

De brondata voor het geselecteerde gebied zal veelal nog moeten worden omgezet naar RDF, het dataformaat voor Linked Data. Wellicht is er al het een en ander beschikbaar; de BAG is bijvoorbeeld al als RDF te verkrijgen.

De naar RDF geconverteerde data wordt opgeslagen in een RDF store met een SPARQL endpoint zodat hier vragen aan gesteld kunnen worden. De data van de verschillende bronnen wordt in twee of meer verschillende RDF stores opgeslagen zodat kan worden onderzocht of er gecombineerde vragen gesteld kunnen worden over de grenzen van basisregistraties heen.

De data wordt op een web-developer vriendelijke manier beschikbaar gesteld. Tussen de SPARQL endpoints en de developer zit liefst een API laag die het mogelijk maakt zonder SPARQL kennis vragen aan de data te stellen, en die JSON-LD als dataformaat aanbiedt.

Aansprekende user interface

Binnen het project wordt een aansprekende user interface gerealiseerd die toegang biedt tot alle data en het mogelijk maakt door deze data te browsen via een kaart en vragen te stellen over de verschillende basisregistraties heen.