Playalod

 
(Eén tussenliggende versie door één gebruiker wordt niet weergegeven)
Regel 116: Regel 116:
  
  
[[File:PLDN-sponsors-2019-Alle-OK.png]]
+
[[File:20190607_PLDN_Sponsor_-_All.png]]

Huidige versie van 7 jun 2019 om 15:07

Inhoud

[bewerken] Waarom een spel over Linked Data?

Dit spel is ontstaan met als doelstelling om spelenderwijs kennis te maken met het gedachtegoed van Linked Data. Maar wat is Linked Data eigenlijk, hoe is het ontstaan, wat is de kracht ervan en hoe interessant is het voor overheid, bedrijfsleven en wetenschap? Het was Sir Tim Berners-Lee, bedenker en grondlegger van het wereldwijde web (www), die eind vorige eeuw als eerste over de term ‘het semantisch web’ sprak. Volgens hem is het semantisch web de visie dat informatie verbonden moet zijn en daar heb je technieken voor nodig.

Big data, of smart data, gaat vooral over het bij elkaar brengen van data in alle soorten en maten om daar analyses op te doen, en dat kan met behulp van Linked Data. Open data zijn datasets die met een open licentie beschikbaar worden gesteld zodat toegang en hergebruik zonder beperkingen mogelijk is. Hierdoor wordt het delen en hergebruik van data bevorderd. Veel data van de overheid is open om transparantie te vergroten en economische activiteit te bevorderen.


5sterrenmodel.png

Bron: https://5stardata.info/en/


De mate van herbruikbaarheid van data kan beschreven worden met het vijfsterrenmodel, zoals dat is uitgewerkt door Tim Berners-Lee. Hoe meer sterren er aan een dataset kunnen worden toegekend, hoe meer zij geschikt zijn voor automatische verwerking, en daarmee betere bruikbaarheid en openheid. Startpunt is een open licentie (1 ster), maar onder open data wordt inmiddels ook verstaan dat data (indien relevant) ‘machine readable’ moet zijn (2 sterren) en in een open formaat beschikbaar moet worden gesteld (3 sterren). De vierde ster wordt toegepast wanneer het concept van URIs (unieke identifiers) wordt toegepast en de vijfde ster als er links zijn opgenomen naar andere datasets. Datasets met een herbruikbaarheid van 4 en 5 sterren noemen we Linked Open Data. Datasets van de overheid, zoals basisregistraties, hebben bij voorkeur vijf sterren. Inmiddels zijn de Basisregistratie Adressen en Gebouwen en de Basisregistratie Topografie als vijf sterren data beschikbaar. Overigens is het concept van Linked Data ook prima toe te passen in het bedrijfsleven wanneer er geen sprake is van een open licentie; we spreken dan over Linked Data in plaats van Linked Open Data.

In de visie van Berners-Lee past het semantisch web in de ontwikkeling van het internet: van het web van documenten (Web 1.0) via Web 2.0, waar het internet als interactief en sociaal communicatiemedium beschouwd wordt en waarbij gebruikers informatie kunnen uploaden naar Web 3.0: het web van Linked Data. Linked Data is gebaseerd op de concepten van het wereldwijde web: de data is daar te vinden, in een gestructureerd open formaat, er is naar te linken dankzij de toepassing van URI’s en de data biedt zelf ook verdere relevante verwijzingen.

In de afgelopen jaren hebben we gezien dat digitale dataverwerking bij overheid, bedrijfsleven en wetenschap een steeds belangrijker rol is gaan spelen. Maar er is nog veel meer mogelijk. Daarvoor is het wel nodig dat de basis, de onderlaag als het ware, in orde is. Door standaarden te gebruiken, bij voorkeur (open) standaarden die toch al gebruikt worden op het web, kan je tot meer interoperabiliteit komen. Dat kan al leiden tot een grote vermindering van ergernis en tot een forse toename van de maatschappelijke en economische waarde van data. Maar échte meerwaarde bereik je als niet alleen dezelfde (open) standaarden worden gebruikt, maar ook unieke identifiers (URI’s) worden toegepast en vocabulaires worden gemaakt en gebruikt. Door gebruik te maken van bestaande vocabulaires wordt de interoperabiliteit tussen gegevens vergroot, waardoor data uit verschillende bronnen makkelijker met elkaar gecombineerd kunnen worden. Als er vervolgens links zijn aangebracht in de data, dan kunnen we de volledige kracht van Linked Data benutten en ontstaat er een “knowledge graph”. Ook worden datasilo’s uit hun isolement gehaald en kan data beter hergebruikt worden zonder dat data onnodig gekopieerd wordt. Er kan gelinkt worden naar één leidende bron.

Met Linked Data zijn er geen kosten meer voor het opzetten en bijwerken van dataset kopieën, zijn gegevens altijd actueel en betrouwbaar en kunnen er (in theorie) geen beslissingen meer genomen worden op basis van niet-actuele data. Daarnaast zorgt het ervoor dat er een basis ontstaat waar andere partijen informatie aan toe kunnen voegen.

Met Linked Data leg je de basis om te voldoen aan de FAIR data principes (https://nl.wikipedia.org/wiki/FAIR_data), en ook het fundament voor data science, knowledge graphs, artificial intelligence en andere technologische trends. Daarom is het van groot belang dat velen bekend raken met het gedachtegoed van Linked Data.

[bewerken] Wat is Linked Data?

Linked Data laat zich het beste uitleggen als een netwerk van aaneengeregen triples, waarbij een triple bestaat uit de drie onderdelen subject - predicate - object. In het voorbeeld “Een arend heeft vleugels”, is “arend” het subject, het werkwoord “heeft” de relatie oftewel predicate, en “vleugels” het object. Elk van deze onderdelen krijgt een unieke identifier in de vorm van een webadres (URI), zoals https://playalod.nl/dieren/id/Arend.

Dit adres laat de specificaties bij dit concept zien, en is zowel voor mensen te benaderen als door computers. Hiermee is elk begrip uniek gedefinieerd en eenvoudig op te zoeken. Dit maakt het hergebruik mogelijk, met behulp van verwijzingen. Zo bevat de triple “Een olifant is groter dan een arend” ook het concept “arend” (hier als object) met dezelfde URI. Zo ontstaat een netwerk vergelijkbaar met het internet zoals dat we kennen, maar dan van gekoppelde (linked) begrippen (data).

Namespaces en qnames

Omdat een URI in gebruik vaak lang en wat onhandig is, mag je deze afkorten met een namespace, zoals “pal” als namespace voor Play-a-LOD. De combinatie van de namespace en het begrip noemen we een qname. Zo kun je https://playalod.nl/dieren/id/Arend afkorten tot “pal:Arend”. Het achterliggende informatiemodel (zie figuur 1) krijgt een eigen URI en daarmee ook een eigen qname. Zo wordt https://playalod.nl/dieren/model/Dier afgekort tot palm:Dier.

Linked Data is gebaseerd op de technische W3C-standaard Resource Description Framework (RDF), beheerd door de W3C-organisatie . Daarnaast zijn er veel standaarden die hergebruik van begrippen bevorderen, zoals SKOS voor het beschrijven van hiërarchische sets, en OWL en SHACL voor het beschrijven van voorwaarden bij begrippen en sets. Zo drukt de triple “pal:Zoogdier skos:broader pal:Olifant” de hiërarchische relatie dat een zoogdier een breder begrip is dan een olifant. Met de triple “pal:Olifant owl:sameAs dbpedia:Elephant ” laat je zien dat de twee begrippen hetzelfde betekenen.

Ook het informatiemodel - dat wil zeggen de classes waartoe de instances - behoren, is uitgedrukt in Linked Data. Zo is een olifant een dier, zoals de triple “pal:Olifant rdf:type palm:Dier” uitdrukt. Het schema hieronder laat zien hoe het informatiemodel voor Play-a-LOD Dieren eruitziet. Een informatiemodel in Linked Data is heel gemakkelijk uitbreidbaar: met het toevoegen van een of meerdere triples is de koppeling met het informatiemodel van een andere dataset te leggen. Zo laat de triple “pal:Dier owl:sameAs dbpedia:Animal” zien dat in beide datasets hetzelfde is bedoeld, waarmee is af te leiden dat ook “pal:Olifant rdf:type dbpedia:Animal” waar is. Dit afleiden noem je inferencing: computers kunnen redeneren op basis van betekenis (semantiek) van begrippen. Hiermee legt Linked Data onder andere een basis voor Kunstmatige Intelligentie.


IM-Dierenontologie.png


Figuur 1 - Het informatiemodel bij Play-a-LOD dieren


Linked Data is te doorzoeken met behulp van de querytaal SPARQL. Deze taal is gebaseerd op de querytaal voor niet-relationele databases SQL. In een SPARQL-query is het logische patroon beschreven van de gezochte triple. Dit patroon is ook beschreven in triples, en de volgorde is - los van zoeksnelheid - niet van belang. Hieronder is een SPARQL-query beschreven, waarvan het resultaat (gegeven de triples in deze tekst) “pal:Arend” is.


QueryBox01.jpg

[bewerken] Spelregels Play-a-LOD Dieren

[bewerken] Doel van het spel

Doel van het Play-a-LOD Dieren is kennis te maken met de principes van Linked Data, door het leggen van triples, bestaande uit een Subject - Predicate - Object (zie hoofdstuk ‘Wat is Linked Data?’). Degene die hierbij de meeste punten verzameld voor het einde van het spel is de winnaar. Het spel kan gespeeld worden door 2 t/m 4 spelers, of meer door teams te vormen (zie spelvarianten).

Play-a-LOD Dieren bestaat uit 112 kaartjes, waarvan 72 concepten die als subject (S) of object (O) kunnen fungeren (bv. “pal:Olifant”) en 40 predicate-kaartjes (P) die de relatie leggen tussen subjecten en objecten (bv. “pal:heeft”). Het cijfer op de hoek van de kaartjes geeft het aantal punten aan die met dit kaartje zijn te behalen. De QR-code leidt naar de URI van het betreffende concept (bv. https://playalod.nl/dieren/id/Olifant) waar de zogenoemde digital twin is te vinden met meer informatie en links naar andere concepten.

[bewerken] Verloop van het spel

  1. De kaartjes worden allemaal omgekeerd op tafel gelegd, door elkaar geschud, dit is dan de pot. Elke speler moet 9 kaartjes pakken en legt deze voor zich op tafel of neemt ze in de hand.
  2. Degene wiens voornaam als eerste voorkomt in de frase ‘Linked Open Data’ mag beginnen, hierbij wordt gekeken naar de beginletter, en als deze geen uitsluitsel geeft de tweede letter enz. Deze speler legt een triple op tafel en pakt 3 nieuwe kaartjes.
  3. Elke volgende speler legt 1 of meer kaartjes aan om triples te vormen. Bij het aanleggen hanteren de spelers de volgende regels:
    1. Het aantal kaartjes dat een speler aanlegt is minimaal 1, en maximaal 9.
    2. De nieuwe triple(s) moeten aansluiten bij de triples op tafel. Je mag wel op meerdere plekken tegelijk aanleggen.
    3. Een triple moet in één lijn worden aangelegd. Triples worden horizontaal of verticaal gevormd, niet diagonaal.
    4. Er mogen alleen hele triples van subject - predicate - object worden gevormd, er mogen door een beurt geen triples ontstaan die niet compleet of van een andere samenstelling zijn.
    5. De meeste relaties hebben een richting, bv “pal:Olifant pal:groterDan pal: Arend”. De richting waarin je de kaartjes aanlegt hoeft hier niet mee overeen te komen, je mag deze triple van rechts naar links aan leggen. Je moet er wel bij zeggen hoe je de triple bedoelt.
    6. De triples moeten semantisch correct zijn, dat wil zeggen dat de spelers het er onderling over eens zijn dat de betekenis van de triples kloppen. Bij twijfel of onenigheid kan door het scannen van de QR-code extra informatie worden ingewonnen.
  4. Aan het einde van de beurt pakt de speler zoveel kaartjes als nodig tot hij weer 9 kaartjes heeft. Als een speler niet kan, mag hij 1 of meerdere kaartjes ruilen met de pot maar is zijn beurt daarmee voorbij. Ook mag de speler zonder ruilen de beurt voorbij laten gaan.
  5. Aan het einde van elke beurt noteert een van de spelers de score. Hierbij worden alle punten op de kaartjes van de nieuw gevormde triples meegeteld. Reeds gelegde punten die onderdeel zijn van de nieuwe triple tellen ook mee. Als een kaartje bij twee nieuwe triples hoort, wordt deze dubbel meegeteld.
  6. Het spel eindigt als alle kaartjes in de pot op zijn, of er geen aanlegmogelijkheden meer zijn. Ook kan het spel eindigen als een vooraf afgesproken tijd voorbij is.

[bewerken] Spelvariaties

Subset voor jongere kinderen

Als er jongere kinderen meedoen, kan de kaartenset worden beperkt om het spel te vereenvoudigen. De werelddelen in combinatie met de ‘Leeft in’-kaartjes kunnen bijvoorbeeld uit het spel worden genomen, maar ook andere subsets zijn mogelijk.

SPARQL voor specialisten

Deze spelvariant kun je na afloop van een regulier spel doen. Voor een verkorte variant leggen de spelers samen de kaartjes op tafel volgens de spelregels, maar slaan ze de beurten en de puntentelling over. Het spel begint zodra de tafel vol ligt met aaneengeregen triples. Eén van de spelers is de spelleider, of de spelers spreken af dit per beurt te wisselen. De spelleider kiest een kaartje uit en benoemt de relaties die het heeft, zonder het betreffende kaartje te noemen. Een eenvoudige variant is het benoemen van het dier “heeft 4 poten en is een herbivoor”, voor specialisten die de query-taal SPARQL beheersen is het ook mogelijk om dit op papier te schrijven:


QueryBox02.jpg


De spelers kunnen het elkaar zo moeilijk mogelijk maken door vanaf een kaartje te starten dat zo ver mogelijk weg ligt van het beoogde kaartje, waardoor er een ingewikkeld zoekpatroon ontstaat. De winnaar van elke ronde is de speler die het snelst het juiste dier benoemd, de spelleider is hierbij de scheidsrechter. De overall winnaar is degene die de meeste ronden heeft gewonnen.

[bewerken] Scorekaart

De score voor het Play-a-LOD spel kun je eenvoudig bijhouden op de volgende scorekaart:

Play-a-LOD Scorekaart (PDF)
Play-a-LOD Scorekaart (Excel)

Download de scorekaart door op een link te klikken en vervolgens kun je scorekaart uitprinten zo vaak als je hem nodig hebt of vul de Excel sheet in op je laptop, zodat de scores meteen berekend worden als je een score invult.

[bewerken] Over Play-a-LOD

Leuk dat je Play-a-LOD wilt gaan spelen! We hebben Play-a-LOD bedacht zodat het enerzijds veel plezier oplevert en anderzijds een indruk geeft van Linked Data. We hopen dan ook dat beide aspecten goed tot zijn recht komen.

Het krachtige van Linked Data, en specifiek het maken van zogenaamde triples, is dat er vele uitbreidingsmogelijkheden zijn. We willen iedereen dan ook zeker aanmoedigen om uitbreidingen of spelvarianten te ontwikkelen met inachtneming van de Linked Data principes, dit kan met een verwijzing naar Play-a-LOD. Tot slot zouden we graag op de hoogte gebracht worden van uitbreidingen, of andere ervaringen met Play-a-LOD via info@playalod.nl.

Veel plezier!

Marcia van Oploo (https://nl.linkedin.com/in/marciavanoploo)
Constant Gordon (https://nl.linkedin.com/in/constant-gordon)
Erwin Folmer (https://nl.linkedin.com/in/erwinfolmer)

Layout: Remwerk, Amersfoort
Drukwerk: PGN, Almere

Play-a-LOD website: http://www.playalod.nl

Dit spel is mogelijk gemaakt door het Platform Linked Data Nederland (PLDN). Meer informatie over Linked Data en PLDN zijn te vinden op de website: http://www.platformlinkeddata.nl

Het Platform Linked Data Nederland wordt ondersteund door:


20190607 PLDN Sponsor - All.png