Een moreel dilemma met de Staatscourant: privacy versus openbaarheid

In dit artikel lees je de overwegingen waarom inhoud van de Staatscourant ondanks mogelijke privacybezwaren toch gearchiveerd en doorzoekbaar gemaakt wordt.

Zoals in een eerder artikel https://forums.invantive.com/t/privacy-versus-openbaarheid-van-openbaar-gemaakte-documenten/471 besproken, is er een strijdigheid tussen de belangen van openbaarheid en belangen van privacy. Beide belangen kunnen betrekking hebben op de rechtsbescherming. Voor de openbaarheid geldt dat als informatie eenmaal openbaar gemaakt is, dat het nodig is om achteraf vast te kunnen stellen dat de informatie openbaar geweest is. Of zoals in de quote van C.A. Woolf:

What has been seen cannot be unseen, what has been learned cannot be unknown. You cannot change the past, but you can learn from it. You can grow from it. You can be made stronger. You can use that strength to change your life, to change your future.

Privacy en de Staatscourant

De Staatscourant is het aangewezen medium om mensen te informeren over besluitvorming. Nog sterker: mensen worden geacht de wet te kennen en de Staatscourant is het medium om mensen hierover te informeren.

Zo tref je in de Staatscourant ook informatie aan welke bedrijven failliet gegaan zijn, welke scheidingen uitgesproken zijn en exploten van deurwaarders. Zoek je bijvoorbeeld op “staatscourant scheiding 69817” dan komt informatie naar boven over een echtscheiding, een privacygevoelig life event:

In de webpagina lees je daarna dat het gaat over de ontbinding van een huwelijk tussen een dame en een heer:

Gezien de privacy voelt het niet goed om de namen te laten staan; vandaar de blur. Maar formeel is het openbare informatie; als samenleving wil je schuldeisers of eventuele andere huwelijkskandidaten goed informeren om de schuldenpositie te kunnen bepalen of bigamie te voorkomen.

De bijbehorende PDF kun je opvragen via de knop “Authentieke versie (PDF)”:

Op dit moment is echter de tekst in de PDF van de Staatscourant een “foto”; een mens kan de informatie prima tot zich nemen, maar een machine kan deze niet interpreteren zonder extra software.

Machines kunnen de afgelopen jaren PDF-documenten goed machinaal verwerken mits de tekst toegevoegd is. Het is een kwestie van tijd totdat ook machines PDF-documenten met foto’s automatisch gaan uitlezen en interpreteren. De enorme vooruitgang van Google bij het toegankelijk maken van informatie merk je de laatste jaren sterk. Google interpreteert vragen niet meer letterlijk, maar probeert de intentie te achterhalen of zoals ze het zelf noemen “user intent”. Bij de intentie zoekt men de passende informatie, in welke vorm dan ook.

In het populaire voorbeeld van de zoekterm “cute cat” krijg je de onderstaande voorbeelden. Google interpreteert uit je zoekvraag dat je waarschijnlijk niet geinteresseerd bent in moeilijke wetenschappelijke teksten over wat een kat “schattig” maakt, maar gewoon plaatjes wilt zien. En Google herkent aan foto’s uit inhoud en/of context of ze betrekking hebben op schattige katten:

Doorzoekbare Staatscourant PDF foto’s

OpenArchivaris richt zich specifiek op het verzamelen, archiveren en vindbaar maken van openbare overheidsinformatie. Hierbij worden meer technieken toegepast dan Google momenteel beschikbaar stelt, waaronder het machinaal leesbaar maken.

Het conflict tussen het belang van openbaarheid en het belang van privacy komt hier weer om de hoek. Praktisch leest vrijwel niemand de Staatscourant; het aantal abonnee’s in een woonwijk zal rondom het absolute nulpunt liggen. En door het gebrek aan populariteit is er sprake van “security by obscurity”: het is wel formeel openbaar, niemand leest het, niemand weet het en eventuele problemen rondom tegenstrijdige belangen openbaren zich niet.

Merk op dat “security” hier in de Engelstalige context gelezen moet worden als het Nederlandse begrip “Informatiebeveiliging”. Het heeft niks te maken met veiligheid (“safety”) of (fysieke) beveiliging in het algemeen.

Indien echter OpenArchivaris of andere tools de informatie minder verborgen maken, dan kan dit leiden tot discussies over de tegenstrijdige belangen. Misschien over enkele individuele gevallen, maar misschien ook over het algehele afsprakenkader: is het wel wenselijk om in de Staatscourant privacy-gevoelige informatie te openbaren zonder expliciete vermelding van een embargo of publicatieduur in de vorm van een “disclaimer”?

In mijn ogen zal deze discussie “vertrouwelijkheid versus openbaarheid” ooit gevoerd gaan worden. Het is ook een meer essentiele discussie dan het individuele belang. Daarom heeft dit geleidt tot een keuze om te conformeren bij de kritiek op “security by obscurity” en de informatie uit de Staatscourant integraal vindbaar te maken.