Archiefinventarissen, digitale objecten en scans van archieven

Open data

Een groot deel van de archiefinventarissen en scans van archieven zijn beschikbaar als open data. De manier waarop over dit materiaal beschikt kan worden verschilt.

Open data archiefinventarissen

Collectiegegevens Waarde
Collectieonderdeel Archiefinventarissen
Licentie CC0
Techniek OAI-PMH
Formaat EAD/XML

Een beperkt aantal archiefinventarissen (2.8%) is geen open data, omdat ze in het verleden door derden zijn gemaakt en het auteursrecht niet bij het Nationaal Archief ligt.

OAI-PMH (voor open data archiefinventarissen)

OAI-PMH staat voor Open Archives Initiative Protocol for Metadata Harvesting. Het is een technische standaard voor het verzamelen van metadata uit repositories. Een repository is een bibliotheek met documenten of objecten (ook wel ‘content’ genoemd), bv een (digitaal) archief.

OAI-PMH maakt het mogelijk om deze metadata (dus niet de documenten of objecten zelf) uit verschillende repositories te verzamelen (via een pull; de gegevens blijven altijd staan, als er iets verandert maakt collectiebeheer een nieuwe uitvoer). Vanuit een centraal systeem kan dan gezocht worden naar documenten of objecten in de verschillende aangesloten repositories.

Via OAI-PMH kunnen de archiefinventarissen opgevraagd worden; hierbij wordt EAD/XML terug geleverd. De OAI-PMH werkt als volgt, de base url is:
https://service.archief.nl/gaf/oai/!open_oai.OAIHandler?

De OAI-PMH kan middels zes requests (verbs) bevraagd worden:

  • Identify: vraag naar informatie over de repository 
  • ListMetadataFormats: vraag naar de beschikbare metadataformaten. Als de 'identifier' van een record wordt gegeven moeten alleen de formaten die op die record van toepassing zijn worden getoond.
  • ListSets: vraag naar de beschikbare sets (setSpecs). Records kunnen in een repository gestructureerd worden in sets.
  • ListRecords: vraag de volledige metadata op van records per setSpec, incl het zg record 0 (de vraag kan beperkt worden op datum van/tot en op set, bovendien kan het gewenste metadataformaat gevraagd worden).
  • ListIdentifiers: idem als ListRecords, maar geeft per record slechts een verkort resultaat (identifier en datum) in plaats van de volledige metadata.
  • GetRecord: vraag een specifiek record op. 

Voorbeelden:

Open data scans en andere digitale objecten
Collectiegegevens Waarde
Collectieonderdeel Scans van archieven en digitale objecten (bestanden)
Licentie Publiek domein en CC0
Techniek Via download XML en METS-file
Formaat
  • XML en JPEG thumb, medium- en high-res output voor de scans
  • JPEG of TIFF download, met een 300 DPI afdrukkwaliteit voor de afmeting van het origineel door bij de individuele scan gebruik te maken van de download knop
  • Verschillende bestandsformaten voor de digitale objecten.

Scans en andere digitale objecten downloaden

Een flink aantal scans en andere digitale objecten (bestanden) die horen bij de verschillende archiefinventarissen zijn beschikbaar via de informatie die in de EAD/XML staat.

De scans van archieven kunnen worden opgehaald door eerst de EAD van de betreffende toegang waarin de scans staan op te halen. Bij elk inventarisnummernummer in de EAD waar scans bij horen staat de informatie van de locatie van de scans. De EAD kan vanaf de website worden gedownload of geharvest via de OAI-PMH.

Voorbeeld scans van een inventarisnummer van de toegang van de Schepenbank te Batavia, 1.04.18.03.

Haal de EAD op via oai-pmh: https://service.archief.nl/gaf/oai/!open_oai.OAIHandler?verb=ListRecords&set=1.04.18.03&metadataPrefix=oai_ead

Of download de EAD via de website op: https://www.nationaalarchief.nl/onderzoeken/archief/1.04.18.03 en klik op “Download inventaris als XML”.

Zoek in de XML het inventarisnummer van de betreffende scans, in dit geval bijvoorbeeld 11942.

Het zoeken gaat snel door te zoeken naar “>11942</unitid>”. Het veld dat in de unitid staat is het inventarisnummer.

Daaronder staat in dit geval:

<dao audience="internal" role="METS" linktype="simple" show="shownone" actuate="onrequest" href="https://service.archief.nl/gaf/api/mets/v1/48f1f22f-1228-4b00-9720-5816a07b4003"></dao>

De link die hier staat bevat alle informatie over de te downloaden scans (de METS-file). Volg de link https://service.archief.nl/gaf/api/mets/v1/48f1f22f-1228-4b00-9720-5816a07b4003.

Hier staat de locatie van de scans:
<fileSec>
<fileGrp USE="DEFAULT">
<file ID="ID835776c2-fb57-47eb-b537-b82758b6558aDEF" USE="DISPLAY" MIMETYPE="image/jpeg" SIZE="6519080"><FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="https://service.archief.nl/gaf/api/file/v1/default/835776c2-fb57-47eb-b537-b82758b6558a"/></file>

Volg de link https://service.archief.nl/gaf/api/file/v1/default/835776c2-fb57-47eb-b537-b82758b6558a en de scan wordt in groot formaat als jpg aangeboden.

Alle scans die bij dit inventarisnummer horen staan in de METS-file vermeld.

Bronvermelding

Bij een Publiek domein en CC0 verklaring is de bronvermelding bij hergebruik niet verplicht. We stellen een bronvermelding wel op prijs. 

Bronvermelding open data per collectieonderdeel
Collectieonderdeel Bronvermelding
Archiefinventarissen

Nationaal Archief, Den Haag, [archiefnaam], [periode], nummer archiefinventaris [xx.xx.xx], inventarisnummer [xxx]

of verkort

NL-HaNA, [verkorte archiefnaam + periode], [nummer archiefinventaris xx.xx.xx], inv.nr. [xxx]
Scans van Archieven Nationaal Archief, Den Haag, [nummer archiefinventaris xx.xx.xx], inv.nr. [xxx]