Edurep:Aanbieder Status

Uit Kennisnet Developers Documentatie
Ga naar: navigatie, zoeken

Edurep-symbol.png Edurep: Aanbieder Status

Voor alle collectie aanbieders is er de mogelijkheid om bij te houden hoe de aangeboden records worden verwerkt door Edurep. Er wordt bijgehouden of de aangeboden records deadlinks bevatten, maar ook of de aangeboden records valide zijn (en dus geaccepteerd door ons systeem). De ingangen zijn de volgende overzichtspagina's:

Harvester

De harvester haalt de records binnen vanaf de aanbiedersrepository en fungeert daarmee als toegangspoort tot Edurep. Records die niet valideren worden geweigerd, en de status is te bekijken op de harvester status pagina.

Status Pagina

Per kolom in het statusoverzicht volgt nu een uitleg over de betekenis ervan:

  • RepositoryGroup: Link naar de repository groep, alleen beschikbaar voor de beheerder van Edurep.
  • Repository: Link naar de repository gegevens, alleen beschikbaar voor de beheerder van Edurep.
  • Last successful harvest: Timestamp van de laatste keer dat de harvester een "fout vrij" bezoek heeft gedaan.
  • Total records: Totaal aantal records die de harvester heeft opgehaald. Dit aantal is niet per definitie hetzelfde als het aantal in Edurep. Het kan bijvoorbeeld voorkomen dat onze deadlink checker records met dode links opruimt.
  • Harvested/Uploaded/Deleted: De verhouding tussen het aantal nieuwe of gewijzigde, en verwijderde records van het laatste harvest bezoek.
  • #Validation Errors: Het aantal validatiefouten. De link verwijst naar een pagina met een opsomming van alle fouten.
  • #Errors: Het aantal errors. De link verwijst naar een pagina met alle errors.
  • RSS: Geeft toegang tot een rss feed voor een specifieke aangesloten collectie.

Validatiefouten

Wanneer een record succesvol wordt geharvest, kan deze voor de opname in de zoekmachine nog geweigerd worden op basis van een validatiefout. Op dit moment wordt er alleen gevalideerd tegen het LOM XML schema (beide bindingen IEEE en IMS kunnen worden aangeboden). Wanneer een validatiefout bij de repository wordt gerepareerd en volgens OAI met een nieuwe updated timestamp wordt aangeboden, wordt het record weer regulier meegeharvest en verdwijnt de validatiefout.

In tegenstelling tot een error wordt er wel doorgeharvest na een validatiefout, tot op zekere hoogte. In principe wordt er na 100 validatiefouten niet meer doorgeharvest, er treedt dan voor de harvester een error op.

Elke validatiefout kan vanuit het foutenoverzicht individueel bekeken worden. De getoonde xml staat hier in de IEEE LOM binding, maar is inhoudelijk gelijk aan het ingeschoten record. De eerste regel van zo'n foutmelding bevat de gegenereerde samenvatting van de fout. In een aantal gevallen zal deze melding voldoende zijn om de fout in kwestie op te sporen. Soms zegt deze regel echter "Line 105: Unable to transform record". De fout zelf is dan in het xml bestand terug te vinden, en omgeven door expliciete Edurep error xml elementen:

105 <edurep:error xmlns:edurep="http://meresco.org/namespace/users/kennisnet/edurep">
106  <lom:keyword xmlns:lom="http://www.imsglobal.org/xsd/imsmd_v1p2">
107   <lom:langstring xml:lang="nl"/>
108  </lom:keyword>
109 </edurep:error>

Deadlink Checker

Als er een verschil is tussen de geharveste records en de vindbare records dan zijn er records met een dode link. Deze records worden uit de Edurep index gehaald om de klantervaring te verbeteren.

Status Pagina

Er is een statuspagina waar per repository een overzicht van de dode links is op te vragen. Per kolom in het statusoverzicht een korte omschrijving:

  • Repository: De repository identifier zoals deze in Edurep bekend is.
  • Vindbare records: Het aantal geharveste records minus de records met dode links.
  • Deadlink records: Het aantal records met dode links.
  • Totaal: Het aantal geharveste records

Wanneer men doorklikt op een individuele repository, kan men zich abboneren op de rss feeds van de harvester en de deadlink checker, alsmede een overzicht van alle dode link recordidentifiers downloaden.