Gebruiker:Muskee01/Metadateerrobot/Integratie
Gebruiker: Muskee01/Metadateerrobot/Integratie
De voorgaande ontwikkelingen concentreerden zich vooral op het parsen en opslaan van de metadata. Met deze volgende stap is ook de querylog parsing in hetzelfde "code-framework" gezet. Het voordeel van het gebruik van 1 framework is vooral het hergebruik van gemeenschappelijke functies en structuren en het leren van elkaars code.
Beide processesen, metadata en querylog parsing maken gebruik van dezelfde trefwoordentabel, en de daarbij horende functies. Ook slaan beide processen hun trefwoord-vak-aantal combinaties op in een gelijkvorminge database tabel waardoor analyse, en uitvoer functies eenvoudiger zijn te maken voor beide typen content.
uitvoer per trefwoord
De individuele uitvoeren voor "anne frank" zien er als volgt uit:
{
"keyword": "anne frank",
"meta": {
"totalcount": "1719",
"type": "querylogs"
},
"result": [
{
"identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
"label": "Geschiedenis",
"count": "1719",
"perc": "100"
}
]
}
{
"keyword": "anne frank",
"meta": {
"totalcount": "48",
"type": "metadata"
},
"result": [
{
"identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
"label": "Geschiedenis",
"count": "31",
"perc": "64.6"
},
{
"identifier": "3401cf6e-82e4-404c-b216-b980ff407159",
"label": "Nederlands",
"count": "7",
"perc": "14.6"
},
{
"identifier": "8b194f4d-d757-440d-b8a2-e7427849a6db",
"label": "Wereldorientatie",
"count": "4",
"perc": "8.3"
},
{
"identifier": "ddae0006-230f-4f00-b407-9d358a90a27e",
"label": "Technisch schrijven",
"count": "3",
"perc": "6.3"
},
{
"identifier": "f97e788f-5aa6-4ab4-9448-9e27b79daa9e",
"label": "Natuur",
"count": "1",
"perc": "2.1"
},
{
"identifier": "534ac9f4-f71d-4b46-89e0-dc3f6813da6d",
"label": "Lezen",
"count": "1",
"perc": "2.1"
},
{
"identifier": "aa2f68ba-69e5-415d-8d9b-8d6ab98942b1",
"label": "Burgerschap",
"count": "1",
"perc": "2.1"
}
]
}
Deze uitvoeren kunnen ook worden gecombineerd, waarbij de percentages nu 50-50 worden geaggregeerd.
{
"keyword": "anne frank",
"meta": {
"type": "all"
},
"result": [
{
"identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
"label": "Geschiedenis",
"perc": "82.3"
},
{
"identifier": "3401cf6e-82e4-404c-b216-b980ff407159",
"label": "Nederlands",
"perc": "7.3"
},
{
"identifier": "8b194f4d-d757-440d-b8a2-e7427849a6db",
"label": "Wereldorientatie",
"perc": "4.15"
},
{
"identifier": "ddae0006-230f-4f00-b407-9d358a90a27e",
"label": "Technisch schrijven",
"perc": "3.15"
},
{
"identifier": "aa2f68ba-69e5-415d-8d9b-8d6ab98942b1",
"label": "Burgerschap",
"perc": "1.05"
},
{
"identifier": "534ac9f4-f71d-4b46-89e0-dc3f6813da6d",
"label": "Lezen",
"perc": "1.05"
},
{
"identifier": "f97e788f-5aa6-4ab4-9448-9e27b79daa9e",
"label": "Natuur",
"perc": "1.05"
}
]
}
Uitvoer alle trefwoorden
In het bovenstaande voorbeeld zou het vak "Geschiedenis" bepalend kunnen zijn voor het trefwoord "anne frank" als we de grenswaarde voor het percentage groter maken dan 50%. Door deze methode te gebruiken kunnen alle trefwoorden worden nagegaan op zo'n combinatie.
In een prototype script is het nu mogelijk om alle vak "best guesses" voor alle trefwoorden te exporteren. Men kan hiervoor grenswaarden instellen voor het minimale percentage, minimaal gebruik en minimaal aantal vakken. Op die manier kunnen we snel een overzicht krijgen van mogelijke combinaties en goed te gebruiken grenswaarden.