Gebruiker:Muskee01/Metadateerrobot/Integratie: verschil tussen versies

Uit Kennisnet Developers Documentatie
Naar navigatie springen Naar zoeken springen
(add integratie)
 
k (Admin heeft de pagina Gebruiker:Wim.muskee/Metadateerrobot/Integratie hernoemd naar Gebruiker:Muskee01/Metadateerrobot/Integratie zonder een doorverwijzing achter te laten: Automatisch hernoemd bij het hernoemen van gebruiker "[[User:Wim.muskee...)
 
(geen verschil)

Huidige versie van 3 jul 2018 om 14:29

De voorgaande ontwikkelingen concentreerden zich vooral op het parsen en opslaan van de metadata. Met deze volgende stap is ook de querylog parsing in hetzelfde "code-framework" gezet. Het voordeel van het gebruik van 1 framework is vooral het hergebruik van gemeenschappelijke functies en structuren en het leren van elkaars code.

Beide processesen, metadata en querylog parsing maken gebruik van dezelfde trefwoordentabel, en de daarbij horende functies. Ook slaan beide processen hun trefwoord-vak-aantal combinaties op in een gelijkvorminge database tabel waardoor analyse, en uitvoer functies eenvoudiger zijn te maken voor beide typen content.

uitvoer per trefwoord

De individuele uitvoeren voor "anne frank" zien er als volgt uit:

{
    "keyword": "anne frank",
    "meta": {
        "totalcount": "1719",
        "type": "querylogs"
    },
    "result": [
        {
            "identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
            "label": "Geschiedenis",
            "count": "1719",
            "perc": "100"
        }
    ]
}


{
    "keyword": "anne frank",
    "meta": {
        "totalcount": "48",
        "type": "metadata"
    },
    "result": [
        {
            "identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
            "label": "Geschiedenis",
            "count": "31",
            "perc": "64.6"
        },
        {
            "identifier": "3401cf6e-82e4-404c-b216-b980ff407159",
            "label": "Nederlands",
            "count": "7",
            "perc": "14.6"
        },
        {
            "identifier": "8b194f4d-d757-440d-b8a2-e7427849a6db",
            "label": "Wereldorientatie",
            "count": "4",
            "perc": "8.3"
        },
        {
            "identifier": "ddae0006-230f-4f00-b407-9d358a90a27e",
            "label": "Technisch schrijven",
            "count": "3",
            "perc": "6.3"
        },
        {
            "identifier": "f97e788f-5aa6-4ab4-9448-9e27b79daa9e",
            "label": "Natuur",
            "count": "1",
            "perc": "2.1"
        },
        {
            "identifier": "534ac9f4-f71d-4b46-89e0-dc3f6813da6d",
            "label": "Lezen",
            "count": "1",
            "perc": "2.1"
        },
        {
            "identifier": "aa2f68ba-69e5-415d-8d9b-8d6ab98942b1",
            "label": "Burgerschap",
            "count": "1",
            "perc": "2.1"
        }
    ]
}

Deze uitvoeren kunnen ook worden gecombineerd, waarbij de percentages nu 50-50 worden geaggregeerd.

{
    "keyword": "anne frank",
    "meta": {
        "type": "all"
    },
    "result": [
        {
            "identifier": "ef3a0b2e-0843-4e0a-b45b-788be6e1ec8d",
            "label": "Geschiedenis",
            "perc": "82.3"
        },
        {
            "identifier": "3401cf6e-82e4-404c-b216-b980ff407159",
            "label": "Nederlands",
            "perc": "7.3"
        },
        {
            "identifier": "8b194f4d-d757-440d-b8a2-e7427849a6db",
            "label": "Wereldorientatie",
            "perc": "4.15"
        },
        {
            "identifier": "ddae0006-230f-4f00-b407-9d358a90a27e",
            "label": "Technisch schrijven",
            "perc": "3.15"
        },
        {
            "identifier": "aa2f68ba-69e5-415d-8d9b-8d6ab98942b1",
            "label": "Burgerschap",
            "perc": "1.05"
        },
        {
            "identifier": "534ac9f4-f71d-4b46-89e0-dc3f6813da6d",
            "label": "Lezen",
            "perc": "1.05"
        },
        {
            "identifier": "f97e788f-5aa6-4ab4-9448-9e27b79daa9e",
            "label": "Natuur",
            "perc": "1.05"
        }
    ]
}

Uitvoer alle trefwoorden

In het bovenstaande voorbeeld zou het vak "Geschiedenis" bepalend kunnen zijn voor het trefwoord "anne frank" als we de grenswaarde voor het percentage groter maken dan 50%. Door deze methode te gebruiken kunnen alle trefwoorden worden nagegaan op zo'n combinatie.

In een prototype script is het nu mogelijk om alle vak "best guesses" voor alle trefwoorden te exporteren. Men kan hiervoor grenswaarden instellen voor het minimale percentage, minimaal gebruik en minimaal aantal vakken. Op die manier kunnen we snel een overzicht krijgen van mogelijke combinaties en goed te gebruiken grenswaarden.