Het maken van een rapportage in een Analytics Tool heeft veel vereisten. Een daarvan is het opzetten van de data architectuur. Wij beschouwen dit als de belangrijkste stap in het proces om een Analytics rapportage in elkaar te knutselen. Dit artikel zal onze bevindingen bij langs gaan wat betreft het opzetten van een data architectuur.
Boodschappenlijst
Bij het creëren van een rapportage weet je wat voor rapportage het eindproduct moet zijn, maar hoe maak je deze rapportage? Welke datasets van welke applicaties zijn nodig? Bedenk welke data nodig is voor de rapportage die je wil maken, bij een import van teveel onnodige data belast je het systeem onnodig veel en wordt het maken van zowel relaties als rapportages veel moeilijker dan nodig is.
In de blog ‘Wat is Power BI en waarom moet jij het kennen?’ introduceerde we het fictieve bedrijf EEBC B.V., een handelsbedrijf dat meubilair verkoopt in de EU en een aantal landen daarbuiten. EEBC wil graag weten wat de omzet per medewerker is, hiervoor haal je uit je administratie, vaak een ERP-systeem een bestand met al de namen van je werknemers Daarnaast wordt de omzet uit het boekhoudpakket onttrokken (in de omzet moet wel staan wel een verwijzing staat wie verantwoordelijk was voor de verkoop.
Links, het bestand van de verkoopmedewerkers van EEBC B.V. Dit heeft verder geen aanpassingen nodig om functioneel te zijn. Daarnaast hebben de omzet nodig, dit komt vrij in de vorm van een orderbestand, in dit voorbeeld. Hieronder het orderbestand van EEBC B.V. Waarbij de verkoopprijs, het aantal en de verkoper.
Afbeelding 1: Medewerkersbestand van EEBC (fictief)
Afbeelding 2: Orderbestand van EEBC (fictief)
Als je de benodigde data hebt, dan is de volgende stap om uit te zoeken welke applicatie deze data heeft en in welke vorm deze data in het systeem staat. Voor veel Analytics Tools ligt de voorkeur voor bestandstype bij een dataset die geen aanpassingen nodig heeft. Al zullen bepaalde tools de mogelijkheid hebben om een aantal standaardaanpassingen te maken in een importbestand, is het wenselijk om een bestand aan te leveren met alleen kolomtitels en data.
Natuurlijk is het niet altijd mogelijk om ideale dataset vanuit de applicatie te exporteren. In zo’n geval zal je handmatig aanpassingen moeten maken in de export van de dataset. Het is in zo’n geval goed om te noteren welke handelingen je maakt en deze op te slaan. Om hier een voorbeeld voor te nemen gaan we terug naar het fictieve bedrijf, EEBC B.V.
Dit is het medewerkersbestand van EEBC B.V. Hiervoor willen we de volledige naam kunnen tonen. Met een klein bestand is dit nog te overzien, om handmatig over te typen, maar met grotere datasets moet dit snel gedaan kunnen worden.
Afbeelding 3: Medewerkersbestand van EEBC (fictief)
Afbeelding 4: Voorbeeld van datatransformatie van medewerkersbestand EEBC (fictief)
In de bovenstaande formule wordt dit gedaan. Dit is een voorbeeld van datatransformatie. Voordat je datasets importeert moet je deze handelingen maken.
Importeren
Dit zal van de ene applicatie naar de andere verschillen, maar er zijn veel mogelijkheden wat betreft het importeren van data. Zoals eerder is aangegeven, is het gebruik van kant en klare bestanden het best, in onze ervaring. Als je de data eenmaal hebt geïmporteerd zal je schoonheidsfoutjes moeten opruimen en de benodigde aanpassingen moeten maken in de Analytics tool om de data gereed te maken voor gebruik.
Nu ben je klaar om de droomrapportage te maken, maar eerst nog een klein klusje. Dit is de laatste! Het leggen van relaties tussen de datasets die je hebt geïmporteerd. Door deze stap goed uit te voeren kan je bijvoorbeeld de omzet per artikel inzien. Hiervoor moet je het artikelbestand kunnen linken aan je transactie of omzetbestand. Als je veel artikelen in je voorraad hebt en categorieën voor je artikelen hebt, kan je door deze stap ook de omzet per categorie inzien. De sleutel achter deze stap is om de gegevens te herkennen en de unieke code van de dataset in te zien en deze variabele terug te kunnen vinden in andere datasets.
Met een één op één relatie, kan je bepaalde databases wat overzichtelijker houden, maar zijn niet nodig en ook niet zeer gewoonlijk. Een veel op veel relatie, komt voor als je bijvoorbeeld een student hebt die een bepaalde les volgt. In dat geval zijn er meer studenten die deze ene les volgen, maar deze ene student kan ook meerdere lessen volgen. Een veel op veel relatie dus.
Databasemodellen
Wat betreft het leggen van relaties tussen datasets zijn er in hoofdlijnen twee opties. Voor kleinere datasets wordt het ster model gezien als optimaal. Bij dit model wordt er een centraal bestand aangehouden en maken alle andere datasets een connectie met het centraal bestand, maar niet met andere bestanden. Er is bij dit model altijd sprake van een één op veel relatie naar het hoofdbestand.
Afbeelding 5: Een voorbeeld van het Stermodel
Aan de andere hand staat het snowflake model. In dit model wordt er in het transactiebestand in principe dezelfde data meegenomen. Al moet wel gezegd worden dat het snowflake model meer optimaal werkt, vooral in vergelijking met het stermodel, in grote datasets. Veel concepten blijven hetzelfde zoals het centrale bestand. Alleen worden datasets die informatie aan het centrale bestand leveren verder uitgesplitst.
Afbeelding 6: Een voorbeeld van het snowflakemodel
Nu ben je klaar en kan je rapportages en Analytics maken!
Hulp nodig bij het maken van managementrapportages of ben je geïnteresseerd in een professional in de onderneming? Kijk eens naar onze boekhoud– en controllingpakketten. Geintereseerd? Neem dan contact met ons op!