Die Datengranularität ist der Detailgrad der Daten. Sie beschreibt, wie detailliert unsere Daten sind, z. B. pro Tag, pro Stunde oder Minute bei Time-Series Analyse. Die Granularität geht Hand in Hand mit der Aggregation. Durch die Aggregation geht ein gewisses Maß an Granularität verloren, oder anders ausgedrückt, es werden weniger Datenpunkte dargestellt. Andererseits steigt die Granularität mit der Anzahl der Dimensionen, die wir verwenden. Je höher die Granularität, desto schwieriger ist die Visualisierung. An dieser Stelle kommt LOD ins Spiel.
LOD (Level of Details) ist eine Funktion in Tableau, die Berechnungen ermöglicht, die in der Visualisierung nicht angezeigt werden. Dies ist sehr nützlich, da Tableau nur die Detailstufen (Level-of-Detail) berechnet, die in der Visualisierung angezeigt werden. Daher gibt es keine Möglichkeit, einen gewünschten Detailgrad zu haben, ohne ihn in der Tableau-Canvas anzuzeigen, wenn wir LOD nicht einsetzen. Kurz gesagt, es wird im Backend berechnet, ohne auf die Dimensionen in der Ansicht zu verweisen.
In Tableau gibt es 3 LODs:
- INCLUDE für Berechnungen auf einem niedrigeren Level-of-Detail
- EXCLUDE für die Berechnung auf einem höheren Level-of-Detail
- FIXED für die Berechnung auf einem bestimmten Level-of-Detail
Diese LODs haben eine ähnliche Syntax:
{ INCLUDE/EXCLUDE/FIXED [CustomerID]: Aggregierter Ausdruck, zum Beispiel SUM([PurchasedItems]) }
Wir können 0, 1 oder mehr Dimensionen haben, die durch ein Komma getrennt sind, nicht nur CustomerID im obigen Fall. Ich habe LOD in meiner Kohortenanalyse verwendet, um den ersten Kauf eines Kunden wie folgt zu berechnen:
{ FIXED [CustomerID]: MIN([OrderDate]) }
Im Gegensatz zum FIXED-Ausdruck, der unabhängig von den Dimensionen im Canvas das gleiche Ergebnis liefert, ändern INCLUDE und EXCLUDE die Berechnung, wenn wir Dimensionen zum Canvas hinzufügen oder aus ihm entfernen.
Im nächsten Beitrag möchte ich LOD in der Praxis diskutieren, da ich herausgefunden habe, dass LOD-Berechnungen unterschiedliche Ergebnisse liefern können, obwohl wir denselben INCLUDE/EXCLUDE-Ausdruck verwenden. Dies ist sehr wichtig, da wir trotz korrektem LOD-Ausdruck unerwünschte und scheinbar korrekte Ergebnisse erhalten können.