Datenbankstruktur (4) - Vorteile, Nachteile

In den vorherigen Artikeln dieser Serie wurde schon über zwei Datenbankschema diskutiert: Star-Schema und Snowflake-Schema. Visuelle Unterschiede kann man schon von den Abbildungen sehen, aber wann sollte man eine nutzen, und wann sollte man die andere nutzen? Hier diskutieren wir über die Vor- und Nachteile jedes Schemas.

Star Schema: Vorteile

  • Einfacher Aufbau, einfach zu verstehen
    Ganz straightforward: die Dimensionstabelle hat nur eine Referenzspalte, und daher ist es einfacher aufzubauen und man muss sich nicht mit tiefen Strukturhierarchien zu beschäftigen. Es ist auch einfacher zu verstehen, weil man die Referenzspalte in der Faktentabelle sehen und die dazugehörigen Dimensionstabellen sofort finden kann.
  • Gute Performance
    Aufruf von spezifischen Informationen ist schneller, weil die Dimensionstabellen direkt "unter" der Faktentabelle in der Strukturhierarchie sich befinden.

Star Schema: Nachteile

  • Tendenziell große Dimensionstabelle
    Da es nur eine Stufe der Dimensionstabelle in der Hierarchie ist, kann es schon vorkommen, dass manche Dimensionstabelle zu viele Informationen beinhaltet. Hat man noch weitere Details zu einer Spalte der Faktentabelle, wird es dann immer in derselben Dimensionstabelle gespeichert.
  • Geringes Potenzial gegen komplexen Abfragen
    Da alle Dimensionstabellen direkt zu der Faktentabelle verknüpft sind, kann es kompliziert sein, wenn man spezifische Informationen aus unterschiedlichen Dimensionstabellen aufrufen möchte.

Snowflake Schema: Vorteile

  • Wenigere Nutzung der Speicherplatzkapazität
    Da die Dimensionstabellen weitere "Kindertabelle" haben, die auf der unteren Stufe der Strukturhierarchie liegen, hat das ganze Schema zwar mehr Tabellen, aber diese Methode kann seht gut die Datenredundanz vermeiden.

Snowflake Schema: Nachteile

  • Komplexität
    Wegen der mehrstufigen Hierarchie kommt es zu einem komplizierteren Aufbau sowie komplizierteren Aufruf spezifischer Daten, weil um die Daten in einer tieferen Stufe aufzurufen, müssen mehrere Referenzspalten angewendet bzw. mehrere JOINs gemacht werden.
  • Langsamer Prozess
    Werden mehrere JOINs durchgeführt, kann es zu einem höheren Ressourcenverbrauch führen, welche auch länger dauert als wenn der Computer nur eine oder zwei JOINs macht.

Fazit

  • Star Schema kann man gut auswählen, wenn eine Datenredundanz kein großes Problem sein sollte und wenn man eine simple Datenstruktur aufbauen möchte.
  • Snowflake Schema ist sinnvoll auszuwählen, wenn man die Daten komplexer verwalten möchte, im Sinne, man hat zwar mehr Tabellen, aber sie beinhalten wirklich nur die Detailinformationen zu einem spezifischen Thema und nicht mit anderen Themen gemischt.
Author:
Muhammad Dimas Abdul Aziz Cakradewa
Powered by The Information Lab
1st Floor, 25 Watling Street, London, EC4M 9BR
Subscribe
to our Newsletter
Get the lastest news about The Data School and application tips
Subscribe now
© 2025 The Information Lab