Data Operations: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

Sind Sie mit der Geschwindigkeit Ihrer Datenanlyse unzufrieden? Oder haben Ihre Dashboards lange Ladezeiten? Dann können Sie bzw. Ihr Datenbank-Administrator folgenden Hinweisen nachgehen, die sich je nach Datenquelle unterscheiden können.

Allgemeine Empfehlungen zur Performance-Optimierung

Möchten Sie die Geschwindigkeit der Analyse verbessern? Dann beachten Sie folgende Punkte:

  • Benutzen Sie mehrere »kleinere« Datenquellen fĂŒr individuelle Fragestellungen anstatt einer einzigen Datenquelle, die alle Fragestellungen abdecken soll.
  • Verzichten Sie auf nicht notwendige VerknĂŒpfungen.
  • Aktivieren Sie in Tableau die Option »Referentielle IntegritĂ€t voraussetzen« im »Daten«-MenĂŒ (siehe Abbildung 2.20). Wenn Sie diese Option verwenden, schließt Tableau die verknĂŒpften Tabellen nur dann in die Datenabfrage ein, wenn sie explizit in der Ansicht verwendet wird*. Wenn Ihre Daten nicht ĂŒber referentielle IntegritĂ€t verfĂŒgen, sind die Abfrageergebnisse möglicherweise ungenau.
Aktivierte Option „Referentielle IntegritĂ€t voraussetzen“ im „Daten“-MenĂŒ
Abbildung 2.20: Aktivierte Option »Referentielle IntegritĂ€t voraussetzen« im »Daten«-MenĂŒ

* So wird beispielsweise der Umsatz anstatt mit der SQL-Abfrage SELECT SUM([Sales Amount]) FROM [Sales] S INNER JOIN [Product Catalog] P ON S.ProductID = P.ProductID lediglich mit der SQL-Abfrage SELECT SUM([Sales Amount]) FROM [Sales] ermittelt.

Empfehlungen fĂŒr Performance-Optimierung bei Dateien und Cloud-Diensten

Achten Sie insbesondere beim Arbeiten mit Dateiformaten, wie Excel-, PDF- oder Textdateien, oder Daten aus Cloud-Diensten wie Google Tabellen zusÀtzlich auf folgende Punkte:

  • Verzichten Sie auf Vereinigungen ĂŒber viele Dateien hinweg, da deren Verarbeitung sehr zeitintensiv ist.
  • Nutzen Sie einen Datenextrakt anstatt einer Live-Verbindung, falls Sie nicht mit einem schnellen Datenbanksystem arbeiten (siehe Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden).
  • Stellen Sie sicher, dass Sie beim Erstellen des Extrakts die Option »Einzelne Tabelle« wĂ€hlen, anstatt der Option »Mehrere Tabellen« (siehe Abbildung 2.21). Dadurch wird das erzeugte Extrakt zwar grĂ¶ĂŸer und das Erstellen des Extrakts dauert lĂ€nger, das Abfragen hingegen wird um ein Vielfaches beschleunigt.
AusgewĂ€hlte Option „Einzelne Tabelle“ im „Daten extrahieren“-Dialog
Abbildung 2.21: AusgewÀhlte Option »Einzelne Tabelle« im »Daten extrahieren«-Dialog

Empfehlungen fĂŒr Performance-Optimierung bei Datenbank-Servern

Arbeiten Sie mit Daten auf einem Datenbank-Server, wie Oracle, PostgreSQL oder Microsoft SQL Server, und möchten die Zugriffszeiten verbessern? Dann achten Sie bzw. der dafĂŒr zustĂ€ndige Datenbankadministrator zusĂ€tzlich auf folgende Punkte:

  • Definieren Sie fĂŒr Ihre Datenbank-Tabellen sinnvolle Index-Spalten.
  • Legen Sie fĂŒr Ihre Datenbank-Tabellen Partitionen an.

Dieser Beitrag ist der dritte Teil der Data-Operations-Serie:

Teil 1: Daten fĂŒr die Analyse optimal vorbereiten
Teil 2: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden
Teil 3: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

Außerdem basiert dieser Blog-Post auf einem Unterkapitel des Buches “Datenvisualisierung mit Tableau“:

Datenvisualisierung mit Tableau
  • Alexander Loth
  • Publisher: mitp
  • Edition no. 2018 (31.07.2018)
  • Broschiert: 224 pages