#TC18 Visual Diary: One Big-Easy Data Fest

Iron Viz contest at Tableau Conference TC18 in New Orleans
Iron Viz contest at Tableau Conference TC18 in New Orleans

Let me share some (personal) Tableau Conference #TC18 experiences with you!

Oct 22

Registration

Viz for Social Good

Welcome Reception

Oct 23

Opening Keynote

My 1st Session | Rock your Social Media Data with Tableau

Data Village | Diversity and Inclusion

Community Appreciation Reception

Oct 24

Keynote | Devs On Stage

My 2nd Session | Rock your Social Media Data with Tableau

Tableau User Group | Tip Battle

Iron Viz

Data Night Out

Oct 25

Keynote | Adam Grant

Data Village

Fanalytics

Goodbye

What are your #TC18 highlights?

Share your favorite moments in the blog post comments or reply to this tweet:

Data Operations: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

Nachdem Sie Ihre Daten fĂŒr die Analyse optimal vorbereitet haben, stellt sich die Frage auf welche Weise Sie Ihre Daten bereithalten wollen, damit Sie schnell erste Erkenntnisse erhalten.

Tableau bietet Ihnen fĂŒr die meisten Datenquellen die Möglichkeit, zwischen einer Live-Verbindung, also einer direkten Verbindung zur Datenbank, und einem Datenextrakt, also einem Abzug der Daten zu wĂ€hlen. Wie Abbildung 1.1 zeigt, können Sie einfach zwischen beiden Verbindungstypen wechseln.

Auswahlknöpfe, um zwischen Live-Verbindung und Datenextrakt zu wechseln
Abbildung 1.1: Auswahlknöpfe, um zwischen Live-Verbindung und Datenextrakt zu wechseln

Live-Verbindungen ermöglichen Ihnen die Arbeit mit den Daten, wie sie zum momentanen Zeitpunkt auf der Datenbank oder der Datei vorliegen. Wenn Sie Daten extrahieren, importieren Sie einige oder alle Daten in die Data Engine von Tableau. Dies gilt sowohl fĂŒr Tableau Desktop als auch fĂŒr Tableau Server. Welche Verbindungsmethode Sie bevorzugen sollten, hĂ€ngt von Ihrer Situation und dem Anwendungsfall, Ihren Anforderungen sowie von der VerfĂŒgbarkeit der Datenbank und der Netzwerkbeschaffenheit ab.

Immer aktuell mit der Live-Verbindung

Durch die direkte Verbindung mit Ihrer Datenquelle visualisieren Sie immer die aktuellsten Daten, die Ihnen die Datenbank zur VerfĂŒgung stellt. Wenn Ihre Datenbank in Echtzeit aktualisiert wird, mĂŒssen Sie die Tableau-Visualisierung nur ĂŒber die Funktionstaste F5 aktualisieren oder indem Sie mit der rechten Maustaste auf die Datenquelle klicken und die Option Aktualisieren auswĂ€hlen.

Wenn Sie eine Verbindung zu großen Datenmengen herstellen, die Visualisierung sehr viele Details enthĂ€lt oder Ihre Daten in einer leistungsstarken Datenbank mit entsprechend ausgestatteter Hardware gespeichert sind, können Sie mit einer direkten Verbindung eine schnellere Antwortzeit erzielen.

Die Auswahl einer direkten Verbindung schließt nicht die Möglichkeit aus, die Daten spĂ€ter zu extrahieren. Andersherum können Sie auch wieder von einem Extrakt zu einer Live-Verbindung wechseln, indem Sie mit der rechten Maustaste auf die Datenquelle klicken und die Option Extrakt verwenden deaktivieren.

UnabhÀngig mit einem Datenextrakt

Datenextrakte haben naturgemĂ€ĂŸ nicht den Vorteil, dass sie in Echtzeit aktualisiert werden, wie es bei einer Live-Verbindung der Fall ist. Die Verwendung der Data Engine von Tableau bietet jedoch eine Reihe von Vorteilen:

Leistungsverbesserung bei langsamen Datenquellen:

Vielleicht ist Ihre Datenbank stark mit Anfragen belastet oder bereits mit transaktionalen Operationen beschĂ€ftigt. Mithilfe der Data Engine können Sie Ihre Datenbank entlasten und die Datenhaltung von Tableau ĂŒbernehmen lassen. Extrakte können Sie am besten außerhalb der Stoßzeiten aktualisieren. Tableau Server kann Extrakte auch zu festgelegten Zeitpunkten aktualisieren, zum Beispiel nachts um 3 Uhr.

Inkrementelles Extrahieren:

Durch das inkrementelle Extrahieren wird auch die Aktualisierungszeit beschleunigt, da Tableau nicht die gesamte Extraktdatei aktualisiert. Es fĂŒgt nur neue DatensĂ€tze hinzu. Um inkrementelle Extrakte auszufĂŒhren, mĂŒssen Sie ein Feld angeben, das als Index verwendet werden soll. Tableau aktualisiert die Zeile nur, wenn sich der Index geĂ€ndert hat. Daher mĂŒssen Sie beachten, dass Änderungen an einer Datenzeile, die das Indexfeld nicht Ă€ndert, von der Aktualisierung nicht berĂŒcksichtigt werden.

Datenmenge mit Filtern einschrÀnken:

Eine andere Möglichkeit, Extrakte zu beschleunigen, besteht darin, beim Extrahieren der Daten Filter anzuwenden. Wenn fĂŒr die Analyse nicht die gesamte Datenmenge benötigt wird, können Sie den Extrakt so filtern, dass er nur die erforderlichen DatensĂ€tze enthĂ€lt. Wenn Sie eine sehr große Datenmenge haben, mĂŒssen Sie nur selten den gesamten Inhalt der Datenbank extrahieren. Zum Beispiel kann Ihre Datenbank Daten fĂŒr viele Regionen enthalten, aber Sie benötigen möglicherweise nur die Daten zur Region »SĂŒd«.

Um einen Extrakt entsprechend anzulegen, wĂ€hlen Sie als Verbindung Extrakt aus und klicken dann auf das nebenstehende Bearbeiten. Es öffnet sich das Fenster Daten extrahieren. Mit einem weiteren Klick auf HinzufĂŒgen können Sie nun einen Filter erstellen, der fĂŒr Ihren Extrakt angewandt wird (siehe Abbildung 1.2).

Der Datenextrakt kann mit Filtern eingeschrÀnkt werden
Abbildung 1.2: Der Datenextrakt kann mit Filtern eingeschrÀnkt werden

Weitere Funktionen fĂŒr bestimmte Datenquellen:

Wenn Ihre Daten aus einer bestimmten Datenquelle stammen, so sind unter anderem Aggregationsfunktion wie Median (beispielsweise bei Access-Datenbanken ) bei einer Live-Verbindung nicht verfĂŒgbar. Arbeiten Sie mit einem Extrakt, können Sie diese Funktionen nutzen, auch wenn sie von der ursprĂŒnglichen Datenquelle nicht unterstĂŒtzt werden.

DatenĂŒbertragbarkeit:

Sie können Extrakte lokal speichern und auch dann verwenden, wenn die Verbindung zu Ihrer Datenquelle nicht verfĂŒgbar ist. Eine Live-Verbindung funktioniert nicht, wenn Sie nicht ĂŒber ein lokales Netzwerk oder das Internet auf Ihre Datenquelle zugreifen können. Extrakte werden außerdem komprimiert und sind normalerweise wesentlich kleiner als die ursprĂŒnglichen Datenbanktabellen, was dem Weitertransport der Daten zugutekommt.

Achten Sie auf Datenschutz und Data Governance

In Unternehmen spielen Datenschutz und Data Governance und damit verbunden IntegritĂ€t und Sicherheit der Daten eine wichtige Rolle. Wenn Sie Extrakte an Mitarbeiter oder GeschĂ€ftspartner verteilen, sollten Sie die etwaige Vertraulichkeit Ihrer Daten berĂŒcksichtigen. Ziehen Sie in Betracht, den Inhalt des Extrakts ĂŒber Filter einzuschrĂ€nken und zu sichtbaren Dimensionen zu aggregieren.

Sind Sie sich unsicher, arbeiten Sie im Zweifelsfall besser mit einer Live-Verbindung, da in diesem Fall Ihre Datenbank das Rechte-Management steuert und so Ihre Daten nicht von Personen ohne ausreichende Berechtigungen gesehen werden können.

Dieser Beitrag ist der dritte Teil der Data-Operations-Serie:

Teil 1: Daten fĂŒr die Analyse optimal vorbereiten
Teil 2: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden
Teil 3: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

Außerdem ist dieser Blog-Post ein Auszug aus dem Buch “Datenvisualisierung mit Tableau“, das am 31. Juli 2018 erschienen ist:

Datenvisualisierung mit Tableau
  • Alexander Loth
  • Publisher: mitp
  • Edition no. 2018 (31.07.2018)
  • Broschiert: 224 pages

Das Tableau-Buch ist ab sofort im Handel erhÀltlich

Das erste deutschsprachige Tableau-Buch ist auch bei Amazon erhÀltlich
Das erste deutschsprachige Tableau-Buch ist auch bei Amazon erhÀltlich

Das Buch “Datenvisualisierung mit Tableau” ist ab sofort im Handel erhĂ€ltlich:

Vorschau:

Mehr erfahren:

Erfahren Sie mehr zu “Datenvisualisierung mit Tableau” auf der Webseite zum Tableau-Buch!

[Update 11 Aug 2018]: In den InformatikbĂŒcher-Top-20 bei Amazon!
[Update 17 Aug 2018]: In den InformatikbĂŒcher-Top-10 bei Amazon!

Datenvisualisierung mit Tableau: Tableau-Buch ab sofort vorbestellbar

Das erste deutschsprachige Tableau-Buch enthÀlt auch ein Kapitel zur Datenaufbereitung mit Tableau Prep
Das erste deutschsprachige Tableau-Buch enthÀlt auch ein Kapitel zur Datenaufbereitung mit Tableau Prep

Mein Buch “Datenvisualisierung mit Tableau” kann ab sofort vorbestellt werden:

Bevor ich nun selbst viel zum Buch schreibe, gebe ich einfach mal einen Auszug aus dem Umschlagtext wieder:

Visualisieren Sie Ihre Daten schnell und ausdrucksstark mit Tableau, um praktisch umsetzbare Ergebnisse zu erhalten. Alexander Loth zeigt Ihnen Schritt fĂŒr Schritt, wie Sie ganz einfach visuelle Analysen erstellen und so selbst komplexe Datenstrukturen verstehen sowie gewonnene Erkenntnisse effektiv kommunizieren können.

Das Buch richtet sich an:

  • Menschen, die Zugang zu Daten haben und diese verstehen möchten
  • FĂŒhrungskrĂ€fte, die Entscheidungen auf Grundlage von Daten treffen
  • Analysten und Entwickler, die Visualisierungen und Dashboards erstellen
  • angehende Data Scientists

Zum VerstĂ€ndnis dieses Buches sind weder besondere mathematische FĂ€higkeiten noch Programmiererfahrung nötig. Es eignet sich daher auch fĂŒr Einsteiger und Anwender, die sich dem Thema Datenvisualisierung und -analyse praxisbezogen und ohne ausschweifende theoretische Abhandlungen, nĂ€hern möchten.

Die grundlegenden Funktionen von Tableau werden Schritt fĂŒr Schritt erlĂ€utert und Sie lernen, welche Visualisierungsmöglichkeiten wann sinnvoll sind. Der Autor zeigt Fallbeispiele auf, die weit ĂŒber eine »Standard-Analyse« hinausreichen und geht auf Funktionen ein, die selbst erfahrenen Nutzern oft nicht hinlĂ€nglich bekannt sind. Sie erhalten außerdem Hinweise und Tipps, die das Arbeiten mit Tableau erleichtern, und können so zukĂŒnftig Ihre eigenen Daten bestmöglich visualisieren und analysieren.

[Update 25 Jul 2018]: Hier ist das erste Exemplar ganz druckfrisch:

Data Operations: Daten fĂŒr die Analyse optimal vorbereiten

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

KĂŒrzlich habe ich einige Blog-Posts zum Thema Datenstrategie veröffentlicht. FĂŒr viele Unternehmen geht die Entwicklung und EinfĂŒhrung einer Datenstrategie nicht tief genug. HĂ€ufig habe ich Ă€hnliches gehört: “So weit ist unser Unternehmen noch gar nicht. Wir haben noch viel operativ vorzubereiten, bevor wir eine Datenstrategie voll umfĂ€nglich etablieren können.”

Ich habe in diesen GesprĂ€chen nachgehakt, wo diese grundlegenden LĂŒcken in den Unternehmen bestehen, und entschlossen eine neue Blog-Post-Serie aufzusetzen, um zum Thema Data Operations (#dataops) konkrete und einfach umsetzbare VorschlĂ€ge zu geben.

Daten fĂŒr die Analyse vorbereiten

Eine der wesentlichen Fragen, die sich Datenanalysten immer wieder stellen, lautet: “Gibt es eine Möglichkeit meine Daten fĂŒr die Verwendung mit Analysewerkzeugen, wie Tableau, optimal vorzubereiten?”

Daten können auf unterschiedliche Arten strukturiert sein. Die meisten neuen Tableau-Anwender erliegen der Versuchung, Tableau mit einem bereits formatierten und voraggregierten Excel-Bericht (siehe Abbildung 1.1) zu verbinden und diesen in Tableau zu visualisieren. Heißt es nicht mit Tableau können Daten jeder Art einfach und intuitiv verwenden werden? Sehr schnell stellt man fest, dass ein solches Vorgehen nicht funktioniert, wie erwartet und sich so auch keine Visualisierungen erstellen lassen.

Abbildung 1.1: Bereits formatierter und voraggregierter Excel-Bericht
Abbildung 1.1: Bereits formatierter und voraggregierter Excel-Bericht

Dieses Szenario, dem viele Einsteiger begegnen, ist nicht ungewöhnlich und tatsÀchlich ein hÀufiger Stolperstein bei der Einarbeitung in Tableau, der die Analyse Ihrer Daten erschweren kann.

Die folgenden Punkte zeigen Ihnen VorschlÀge zur sauberen Vorbereitung Ihrer Daten anhand des Beispielberichts:

  • Verzichten Sie auf den einleitenden Text (“Temperaturmessung zum Monatsbeginn”).
  • ÜberfĂŒhren Sie hierarchische Überschriften (“Frankfurt”, “Berlin”) auf eine Spalteninformation (neue Spalte “Ort”).
  • Pivotisieren Sie Daten von einer “weiten” Kreuztabelle mit Variablen in Spalten (“FrĂŒh”, “Mittag”, “Abend”) in eine “lange” Tabelle, die die Variablen stets in den Zeilen trĂ€gt (in diesem Beispiel die Uhrzeit).
  • Nutzen Sie vollstĂ€ndige Datums- und ggf. Zeitformate (“01.04.2018 06:00”) anstatt z.B. nur den Monatsnamen (“April”).
  • ÜberprĂŒfen Sie, dass Zahlen im Zahlenformat und nicht im Textformat gespeichert sind.
  • Verzichten Sie voraggregierte Daten (“Durchschnitt”, “Gesamtdurchschnitt”).
  • Entfernen Sie leere Zeilen.
  • Achten Sie darauf, dass jede Spate eine aussagekrĂ€ftige SpaltenĂŒberschrift trĂ€gt.

Haben Sie diese VorschlĂ€ge befolgt, ist aus Ihrer “weiten” Kreuztabelle nun eine “lange” Zeilen-basierte Tabelle geworden, und damit die perfekte Basis zur umfangreichen Datenanalyse (siehe Abbildung 1.2).

Abbildung 1.2: Zur Datenanalyse geeignete „lange Tabelle“ ohne Aggregationen
Abbildung 1.2: Zur Datenanalyse geeignete „lange Tabelle“ ohne Aggregationen

Dieser Beitrag ist der dritte Teil der Data-Operations-Serie:

Teil 1: Daten fĂŒr die Analyse optimal vorbereiten
Teil 2: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden
Teil 3: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

Außerdem ist dieser Blog-Post ein Auszug aus dem Buch “Datenvisualisierung mit Tableau“, das am 31. Juli 2018 erscheinen wird:

Datenvisualisierung mit Tableau
  • Alexander Loth
  • Publisher: mitp
  • Edition no. 2018 (31.07.2018)
  • Broschiert: 224 pages