Data Operations: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

Nachdem Sie Ihre Daten für die Analyse optimal vorbereitet haben, stellt sich die Frage auf welche Weise Sie Ihre Daten bereithalten wollen, damit Sie schnell erste Erkenntnisse erhalten.

Tableau bietet Ihnen für die meisten Datenquellen die Möglichkeit, zwischen einer Live-Verbindung, also einer direkten Verbindung zur Datenbank, und einem Datenextrakt, also einem Abzug der Daten zu wählen. Wie Abbildung 1.1 zeigt, können Sie einfach zwischen beiden Verbindungstypen wechseln.

Auswahlknöpfe, um zwischen Live-Verbindung und Datenextrakt zu wechseln
Abbildung 1.1: Auswahlknöpfe, um zwischen Live-Verbindung und Datenextrakt zu wechseln

Live-Verbindungen ermöglichen Ihnen die Arbeit mit den Daten, wie sie zum momentanen Zeitpunkt auf der Datenbank oder der Datei vorliegen. Wenn Sie Daten extrahieren, importieren Sie einige oder alle Daten in die Data Engine von Tableau. Dies gilt sowohl für Tableau Desktop als auch für Tableau Server. Welche Verbindungsmethode Sie bevorzugen sollten, hängt von Ihrer Situation und dem Anwendungsfall, Ihren Anforderungen sowie von der Verfügbarkeit der Datenbank und der Netzwerkbeschaffenheit ab.

Immer aktuell mit der Live-Verbindung

Durch die direkte Verbindung mit Ihrer Datenquelle visualisieren Sie immer die aktuellsten Daten, die Ihnen die Datenbank zur Verfügung stellt. Wenn Ihre Datenbank in Echtzeit aktualisiert wird, müssen Sie die Tableau-Visualisierung nur über die Funktionstaste F5 aktualisieren oder indem Sie mit der rechten Maustaste auf die Datenquelle klicken und die Option Aktualisieren auswählen.

Wenn Sie eine Verbindung zu großen Datenmengen herstellen, die Visualisierung sehr viele Details enthält oder Ihre Daten in einer leistungsstarken Datenbank mit entsprechend ausgestatteter Hardware gespeichert sind, können Sie mit einer direkten Verbindung eine schnellere Antwortzeit erzielen.

Die Auswahl einer direkten Verbindung schließt nicht die Möglichkeit aus, die Daten später zu extrahieren. Andersherum können Sie auch wieder von einem Extrakt zu einer Live-Verbindung wechseln, indem Sie mit der rechten Maustaste auf die Datenquelle klicken und die Option Extrakt verwenden deaktivieren.

Unabhängig mit einem Datenextrakt

Datenextrakte haben naturgemäß nicht den Vorteil, dass sie in Echtzeit aktualisiert werden, wie es bei einer Live-Verbindung der Fall ist. Die Verwendung der Data Engine von Tableau bietet jedoch eine Reihe von Vorteilen:

Leistungsverbesserung bei langsamen Datenquellen:

Vielleicht ist Ihre Datenbank stark mit Anfragen belastet oder bereits mit transaktionalen Operationen beschäftigt. Mithilfe der Data Engine können Sie Ihre Datenbank entlasten und die Datenhaltung von Tableau übernehmen lassen. Extrakte können Sie am besten außerhalb der Stoßzeiten aktualisieren. Tableau Server kann Extrakte auch zu festgelegten Zeitpunkten aktualisieren, zum Beispiel nachts um 3 Uhr.

Inkrementelles Extrahieren:

Durch das inkrementelle Extrahieren wird auch die Aktualisierungszeit beschleunigt, da Tableau nicht die gesamte Extraktdatei aktualisiert. Es fügt nur neue Datensätze hinzu. Um inkrementelle Extrakte auszuführen, müssen Sie ein Feld angeben, das als Index verwendet werden soll. Tableau aktualisiert die Zeile nur, wenn sich der Index geändert hat. Daher müssen Sie beachten, dass Änderungen an einer Datenzeile, die das Indexfeld nicht ändert, von der Aktualisierung nicht berücksichtigt werden.

Datenmenge mit Filtern einschränken:

Eine andere Möglichkeit, Extrakte zu beschleunigen, besteht darin, beim Extrahieren der Daten Filter anzuwenden. Wenn für die Analyse nicht die gesamte Datenmenge benötigt wird, können Sie den Extrakt so filtern, dass er nur die erforderlichen Datensätze enthält. Wenn Sie eine sehr große Datenmenge haben, müssen Sie nur selten den gesamten Inhalt der Datenbank extrahieren. Zum Beispiel kann Ihre Datenbank Daten für viele Regionen enthalten, aber Sie benötigen möglicherweise nur die Daten zur Region »Süd«.

Um einen Extrakt entsprechend anzulegen, wählen Sie als Verbindung Extrakt aus und klicken dann auf das nebenstehende Bearbeiten. Es öffnet sich das Fenster Daten extrahieren. Mit einem weiteren Klick auf Hinzufügen können Sie nun einen Filter erstellen, der für Ihren Extrakt angewandt wird (siehe Abbildung 1.2).

Der Datenextrakt kann mit Filtern eingeschränkt werden
Abbildung 1.2: Der Datenextrakt kann mit Filtern eingeschränkt werden

Weitere Funktionen für bestimmte Datenquellen:

Wenn Ihre Daten aus einer bestimmten Datenquelle stammen, so sind unter anderem Aggregationsfunktion wie Median (beispielsweise bei Access-Datenbanken ) bei einer Live-Verbindung nicht verfügbar. Arbeiten Sie mit einem Extrakt, können Sie diese Funktionen nutzen, auch wenn sie von der ursprünglichen Datenquelle nicht unterstützt werden.

Datenübertragbarkeit:

Sie können Extrakte lokal speichern und auch dann verwenden, wenn die Verbindung zu Ihrer Datenquelle nicht verfügbar ist. Eine Live-Verbindung funktioniert nicht, wenn Sie nicht über ein lokales Netzwerk oder das Internet auf Ihre Datenquelle zugreifen können. Extrakte werden außerdem komprimiert und sind normalerweise wesentlich kleiner als die ursprünglichen Datenbanktabellen, was dem Weitertransport der Daten zugutekommt.

Achten Sie auf Datenschutz und Data Governance

In Unternehmen spielen Datenschutz und Data Governance und damit verbunden Integrität und Sicherheit der Daten eine wichtige Rolle. Wenn Sie Extrakte an Mitarbeiter oder Geschäftspartner verteilen, sollten Sie die etwaige Vertraulichkeit Ihrer Daten berücksichtigen. Ziehen Sie in Betracht, den Inhalt des Extrakts über Filter einzuschränken und zu sichtbaren Dimensionen zu aggregieren.

Sind Sie sich unsicher, arbeiten Sie im Zweifelsfall besser mit einer Live-Verbindung, da in diesem Fall Ihre Datenbank das Rechte-Management steuert und so Ihre Daten nicht von Personen ohne ausreichende Berechtigungen gesehen werden können.

Dieser Blog-Post ist ein Auszug aus dem Buch “Datenvisualisierung mit Tableau“, das am 31. Juli 2018 erschienen ist:

Datenvisualisierung mit Tableau
  • Alexander Loth
  • Publisher: mitp
  • Edition no. 2018 (31.07.2018)
  • Broschiert: 224 pages

Digitale Banken: Welche Digitalisierungstrends bewegen die Finanzbranche 2018?

Immersive und interaktive Analyse von Finanzdaten mit Argumented Reality
Immersive und interaktive Analyse von Finanzdaten mit Argumented Reality (Blockchain-Dashboard)

Jedes Jahr (2015, 2016, 2017 und 2018) stelle ich Digitalisierungstrends vor, die der Finanzbranche ein großes Potenzial bieten. Dabei geht es vor allem um einen Überblick darüber, welche Trends und Technologien zukünftig eine größere Rolle spielen werden oder könnten.

Im Folgenden habe ich die fünf Digitalisierungstrends identifiziert, die für Banken und Versicherungen in Zukunft besonders spannend sein dürften:

1. Maschine Learning

Maschine Learning und Deep Learning werden im Investment Banking angewandt, um Unternehmensbewertungen schneller und zuverlässiger durchzuführen. Mehr Daten denn je können hinzugezogen werden. Eine Gewichtung der Daten erfolgt komplett autonom. Da manuelle Analyse weitgehend entfällt, werden Entscheidungsprozesse drastisch beschleunigt. Investoren, die mit konventionellen Werkzeugen arbeiten, haben das Nachsehen.

2. Künstliche Intelligenz

Durch Künstliche Intelligenz gesteuerte Chatbots vermitteln den Kunden eine menschlichen-ähnliche Betreuung. Chatbots werden darüber hinaus in existierende Cloud-basierende Assistenten, wie Alexa oder Siri, eingebunden und sind in der Lage mittels Natural Language Processing, auch komplexere Anfragen zu verstehen. Recommender-Systeme liefern maßgeschneiderte Lösungen, die speziell auf die Bedürfnisse der Kunden abgestimmt sind.

3. Internet of Things

Wearables und in Kleidung eingearbeitete Sensoren (Internet of Things, IoT) liefern ausreichend Daten, um den Lebensstil der Kunden vollständig zu vermessen. Dadurch können individuelle Raten für Versicherungen und Finanzprodukte berechnet werden. Außerdem bieten die IoT-Daten eine weitere Datenquelle für die Recommender-Systeme.

4. Blockchain

Verträge werden kostengünstig, fälschungssicher und irreversibel in der Blockchain gespeichert. Die Blockchain dienst sogenannten Smart Contracts als dezentrale Datenbank. Darüber hinaus liefern Blockchain-Implementierungen, wie Ethereum, das Ausführen von Logik, die beispielsweise monatliche Zahlungen prüfen und ggf. auch die Erfüllung von Vertragsbestandteilen (z.B. im Schadenfall) steuern.

5. Argumented Reality

Arbeitsplätze werden mit Technik ausgestattet, die Argumented Reality ermöglicht. Lösungen wie Microsoft’s Hololense ermöglichen Analysten und Händlern eine immersive und interaktive Analyse von Finanzdaten in Echtzeit. Insbesondere fällt dadurch auch die Zusammenarbeit mit Kollegen leichter, da Plattformen zur visuellen Kollaboration traditionelle Meetings weitgehend ablösen.

Welcher ist der 6. Trend?

Helfen Sie den 6. Digitalisierungstrend zu benennen? Nehmen Sie hierzu an der Twitter-Umfrage teil. Selbstverständlich freue ich mich auch über Kommentare und eine spannende Diskussion.

Data Operations: Daten für die Analyse optimal vorbereiten

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

Kürzlich habe ich einige Blog-Posts zum Thema Datenstrategie veröffentlicht. Für viele Unternehmen geht die Entwicklung und Einführung einer Datenstrategie nicht tief genug. Häufig habe ich ähnliches gehört: “So weit ist unser Unternehmen noch gar nicht. Wir haben noch viel operativ vorzubereiten, bevor wir eine Datenstrategie voll umfänglich etablieren können.”

Ich habe in diesen Gesprächen nachgehakt, wo diese grundlegenden Lücken in den Unternehmen bestehen, und entschlossen eine neue Blog-Post-Serie aufzusetzen, um zum Thema Data Operations (#dataops) konkrete und einfach umsetzbare Vorschläge zu geben.

Daten für die Analyse vorbereiten

Eine der wesentlichen Fragen, die sich Datenanalysten immer wieder stellen, lautet: “Gibt es eine Möglichkeit meine Daten für die Verwendung mit Analysewerkzeugen, wie Tableau, optimal vorzubereiten?”

Daten können auf unterschiedliche Arten strukturiert sein. Die meisten neuen Tableau-Anwender erliegen der Versuchung, Tableau mit einem bereits formatierten und voraggregierten Excel-Bericht (siehe Abbildung 1.1) zu verbinden und diesen in Tableau zu visualisieren. Heißt es nicht mit Tableau können Daten jeder Art einfach und intuitiv verwenden werden? Sehr schnell stellt man fest, dass ein solches Vorgehen nicht funktioniert, wie erwartet und sich so auch keine Visualisierungen erstellen lassen.

Abbildung 1.1: Bereits formatierter und voraggregierter Excel-Bericht
Abbildung 1.1: Bereits formatierter und voraggregierter Excel-Bericht

Dieses Szenario, dem viele Einsteiger begegnen, ist nicht ungewöhnlich und tatsächlich ein häufiger Stolperstein bei der Einarbeitung in Tableau, der die Analyse Ihrer Daten erschweren kann.

Die folgenden Punkte zeigen Ihnen Vorschläge zur sauberen Vorbereitung Ihrer Daten anhand des Beispielberichts:

  • Verzichten Sie auf den einleitenden Text (“Temperaturmessung zum Monatsbeginn”).
  • Überführen Sie hierarchische Überschriften (“Frankfurt”, “Berlin”) auf eine Spalteninformation (neue Spalte “Ort”).
  • Pivotisieren Sie Daten von einer “weiten” Kreuztabelle mit Variablen in Spalten (“Früh”, “Mittag”, “Abend”) in eine “lange” Tabelle, die die Variablen stets in den Zeilen trägt (in diesem Beispiel die Uhrzeit).
  • Nutzen Sie vollständige Datums- und ggf. Zeitformate (“01.04.2018 06:00”) anstatt z.B. nur den Monatsnamen (“April”).
  • Überprüfen Sie, dass Zahlen im Zahlenformat und nicht im Textformat gespeichert sind.
  • Verzichten Sie voraggregierte Daten (“Durchschnitt”, “Gesamtdurchschnitt”).
  • Entfernen Sie leere Zeilen.
  • Achten Sie darauf, dass jede Spate eine aussagekräftige Spaltenüberschrift trägt.

Haben Sie diese Vorschläge befolgt, ist aus Ihrer “weiten” Kreuztabelle nun eine “lange” Zeilen-basierte Tabelle geworden, und damit die perfekte Basis zur umfangreichen Datenanalyse (siehe Abbildung 1.2).

Abbildung 1.2: Zur Datenanalyse geeignete „lange Tabelle“ ohne Aggregationen
Abbildung 1.2: Zur Datenanalyse geeignete „lange Tabelle“ ohne Aggregationen

Dieser Blog-Post ist ein Auszug aus dem Buch “Datenvisualisierung mit Tableau“, das am 31. Juli 2018 erscheinen wird:

Datenvisualisierung mit Tableau
  • Alexander Loth
  • Publisher: mitp
  • Edition no. 2018 (31.07.2018)
  • Broschiert: 224 pages

How to diversify a Long-term Crypto Portfolio

Last Friday it was my pleasure to give an Executive Talk at the Frankfurt School of Finance & Management. While the focus of my presentation was Digital Transformation, plenty of the questions raised by the audience were about the cryptocurrencies use case – and how to build a crypto portfolio. After I received some more emails from the participants asking for some guidance, I decided that is might be worth to publish this blog post.

The cryptocurrency market has returned over 1200% since the beginning of 2017. It is very hard to find this kind of return on investment (ROI) in the stock market or anywhere else. If you had made an investment of $500 in January, you would have made $6000 in less than a year! This guide is aiming to show you how to implement a cryptocurrency portfolio for a long-term investment.

In general, I recommend balancing your portfolio with up to five coins in the Top 10 market cap, making up 90-95% of your total cryptocurrency investment. And then add smaller coins (a.k.a. altcoins) – in projects you believe in – to fill up the remaining 5-10%. This mirrors the more technical analysis done by Timothy Chong on exploring a Markowtiz-style crypto optimization.

Bitcoin (30%)

Bitcoin (BTC) is the father of all blockchains, and is considered to be gold of cryptosphere. It is expected to grow step-by-step, without dramatic events. It is a safe long-term investment choice for many.

Price (as of time of writing): $16,708
Gain Over Past Year: 2,170%
Market Cap: $278 B (#1)
Circulating Supply: 16,734,237 BTC

Ethereum (30%)

Ethereum (ETH) is different to Bitcoin in that its sole purpose is not to be used as a medium of value exchange. Instead, Ethereum allows developers to build dApps using smart contracts. The tradeable currency of the Ethereum project is known as Ether.

Price (as of time of writing): $470
Gain Over Past Year: 5740%
Market Cap: $45 B (#2)
Circulating Supply: 96,272,074 ETH

Bitcoin Cash (10%)

Bitcoin Cash (BTC) is similar to Bitcoin in that it too is supposed to be a currency that is dedicated to serving as a medium for the purchase of various goods and services. The key difference between Bitcoin Cash and Bitcoin is that the former has an 8MB block size, whereas Bitcoin has a 1MB block size. A bigger block size allows Bitcoin Cash to process transactions faster than Bitcoin, and at a lower fee.

Price (as of time of writing): $1385
Gain Over Past 4 Month: 502%
Market Cap: $24 B (#3)
Circulating Supply: 16,849,738 BCH

Litecoin (10%)

Litecoin (LTC) is often marketed as being the silver to Bitcoin’s gold status. Being a hard fork of Bitcoin, Litecoin shares many similarities to the original coin. Litecoin can also be used as a value exchange coin. However, Litecoin’s block generation time of 2.5 minutes, compared to Bitcoin’s 10 minutes, and a different hashing algorithm (Scrypt), are features designed to produce a more innovative cryptocurrency.

Price (as of time of writing): $170
Gain Over Past Year: 4690%
Market Cap: $10 B (#5)
Circulating Supply: 54,255,483 LTC

Monero (10%)

Monero (XMR) is similar to Bitcoin in that it allows value exchange. However, Monero differs from Bitcoin in that it is focused on providing greater privacy to those that utilize their blockchain, using their stealth address mechanism. Anonymity is likely to become more and more important in a world where Bitcoin addresses can be traced. As more regulation starts entering the cryptocurrency space, an increasing number of individuals will gravitate towards privacy-focused coins such as Monero that can mask their transactions.

Price (as of time of writing): $264
Gain Over Past Year: 3370%
Market Cap: $4 B (#9)
Circulating Supply: 15,449,232 XMR

Electroneum (5%)

Electroneum (ETN) is a brand new cryptocurrency launching on September 14th – and is one of the projects were I see tremendous potential. Electroneum is developed to be used in the mobile gaming and online gambling markets, its goal is to be the most user-friendly cryptocurrency with wallet management and coin mining all possible on a mobile app.

Price (as of time of writing): $0.12
Gain Over Past 1 Month: 30%
Market Cap: $257 M (#44)
Circulating Supply: n/a (launched recently)

Zclassic (5%)

Zclassic (ZCL) is a great initiative as it is the first major fork of Zcash. Zclassic improves Zcash by removing the “founders fee”, which means that 100% of the coins mined go to the miners instead of 20% going to the founders. Like Zcash, Zclassic features zk-SNARKs, a new form of zero-knowledge cryptography. The privacy guarantee of Zcash and Zclassic is derived from the fact that shielded transactions can be fully encrypted on the blockchain. Furthermore, an upcoming fork of Zclassic is currently under discussion, which could dramatically boost the price of Zclassic.

Price (as of time of writing): $1.67
Gain Over Past Year: 328%
Market Cap: $3 M (#435)
Circulating Supply: 1,809,800 ZCL

Other altcoins have high potential as well. WTC, VTC, and VEN are also good worth to be considered. What is your cryptocurrency investment strategy? I’m happy to discuss more ideas in the comments!

This blog post is an opinion and is for information purposes only.  It is not intended to be investment advice. I am an investor and I contribute to the Zclassic fork project, and it is to my benefit that the project succeeds.

[Update 12 Dec 2017] Frequently asked questions after blog post release:

Q: Isn’t it too late to start buying Bitcoins now?
A: No. I’m very confident that Bitcoin will hit the 100,000 EUR/BTC mark by the end of 2018.

Q: Where can I buy bitcoins, ether and other coins?
A: Coinbase is a US-based cryptocurrency exchange where you can buy and sell Bitcoin, Ethereum, and Litecoin. bitcoin.de is the first Germany-based exchange where you can buy and sell Bitcoin, Ethereum, and Bitcoin Cash.

Q: Where can I buy alternative coins, such as Monero or Zclassic?
A: I prefer Cryptopia for most altcoin transactions (XMR, ETN, ZCL). If a coin is not available on this exchange, eg. IOTA, I’ll trade them on Binance.

Q: How can I store my cryptocurrencies in a secure way?
A: Either you can generate and print a paper wallet, or you can get a hardware wallet, such as the Ledger Nano S.

[Update 14 Dec 2017] Join the poll to find a name for our upcoming Zclassic fork:

Data Strategy: Erstickt Innovation zwischen Berichtswesen und Data Discovery?

Abbildung 4: Interaktives Dashboard zur Darstellung von variablen Abhängigkeiten in Tableau
Abbildung 4: Interaktives Dashboard zur Darstellung von variablen Abhängigkeiten mit TensorFlow in Tableau

Der erste Schritt auf dem Weg zu besserer Entscheidungsfindung im Unternehmen, ist zu verstehen, wie gute (oder schlechte) Entscheidungen zustande kamen. Genau wie manche Unternehmen formale Prozesse für Aktivitäten haben, wie z. B. What-if-Analysen, prädiktive Wartung und Bestimmung von Abhängigkeiten in Korrelationen (siehe Abbildung 4), so müssen sie formale Prüfprozesse für Entscheidungen im gesamten Unternehmen einführen. Dies soll jedoch keinesfalls dazu dienen, die an schlechten Entscheidungen Beteiligten zu bestrafen, sondern den Entscheidungsfindungsprozess und -stil des Unternehmens im Allgemeinen verbessern.

Die Rolle der IT nähert sich hierbei wieder ihren Wurzeln an und statt eine Berichtefabrik für den Rest des Unternehmens zu unterhalten, wird die IT wieder zum Dienstleister und Partner, der die Infrastruktur für eine Data Discovery bereitstellt. IT-Mitarbeiter werden entlastet und erhalten den Freiraum, ihre professionelle Energie und Kreativität in den Dienst der Innovation zu stellen, und die Mitarbeiter in den Abteilungen sehen ihre Datenfragen nicht am Flaschenhals Berichtswesen verhungern. Nur so lassen sich die Investitionen in Business Intelligence und Analytics optimal in den Dienst der strategischen Ziele des Unternehmens stellen.

Abbildung 5: Anforderungen, Fähigkeiten und Ziele einer Datenstrategie (TC17-Präsentation)
Abbildung 5: Anforderungen, Fähigkeiten und Ziele einer Datenstrategie (TC17-Präsentation)

Moderne Unternehmen sehen sich vielen analytischen Anforderungen (siehe Abbildung 5) gegenüber, und diese Anforderungen werden unweigerlich schneller wachsen, als Unternehmen sie bedienen können. Es ist daher unerlässlich, Analytics als lebenswichtigen Teil der eigenen Datenstrategie zu verstehen und entsprechend zu planen.

Dabei ist ein umfassender Betrachtungswinkel sinnvoll, denn die wachsende Nachfrage nach Analysen und Erkenntnissen wird mehr und mehr von den kundenbezogenen Abteilungen wie Marketing oder Support ausgehen. Dementsprechend wird auch das Budget für Analytics verstärkt aus diesen Abteilungen kommen, statt aus einem zentralisierten IT- oder BI-Budget. Dort, wo viele Kundendaten vorhanden sind, wird der CMO bald mehr für Analytics ausgeben als der CIO. Und dort, wo Mitarbeiter über gut integrierte, intuitive Werkzeuge für komplexe Analysen verfügen, können gute Instinkte und datenbasierte Entscheidungen Hand in Hand für den Erfolg sorgen.

Dieser Beitrag ist der fünfte Teil der Datenstrategie-Serie:

Teil 1: Die Notwendigkeit einer modernen Datenstrategie im Zuge der digitalen Transformation
Teil 2: Steigern smarte Erkenntnisse den Business Impact?
Teil 3: 10 BI & Analytics Trends, die in keiner Datenstrategie fehlen dürfen
Teil 4: Wie unterstützen Analysen Ihre Entscheidungsfindung?
Teil 5: Erstickt Innovation zwischen Berichtswesen und Data Discovery?

TC17 Data Strategy Title Slide Möchten Sie mehr zu den neuesten Trends im Bereich Datenstrategie erfahren? Dann freue ich mich, wenn Sie an meinem Vortrag “Building an Enterprise Big Data & Advanced Analytics Strategy” auf unserer Tableau Conference TC17 (9.-12. Okt., Las Vegas) teilnehmen.