15th Data & AI Meetup: Reinforcement Learning; TensorFlow on Azure; Visual Analytics

We’d like to invite you to our 15th Data & AI Meetup, hosted at Skydeck @ DB Systel in Frankfurt, Germany.

Agenda:

5:30pm: Doors open

6:00pm: Welcome & Intro
by Alexander Loth, Digital Strategist at Microsoft
and Darren Cooper, Principal Consultant at DB Systel

6:20pm: 🚄 Reinforcement Learning of Train Dispatching at Deutsche Bahn
by Dr. Tobias Keller, Data Scientist at DB Systel

7:00pm: 🚀 TensorFlow & Co as a Service
by Sascha Dittmann, Cloud Solution Architect for Advanced Analytics & AI at Microsoft

7:40pm: 📊 Visual Analytics: from messy data to insightful visualization
by Daniel Weikert, Expert Consultant at SIEGER Consulting

8:30pm: Networking & drinks

9:30pm: Event concludes

DB Systel Skydeck in Frankfurt (previous meetup)
DB Systel Skydeck in Frankfurt (previous meetup)

Sign up on Meetup and join us on Twitter @DataAIHub and LinkedIn!

Do you want to speak at our events? Submit your proposal here: https://aka.ms/speakAI

Machine Learning kompakt: Alles, was Sie wissen müssen

Machine Learning Kompakt Cover und Deep-Learning-Kapitel
Machine Learning kompakt und Blick in das Kapitel „Neuronale Netze und Deep Learning“

Nachdem ich bereits Erfahrung als Buchautor (hier und hier) gesammelt habe, hatte ich kürzlich die Gelegenheit als Technical Reviewer ein sehr spannendes Buchprojekt zu unterstützen. Das Buch Machine Learning kompakt: Alles, was Sie wissen müssen, geschrieben von Andriy Burkov, fand ich dabei dermaßen interessant, dass ich es gerne im Folgenden kurz vorstellen werde:

Machine Learning kompakt von Andriy Burkov ist ein hervorragend geschriebenes Buch und ein Muss für jeden, der sich für Machine Learning interessiert.

Andriy Burkov gelang ein ausgewogenes Verhältnis zwischen der Mathematik, intuitiven Darstellungen und verständlichen Erklärungen zu finden. Dieses Buch wird Neulingen auf dem Gebiet als gründliche Einführung zu Machine Learning zugutekommen. Darüber hinaus dient das Buch Entwicklern als perfekte Ergänzung zu Code-intensiver Literatur, da hier die zugrunde liegenden Konzepte beleuchtet werden.

Microsoft Azure Machine Learning Studio
Microsoft Azure Machine Learning Studio

Machine Learning kompakt eignet sich außerdem als Lehrbuch für einen allgemeinen Kurs zu Machine Learning. Ich wünschte, ein solches Buch gäbe es, als ich studiert habe!

Protip: viele der im Buch vorgestellten Machine-Learning-Algorithmen können Sie einfach und bequem in Microsoft Azure Machine Learning Studio selbst ausprobieren: https://aka.ms/mlst

How China is Winning in the Age of Artificial Intelligence: A Deep Dive into Innovation, Culture, and Strategy

China AI: The impressive Alibaba Campus in Hangzhou, a hub of innovation and intrapreneurship.
China AI: The impressive Alibaba Campus in Hangzhou, a hub of innovation and intrapreneurship.

China’s AI revolution is taking the world by storm. In this journey across cities like Hangzhou, discover how China is leading the AI industry, inspiring innovation, and shaping the future.

Currently, I’m on a 4-week China trip, visiting many cities. In Hangzhou, I met CEIBS peers who work for Alibaba. While the Alibaba campus is quite impressive, I got even more impressed by Alibaba’s leadership culture, which is encouraging its employees to innovate as intrapreneurs.

Intrapreneurship at Alibaba: The China AI Model for Success

At the impressive Alibaba Campus in Hangzhou, I discovered the power of intrapreneurship. If you start your own project (a new mobile app, a patent, a scientific paper, etc.), you’re doing it at your own pace. Employees are encouraged to innovate at their own pace, without being micro-managed. Success is rewarded with bonuses. Truly, this is where we can learn from China in the „China AI“ landscape!

China’s AI Ambitions: Leading the New World Order

Yue and me, Hangzhou West Lake

While traveling in China I was reading AI Superpowers: China Silicon Valley, and the New World Order by Kai-Fu Lee, a book that is a must-read to get an idea of where China’s AI ambitions are heading to. What matters most for AI innovation these days, the author argues, is access to vast quantities of data—where China’s advantage is overwhelming.

A quite entertaining book focusing on the new mindset of China’s young generation is this one: Young China: How the Restless Generation Will Change Their Country and the World by Zak Dychtwald.

Visualizing the Journey: Exploring my Tableau Public Viz

Which other cities in China did I visit? Check out my Tableau Public viz:

A visualization of my 2019 China Visit, exploring the cities and experiences.
A visualization of my 2019 China Visit, exploring the cities and experiences.

Interested in Visual Analytics? Grab a copy of my latest book, Visual Analytics with Tableau (Amazon), for a comprehensive guide to mastering data visualization.

Stay Connected and Explore More on China AI

China’s AI is reshaping the global landscape. From Alibaba to the nation’s strategies, China AI inspires and challenges the world. It’s a blend of technology, culture, and energy driving China’s AI revolution.

The experiences and insights from this trip have been truly enlightening. I invite you to join me as I continue to explore the fascinating world of China AI, digital transformation, and visual analytics. Follow me on Twitter and LinkedIn, and let’s continue learning together.

Don’t miss my upcoming book, Decisively Digital: From Creating a Culture to Designing Strategy (Amazon) Dive deep into digital transformation and be part of the new era of innovation.

Data Operations: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

#dataops: Folgen Sie der Diskussion auf Twitter
#dataops: Folgen Sie der Diskussion auf Twitter

Sind Sie mit der Geschwindigkeit Ihrer Datenanlyse unzufrieden? Oder haben Ihre Dashboards lange Ladezeiten? Dann können Sie bzw. Ihr Datenbank-Administrator folgenden Hinweisen nachgehen, die sich je nach Datenquelle unterscheiden können.

Allgemeine Empfehlungen zur Performance-Optimierung

Möchten Sie die Geschwindigkeit der Analyse verbessern? Dann beachten Sie folgende Punkte:

  • Benutzen Sie mehrere »kleinere« Datenquellen für individuelle Fragestellungen anstatt einer einzigen Datenquelle, die alle Fragestellungen abdecken soll.
  • Verzichten Sie auf nicht notwendige Verknüpfungen.
  • Aktivieren Sie in Tableau die Option »Referentielle Integrität voraussetzen« im »Daten«-Menü (siehe Abbildung 2.20). Wenn Sie diese Option verwenden, schließt Tableau die verknüpften Tabellen nur dann in die Datenabfrage ein, wenn sie explizit in der Ansicht verwendet wird*. Wenn Ihre Daten nicht über referentielle Integrität verfügen, sind die Abfrageergebnisse möglicherweise ungenau.

Aktivierte Option „Referentielle Integrität voraussetzen“ im „Daten“-Menü
Abbildung 2.20: Aktivierte Option »Referentielle Integrität voraussetzen« im »Daten«-Menü

* So wird beispielsweise der Umsatz anstatt mit der SQL-Abfrage SELECT SUM([Sales Amount]) FROM [Sales] S INNER JOIN [Product Catalog] P ON S.ProductID = P.ProductID lediglich mit der SQL-Abfrage SELECT SUM([Sales Amount]) FROM [Sales] ermittelt.

Empfehlungen für Performance-Optimierung bei Dateien und Cloud-Diensten

Achten Sie insbesondere beim Arbeiten mit Dateiformaten, wie Excel-, PDF- oder Textdateien, oder Daten aus Cloud-Diensten wie Google Tabellen zusätzlich auf folgende Punkte:

  • Verzichten Sie auf Vereinigungen über viele Dateien hinweg, da deren Verarbeitung sehr zeitintensiv ist.
  • Nutzen Sie einen Datenextrakt anstatt einer Live-Verbindung, falls Sie nicht mit einem schnellen Datenbanksystem arbeiten (siehe Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden).
  • Stellen Sie sicher, dass Sie beim Erstellen des Extrakts die Option »Einzelne Tabelle« wählen, anstatt der Option »Mehrere Tabellen« (siehe Abbildung 2.21). Dadurch wird das erzeugte Extrakt zwar größer und das Erstellen des Extrakts dauert länger, das Abfragen hingegen wird um ein Vielfaches beschleunigt.

Ausgewählte Option „Einzelne Tabelle“ im „Daten extrahieren“-Dialog
Abbildung 2.21: Ausgewählte Option »Einzelne Tabelle« im »Daten extrahieren«-Dialog

Empfehlungen für Performance-Optimierung bei Datenbank-Servern

Arbeiten Sie mit Daten auf einem Datenbank-Server, wie Oracle, PostgreSQL oder Microsoft SQL Server, und möchten die Zugriffszeiten verbessern? Dann achten Sie bzw. der dafür zuständige Datenbankadministrator zusätzlich auf folgende Punkte:

  • Definieren Sie für Ihre Datenbank-Tabellen sinnvolle Index-Spalten.
  • Legen Sie für Ihre Datenbank-Tabellen Partitionen an.

Dieser Beitrag ist der dritte Teil der Data-Operations-Serie:

Teil 1: Daten für die Analyse optimal vorbereiten
Teil 2: Wann sollten Sie Datenextrakte und wann Live-Verbindungen verwenden
Teil 3: Wie Sie die Performance Ihrer Datenanalyse und Dashboards steigern

Außerdem basiert dieser Blog-Post auf einem Unterkapitel des Buches „Datenvisualisierung mit Tableau„:

How to Research LinkedIn Profiles in Tableau with Python and Azure Cognitive Services in Tableau

Azure Cognitive Services in Tableau: using Python to access the Web Services API provided by Microsoft Azure Cognitive Services
Azure Cognitive Services in Tableau: using Python to access the Web Services API provided by Microsoft Azure Cognitive Services

A few weeks after the fantastic Tableau Conference in New Orleans, I received an email from a data scientist who attended my TC18 social media session, and who is using Azure+Tableau. She had quite an interesting question:

How can a Tableau dashboard that displays contacts (name & company) automatically look up LinkedIn profile URLs?

Of course, researching LinkedIn profiles for a huge list of people is a very repetitive task. So let’s find a solution to improve this workflow…

Step by Step: Integrating Azure Cognitive Services in Tableau

1. Python and TabPy

We use Python to build API requests, communicate with Azure Cognitive Services and to verify the returned search results. In order to use Python within Tableau, we need to setup TabPy. If you haven’t done this yet: checkout my TabPy tutorial.

2. Microsoft Azure Cognitive Services

One of many APIs provided by Azure Cognitive Services is the Web Search API. We use this API to search for name + company + „linkedin“. The first three results are then validated by our Python script. One of the results should contain the corresponding LinkedIn profile.

3. Calculated Field in Tableau

Let’s wrap our Python script together and create a Calculated Field in Tableau:

SCRIPT_STR("
import http.client, urllib, base64, json
YOUR_API_KEY = 'xxx'
name = _arg1[0]
company = _arg2[0]
try:
headers = {'Ocp-Apim-Subscription-Key': YOUR_API_KEY }
params = urllib.urlencode({'q': name + ' ' + company + ' linkedin','count': '3'})
connection = http.client.HTTPSConnection('api.cognitive.microsoft.com')
connection.request('GET', '/bing/v7.0/search?%s' % params, '{body}', headers)
json_response = json.loads(connection.getresponse().read().decode('utf-8'))
connection.close()
for result in json_response['webPages']['value']:
if name.lower() in result['name'].lower():
if 'linkedin.com/in/' in result['displayUrl']:
return result['displayUrl']
break
except Exception as e:
return ''
return ''
", ATTR([Name]), ATTR([Company]))

4. Tableau dashboard with URL action

Adding a URL action with our new Calculated Field will do the trick. Now you can click on the LinkedIn icon and a new browser tab (or the LinkedIn app if installed) opens.

LinkedIn demo on Tableau Public

Is this useful for you? Feel free to download the Tableau workbook – don’t forget to add your API key!

Get More Insights

This tutorial is just the tip of the iceberg. If you want to dive deeper into the world of data visualization and analytics, don’t forget to order your copy of my new book, Visual Analytics with Tableau (Amazon).  This comprehensive guide offers an in-depth exploration of data visualization techniques and best practices.

I’d love to hear your thoughts. Feel free to leave a comment, share this tweet, and follow me on Twitter and LinkedIn for more tips, tricks, and tutorials on Azure Cognitive Services in Tableau and other data analytics topics.

Also, feel free to comment and share my Azure Cognitive Services in Tableau tweet: