Machine Learning kompakt: Alles, was Sie wissen müssen

Machine Learning Kompakt Cover und Deep-Learning-Kapitel
Machine Learning kompakt und Blick in das Kapitel “Neuronale Netze und Deep Learning”

Nachdem ich bereits Erfahrung als Buchautor (hier und hier) gesammelt habe, hatte ich kürzlich die Gelegenheit als Technical Reviewer ein sehr spannendes Buchprojekt zu unterstützen. Das Buch Machine Learning kompakt: Alles, was Sie wissen müssen, geschrieben von Andriy Burkov, fand ich dabei dermaßen interessant, dass ich es gerne im Folgenden kurz vorstellen werde:

Machine Learning kompakt von Andriy Burkov ist ein hervorragend geschriebenes Buch und ein Muss für jeden, der sich für Machine Learning interessiert.

Andriy Burkov gelang ein ausgewogenes Verhältnis zwischen der Mathematik, intuitiven Darstellungen und verständlichen Erklärungen zu finden. Dieses Buch wird Neulingen auf dem Gebiet als gründliche Einführung zu Machine Learning zugutekommen. Darüber hinaus dient das Buch Entwicklern als perfekte Ergänzung zu Code-intensiver Literatur, da hier die zugrunde liegenden Konzepte beleuchtet werden.

Microsoft Azure Machine Learning Studio
Microsoft Azure Machine Learning Studio

Machine Learning kompakt eignet sich außerdem als Lehrbuch für einen allgemeinen Kurs zu Machine Learning. Ich wünschte, ein solches Buch gäbe es, als ich studiert habe!

Protip: viele der im Buch vorgestellten Machine-Learning-Algorithmen können Sie einfach und bequem in Microsoft Azure Machine Learning Studio selbst ausprobieren: https://aka.ms/mlst

Machine Learning kompakt: Alles, was Sie wissen müssen (mitp Professional)
  • Andriy Burkov
  • Publisher: mitp
  • Edition no. 2019 (30.06.2019)
  • Broschiert: 200 pages

#TC18 Wrap-up: Azure SQL Data Warehouse speeds up your Analysis

Benchmark: Microsoft Azure SQL Data Warehouse outperforms Amazon Redshift in TCP-H 30TB
Benchmark: Microsoft Azure SQL Data Warehouse outperforms Amazon Redshift in TCP-H 30TB

Slowly the dust settles after the impressive TC18. During my wrap-up, I remembered the data warehouse benchmarks of the Azure & Tableau session by James Rowland-Jones. Especially because my customers ask me about such performance metrics over and over again.

The first benchmark (graph above) shows how Microsoft Azure SQL Data Warehouse (aka. SQL DW) outperforms Amazon Redshift – in terms of performance and price. While the second benchmark shows further performance tests for Amazon Redshift, Snowflake, Azure, Presto, and Google Big Query:

Benchmark: Microsoft Azure SQL Data Warehouse Gen 2 vs. Amazon Redshift, Snowflake, Presto, Google Big Query
Benchmark: Microsoft Azure SQL Data Warehouse Gen 2 vs. Amazon Redshift, Snowflake, Presto, Google Big Query

Since James’ session is already available on Tableau’s Youtube channel, feel free to watch the entire Azure & Tableau session:

MS SQL Server: ETL mit Data Transformation Services

Screenshot von SQL Server Enterprise Manager mit SAP MaxDB
Screenshot von SQL Server Enterprise Manager mit SAP MaxDB

Kürzlich stand ich vor der Herausforderung einen Datenbestand von einem Datenbanksystem (SAP MaxDB) in ein anderes (Microsoft SQL Server) zu überführen. Das Unterfangen war manuell jedoch kaum zu realisieren, da die Datenbank mehrere hundert Tabellen und unzählige Datensätze umfasst.

Abhilfe schaffte der Microsoft SQL Server Enterprise Manager. Dort finden sich die Data Transformation Services wieder, Hilfsprogramme, die es erlaubt, ETL-Prozesse (Extract, Transform, Load) beim Import in oder Export aus einer Datenbank zu automatisieren. Dabei werden verschiedene Datenbanksysteme unterstützt, sofern diese über eine ODBC– oder eine OLE DB-Schnittstelle verfügen, was auch bei SAP MaxDB der Fall ist.

Konkret bestehen die Data Transformation Services (DTS) aus folgenden Komponenten:

  • DTS Import/Export Wizard: Assistenten, die es erlauben Daten von oder zu einem MS SQL Server zu übertragen, sowie Map Transformations ermöglichen.
  • DTS Designer: Ermöglicht das erstellen von komplexen ETL-Workflows einschließlich event-basierter Logik.
  • DTS Run Utility: Planung und Ausführung von DTS-Packages; auch via Kommandozeile möglich.
  • DTS Query Designer: Eine GUI für das Erstellen von SQL-Abfragen für DTS.