Data Science: Enabling Research at CERN with Big Data

Wow, time flies. One year has passed since I started to work at CERN as a data scientist. CERN, surrounded by snow-capped mountains and Lake Geneva, is known for its particle accelerator Large Hadron Collider (LHC) and its adventure in search of the Higgs boson. Underneath the research there is an tremendous amount of data that are analysed by data scientists.

Filters, known as High Level Triggers, reduce the flow of data from a petabyte (PB) a second to a gigabyte per second, which is then transferred from the detectors to the LHC Computing Grid. Once there, the data is stored on about 50PB of tape storage and 20PB of disk storage. The disks are managed as a cloud service (Hadoop), on which up to two millions of tasks are performed every day.

High Level Trigger data flow
High Level Trigger data flow, as applied in the ALICE experiment

CERN relies on software engineers and data scientists to streamline the management and operation of its particle accelerator. It is crucial for research to allow real-time analysis. Data extractions need to remain scalable and predictive. Machine learning is applied to identify new correlations between variables (LHC data and external data) that were not previously connected.

So what is coming up next? Scalability remains a very important area, as the CERN’s data will continue to grow exponentially. However, the role of data scientists goes much further. We need to transfer knowledge throughout the organisation and enable a data-driven culture. In addition, we need to evaluate and incorporate new innovative technologies for data analysis that are appropriate for our use cases.

Top 10 Angels&Demons Questions

CERN Exhibition: Top 10 Angels&Demons Questions
CERN Exhibition: Top 10 Angels&Demons Questions

Gestern haben wir Angels & Demons (deutscher Titel: Illuminati) im Kino gesehen. Die Verfilmung des gleichnamigen Bestsellers von Dan Brown war vor allem visuell sehr ansprechend. Tom Hanks hat wie schon in Da Vinci Code souverän die Rolle des Protagonisten Robert Langdon verkörpert.

Ein Teil der Handlung des Films spielt am CERN. Tats√§chlich wurden einige Einstellungen am ATLAS-Detektor des LHC gedreht. Regisseur Ron Howard sah sich ebenfalls das CERN-Gel√§nde an, um den Film authentischer zu gestalten. Die Herstellung einer Bombe aus Antimaterie ist hingegen ebenso Fiktion wie die “Sch√∂pfung aus dem Nichts”, welche im Film lediglich dazu dient den Konflikt zwischen Religion und Naturwissenschaft zu entfachen.

CERN hat Angels & Demons eigens eine Ausstellung (siehe Foto oben) und eine Website gewidmet, um “the science behind the story” zu erl√§utern und auf h√§ufig gestellte Fragen (“Does CERN create black holes?”, etc.) einzugehen.

Analyzing High Energy Physics Data with Tableau at CERN

Screenshot of Tableau 4.0 analyzing High Energy Physics Data at CERN
Screenshot of Tableau 4.0 analyzing High Energy Physics Data at CERN

About a year ago, I had a first try with Tableau and some survey data for a university project. Last week, I finally found time to test Tableau with High Energy Physics (HEP) data from CERN’s Proton Synchrotron (PS). Tableau enjoys a stellar reputation among the data visualization community, while the HEP community heavily uses Gnuplot and Python.

Tableau 4.0: Connect to Data
Tableau 4.0: Connect to Data

I was using an ordinary CSV file as data source for this quick visualization. Furthermore, Tableau can connect to other file types such as Excel, as well as to databases like Microsoft SQL Server, Oracle, and Postgres.

I’m also quite impressed by the ease and speed with which insightful analysis seems to appear out of bland data. Even though your analysis toolchain is script-based (as usual at CERN where batch processing is mandatory), I highly recommend using Tableau for prototyping and for ad-hoc data exploration.

Was ist Negative Masse?

Negative Masse ist nicht zu verwechseln mit Antimaterie! Antimaterie ist die Sammelbezeichnung f√ľr Antiteilchen und alles, was aus ihnen aufgebaut ist, so wie die “normale” Materie aus “normalen” Teilchen besteht. Antimaterie kann die Form von Atomen und Molek√ľlen haben, die gebundene Systeme aus Positronen, Antiprotonen und ggf. Antineutronen sind.¬†Auf die Schwerkraft wirken aber Antimaterie und “normale” Materie exakt¬†gleich, beide Sorten besitzen die gleiche Masse und werden durch die Gravitation angezogen.

A real (anti)matter trap
A real (anti)matter trap

Was ist aber wenn es Materie gibt, die eine negative Masse besitzt – also Materie, die nicht immer anziehend wirkt?¬†Nach Einstein’s Relativit√§tstheorie ist diese Sorte Materie zumindest denkbar. G√§be es solche Materie mit negativer Masse oder k√∂nnte man solche¬†herstellen, w√ľrde dies bedeuten, dass man die Raumzeit, die schlie√ülich¬†an die Masse gekoppelt ist, beeinflussen und ver√§ndern k√∂nnte.¬†M√∂glich¬†w√§re dann z.B. die Erschaffung von Wurml√∂chern, wie wir sie aus der Science Fiction kennen.

In¬†den meisten Experimenten wird lediglich der Betrag der Masse gemessen. Es wird keine¬†Information √ľber das Vorzeichen erhoben.¬†Schlie√ülich funktionieren¬†Einstein’s¬†Gleichungen sowohl mit positivem als auch mit negativem Vorzeichen.

Es gibt daher Vermutungen, dass Antimaterie auch negative Masse besitzt. Diese Vermutung konnte allerdings noch nicht in Experimenten nachgewiesen werden. Diese Verifizierung des Vorzeichens, könnte bald am CERN mit Hilfe des Antiproton Decelerator erfolgen, sobald ausreichend Anti-Wasserstoff produziert und gespeichert werden konnte. Materie mit negativer Masse sollte dann der Gravitation entgegen von dieser abgestoßen werden oder sie zumindest neutralisieren.

Antiproton Decelerator (AD)

Der Antiproton Decelerator (AD) oder “Antiprotonen-Verz√∂gerer” ist die weltweit einzige Anlage zur Herstellung von Antimaterie.

Die Maschine wird eingesetzt, um die mit hoher Energie durch einen Teilchenstrahl erzeugten Antiprotonen wieder zu verlangsamen und dadurch Antiwasserstoffatome zu erzeugen.

Vereinfacht ausgedr√ľckt wirkte der Urknalls auch wie ein gewaltiger Beschleuniger zur Herstellung von Teilchen. Materie- und Antimaterieteilchen sind dabei zun√§chst in gleichem Ma√ü entstanden. Die bislang ungel√∂ste Frage ist allerdings, warum das Universum im wesentlichen nur aus Materie besteht und was mit all der Antimaterie passiert ist.

Antimaterie (Quelle: CERN)Im Gegensatz zu den riesigen Anlagen wie dem Large Hadron Collider (LHC) mit enormen 27 Kilometern Umfang, fällt der Ring des AD mit seinen 188 Metern Umfang recht bescheiden aus.