07024-9772780 info@5analytics.com

R in Produktivumgebungen

5Analytics bietet mit Operational R eine spezielle R Version, die exakt auf die Anforderungen von Produktivumgebungen zugeschnitten ist.

R ist dem Experimentierstadium entwachsen und wird zunehmend in produktiven Umgebungen eingesetzt. Das bedeutet, dass die von Data Scientists erstellten Scripte nicht nur zur Erzeugung von Statistiken und Grafiken für Berichte genutzt werden, sondern im Batch-Betrieb unternehmenskritische Aufgaben erledigen. Das bedeutet aber auch, dass die von Data Scientists erstellten R-Skripte nicht mehr lokal auf dem Rechner des Entwicklers laufen, sondern auf einem Server irgendwo im Rechenzentrum oder in der Cloud.

In produktiven Umgebungen gelten jedoch andere Regeln. Sicherheit, Zuverlässigkeit und Performance sind kritische Größen auf einem Produktivsystem. Dinge, die auf einem Entwickungsserver üblich, ja sogar notwendig sind, sind auf einem Server im produktiven Einsatz undenkbar. So ist zum Beispiel der Einsatz von Compilern auf einem Produktivsystem ausgeschlossen, das Risiko ein Hacker könnte diese Werkzeuge nutzen ist einfach zu groß. Die Hardware, und die eingesetzte Software auf einem Produktivsystem ist oft eine gänzlich andere, als auf einem Entwicklungssystem.

Für den Einsatz von R bedeutet dies, dass die CRAN R-Installation nicht zum Einsatz kommen kann. Unter Unix Systemen wird zwingend bei der Installation das Kompilieren des Quelltextes der Pakete vorausgesetzt. Darüber hinaus, nutzt die Standard R Umgebung nicht den vollen Umfang der zur Verfügung stehenden Hardware aus. Dies erfordert ebenfalls spezielle Bibliotheken und ein Neu-Kompilieren der Software.

Operational R ist eine speziell auf die Anforderungen von Produktivumgebungen hin zugeschnittene R Umgebung. Sie kann einfach und schnell installiert werden und nutzt die zugrundeliegende Intel Hardware voll aus. Darüber hinaus biete 5Analytics registrierten Kunden auch Zugriff auf unser Operational R Repository, das ebenfalls vorkompilierte Pakete enthält, die direkt in der Produktivumgebung genutzt werden können.

Parallelisieren

Operational R nutzt Technologien wie OpenMP und die Intel Math Kernel Library um die Ausführung des R-Code möglichst effizient auf mehrere Kerne/CPUs zu verteilen. Auf diese Weise lässt sich, ohne Änderungen am Code, eine Beschleunigung um Faktor 25 und mehr erreichen.

Binärpakete

Operational R kommt mit seinem eigenen Binärpaketrepository. CRAN R setzt unter Linux das Kompilieren von Zusatzpaketen vorraus. Gerade in Produktivsystemen wird dies zum Problem, da hier Pakete nicht vorort kompiliert werden können. Mit Operational R können Sie direkt Binärpakete nutzen. Auf diesem Weg können Sie wie gewohnt Pakete laden und installieren, ohne die Notwendigkeit Compiler und Entwicklerbibliotheken auf dem produktiven System installiert zu haben.

Einfache Installation

Operational R ist als abgeschlossenes Softwarepaket konzipiert. Das bedeutet, dass keine weiteren Bibliotheken vorausgesetzt werden oder installiert werden müssen. Dies entspricht dem Anspruch eines schlanken, auf das Wesentliche reduzierten Produktivsystems und erleichtert auch die Installation.

Top