Bericht MLUGS Treffen im November 2018
20. November 2018
Protokoll
Vorstellungsrunde
- Andreas, Software-Entwickler, AX-Semantics
- Ringo, Informatikabsolvent, hat interesse
- Jens, Data-Scientist, AKKA
- Gregor, Informatiker, privat
- Sima, Maschinenbau, privat
- Wilhelm, Software-Entwicker, privat
- Alexander, Mechanik, Daimler
- Thomas, Software-Entwicker, Vialytics
- Thilo, Software-Entwicker, Vialytics
- Leonard, Masterstudent, Bosch
- Michael / Vitus, Software-Entwicker, AX-Semantics
- Uwe, Raumfahrt, ST2C
- Arne, Luft- und Raumfahrt-Student
- Stefan, Physiker, AX-Semantics
- Marlon, Politik- und Sozialforschungsstudent
- Fabio, Politik- und Sozialforschungsstudent, Datascientist, Paraboost
- Florian, Data-Analyst, SDM
-
David, DA-Consultant, Diconium
-
1 Nachzügler
Mit reticulate Python innerhalb von R verwenden
Jens Bruno Wittek, Data Scientist, AKKA DSW GmbH https://www.akka-digital.com
Vorstellung des R-Pakets reticulate, das von RStudio dieses Jahr veröffentlicht wurde und es einfacher macht die Stärken beider Sprachen miteinander zu verbinden. Inhalte sind u.a.:
- Erstellung und Veränderung von Python-Objekten in R
- Verwendung von Python-Code, Skripten und Modulen in R
- Arbeiten mit Environments und verschiedenen Python-Versionen
- Python REPL / Interpretor in R verwenden
- Reporting
Die Darstellung ist eher technisch orientiert. Am Ende wird an einem Machine-Learning-Use-Case gezeigt, wie reticulate auf verschiedene Weisen angewendet werden kann.
https://github.com/rstudio/reticulate
Slides folgen.
Kommentar:
- Beispiel für pytorch in reticulate: https://github.com/longhowlam/ReticulateTestDrive/blob/master/pytorch.R
Bericht von der PyCon 2018
Jens Bruno Wittek, Data Scientist, AKKA DSW GmbH https://www.akka-digital.com
- Möglichkeiten, um die Performance von pandas-DataFrames zu verbessern
- Deployment von Machine-Learning-Modellen
reticulate für Verwendung von Python innerhalb von R
(siehe Vortrag davor)
Binder für interaktive Tutorials basierend auf GitHub-Repos
Dask für performante DataFrames
- https://dask.org/
- https://github.com/dask/dask
- http://docs.dask.org/en/latest/
- https://github.com/dask/dask-examples
Ray für verteiltes Rechnen, Modin für performante DataFrames
- https://github.com/ray-project/ray/
- https://github.com/modin-project/modin
- https://modin.readthedocs.io/en/latest/pandas_on_ray.html
Firefly für Deployment von Funktionen
Alternative zu?:
Deep-Learning-Modelle in Pipeline
- https://towardsdatascience.com/from-exploration-to-production-bridging-the-deployment-gap-for-deep-learning-8b59a5e1c819
- https://towardsdatascience.com/from-exploration-to-production-bridging-the-deployment-gap-for-deep-learning-part-2-9e33cc8dfe5e
ONNX (Open Neural Network eXchange format)
GraphPipe (Deployment)
misc
-
backboxnlp:
-
wir haben einen slack. meldet euch, wenn ihr da rein wollt!
next
- 2019-01-15
- Vorschläge für Vorträge sind willkommen!