1. Bericht MLUGS Treffen im Juni 2017

    Protokoll

    Vorstellungsrunde

    • Andreas; Aexea; Software-Entwickler
    • Uwe; macht Raumfahrt; will ML in der Raumfahrt umsetzen
    • Eva; macht app/webapp; next personalisierung
    • Wilhelm; Software-Entwickler; macht DL privat
    • Jörg; Finance/Accounting
    • Andreas; Agrarinformatiker; Milchauswertungen
    • Ashant; E-Commerce; ERP/Personalisierung
    • Frank; App/Web und ML nebenher
    • Nandor; arbeitet mit Frank; macht Bioinformatik
    • Oliver; Optikerabrechnungszentrum; hat viele Daten
    • Sebastian; macht Big-Data auf dem Mainframe
    • Andreas; Luft- und Raumfahrttechniker; ist interessiert an ML

    • 1 Nachzügler

    Uwe Sterr - Timeseries Prediction

    • thema heute: feature extraction / nicht das ANN
    • bivariante / univariante (non)-linear measures
    • univariante linear measures:
      • variance, skewness, kurtosis are important statistical moments
      • FFT
      • Wavelets
      • Autoregressive moving averages
    • bivariante linear measures:
      • maximum linear cross-correlation
      • linear coherence (simmilarity between signals over time)
    • bivariante non-linear measures
      • non-linear interdepence (how do signals correlate in a non-linear system?)
      • phase synchronization measures
    • decomposition of time series:
      • observed, trend, seasonal, random are measures that we want to tackle with ML and use as an input rather than the "raw" data.
      • neural networks may replace standard algorithms

    Sebastian Muszytowski - Optical quality control on texture images

    • sollte was mit ML machen, weil es cool ist
    • Problem: Qualistätskontrolle von Defekten auf Texturen
    • erster Ansatz: alles in ein CNN. Fehlerquote von 100%
    • zweiter Ansatz: alles kleiner machen; statt 512x512 in 16x16 -> Problem overfitting
    • dritter (erfolgreicher) Ansatz: verwendet eine graustufenerkennungsalgorithmus und deren Ausgabe wird in ein NN gesteckt.
    • Learning: nicht alle Bildprobleme sind für CNN geeignet

    Nandor Poka, Gerhardt Informatik - Big Data problem(s) in biology / bio informatics: a short introduction to bio informatics and a few typical problems that are either data or computation intensive

    • macht PhD in Micro-Biologe
    • seit gestern arbeitet er in Stuttgart
    • "Human Genome Project" hat die Bioinformatik in den 00er Jahren deutlich voran gebracht
    • Areas
      • sequence analysis
      • image/signal processing
      • gene/protein expression
      • network and systems biology
    • current representation in sequencing: De Bruijn graph
    • aktuelles Problem: Parallelisierung von Graphenalgorithmen in einem verteilten System
    • How big is the current data:
      • for each sequencing performaned there is GB to TB of data
      • de-novo assembly size of millions of nodes is data intense
      • aligning read data - matching millions of sequences is compute intense

    next

    • 19.9.
    • Hausaufgabe: https://www.kaggle.com/c/zillow-prize-1
  2. MLUGS Treffen im Juni 2017

    Unser elftes Treffen ist am Dienstag, dem 20.6. in der Marienstrasse 23 bei aexea.

    Themen:

    • Uwe Sterr - Timeseries Prediction
    • Sebastian Muszytowski - Optical quality control on texture images
    • Nandor Poka, Gerhardt Informatik - Big Data problem(s) in biology / bio informatics: a short introduction to bio informatics and a few typical problems that are either data or computation intensive

    Wann:

    20. Juni 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  3. Bericht MLUGS Treffen im April 2017

    Protokoll

    Vorstellungsrunde

    • Andreas;aexea;Software-Entwickler
    • David;Diconium;Digital Analytics Consultant
    • Georg;;Dualer-Student Informatik
    • Alex;aexea;us-business-development
    • Michael;aexea;Software-Entwickler
    • Uwe;St2C;CEO
    • Ashant;;CEO

    1 Nachzügler

    kaggle Hands-On Titanic dataset

    a) using kaggle-website: - https://www.kaggle.com/c/titanic/kernels -> new script - i.e. https://www.kaggle.com/mfandreas/titanic/first-try/edit

    b) running in docker locally - https://github.com/Kaggle/docker-python

    docker run -v $PWD:/tmp/working -w=/tmp/working -p 8888:8888 --rm -it kaggle/python jupyter notebook --no-browser --ip="0.0.0.0" --notebook-dir=/tmp/working --NotebookApp.token=''
    

    Notebook zur letzten Lösung: https://www.kaggle.com/mfandreas/titanic/mlugs-hands-on/notebook

    next

  4. MLUGS Treffen im April 2017

    Unser zehntes Treffen ist am Dienstag, dem 18.4. in der Marienstrasse 23 bei aexea.

    Themen:

    Wann:

    18. April 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  5. Bericht MLUGS Treffen im März 2017

    Protokoll

    Vorstellungsrunde

    • Andreas;aexea;Software-Entwickler
    • Georg;dualer Student
    • Wilhelm;Software-Entickler
    • Simon;Politikwissenschaftsstudent
    • Michael;aexea;Software-Entwickler
    • Robin;Technischer Biologe; Masterarbeit
    • Andreas;Argrarinformatiker
    • Andreas;Luft- und Raumfahrttechniker
    • Uwe;macht Raumfahrt; mehr ML in der Raumfahrt

    RNN

    RNN Support in R

    In R gibt es wenig zu RNNs (z. B. MXNet) und wenn dann schwer verständlich; im April kommt was neues, vielleicht hilft das

    Learning to execute Python in Tensorflow

    RNNs in Java

    distill.pub

    next

  6. MLUGS Treffen im März 2017

    Unser neuntes Treffen ist am Dienstag, dem 21.3. in der Marienstrasse 23 bei aexea.

    Themen:

    Thema: RNN

    jeder macht/zeigt irgendwas mit RNNs

    Inspirationen:

    • https://github.com/sherjilozair/char-rnn-tensorflow
    • http://suriyadeepan.github.io/2017-01-07-unfolding-rnn/
    • http://sebastianruder.com/word-embeddings-1/
    • http://karpathy.github.io/2015/05/21/rnn-effectiveness/
    • https://github.com/kjw0612/awesome-rnn

    Wann:

    21. März 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  7. Bericht MLUGS Treffen im Februar 2017

    Protokoll

    Vorstellungsrunde

    • Andreas;aexea;Software-Entwickler
    • Frank;selbständig
    • Georg;Daimler-TSS;verwendet TensorFlow mit AWS
    • Siegfried;privat;interessiert an ML
    • Michael;aexea;Software-Entwickler
    • Robin;Technischer-Biologe;interessiert an ML
    • Andreas;Landeskontrollverband BW;macht Milchanalyse mit ML
    • Uwe;macht Raumfahrt;versucht ML-Konzept in die Raumfahrt zu bringen
    • Simon;Uni-Stuttgart Politik-Wissenschaftsstudent;macht R

    Andreas Madsack - Tensorflow/Keras in Production @ AX-Semantics

    • Ziel: ein kleines Problem mit Tensorflow lösen um Erfahrung in der Produktionsumgebung zu sammeln
    • Problem: Daten in String/Number/Date unter Einbeziehung des Feldnamens klassifizieren
    • Hintergrund: Die Daten kommen von Kunden und sind für die Generierung von Texten vorgesehen.

    Basics

    • Nutzer können das Ergebnis korrigieren
    • Erste Version mit Tensorflow (0.10), spätere Version mit Keras + Tensorflow, weil Keras Graph und Model in Dateien speichern kann
    • Implementierung mit Keras war einfacher als mit TensorFlow
    • 3 Layer mit 32, 12, 3 Knoten
    • Speichern ist einfach dank keras: model.to_json() bzw. model.save_weights(name); ähnliche Methoden sind inzwischen auch in Tensorflow, aber nicht so einfach zu verwenden

    Architektur

    • Microservices + RPC calls via messages (Django, Celery, RabbitMQ)
    • Microservice besteht aus mehreren Servern (dynamisch skaliert)

    Workflow

    • Neue Daten vom Kunden über API
    • Daten werden über RabbitMQ zur Klassifikation geschickt
    • Keine neue Prediction falls schonmal eine für dieses Projekt lief (falls ja -> skip)
    • Prediction dauert 2–4 Sekunden
    • Ergebnis wird zum nächsten Microservice geschickt; dieser schickt Korrekturen durch den User zurück

    Ergebnis

    • System hat sich kaputt trainiert
    • zu wenig Häufung in den Daten
    • User haben Ergebnis nicht korrigiert
    • wird durch regelbasiertes System ersetzt
    • Workflow funktioniert prinzipiell

    Uwe Sterr - autonomes Fahren end-to-end

    • Nanodegree auf udacity: https://de.udacity.com/course/self-driving-car-engineer-nanodegree--nd013/
    • autosteuern. dabei das lenkrad bedienen (automatisch)
    • 3 kameras. bildvorverarbeitung. dann in ein CNN
    • bilder deutlich verkleinert
    • 16x32x3
    • HSV - https://en.wikipedia.org/wiki/HSL_and_HSV
    • der S-Kanal hat am meisten gebracht
    • model speichern ist in tensorflow relativ kompliziert
    • mit keras deutlich einfacher
    • model.summary() liefert das komplette NN
    • trainiert wird mit einer strecke in einem simulator
    • der test ist dann auf einer neuen strecke, die sehr anders ist. und das trainierte netz ist gut.
    • uwe war begeistert wie einfach es war das NN dazu zu bringen zu generalisieren

    Andreas Werner -- RStudio

    • https://www.rstudio.com/
    • gibt eine Server-version, die man im Browser bedient
    • es gibt neben .R noch .Rmd - http://rmarkdown.rstudio.com/
    • generiert aus dem .Rmd eine PDF mit Auswertungen und Plots
    • kann auch Präsentationen auf HTML basis erzeugen
    • oder mit Widgets, die Graphen interaktiv beeinflussen

    next

    März: 21.03.2017

    Thema: RNN

    • jeder macht irgendwas mit RNNs
    • (in die Ankündigung ein paar Inspirationen zu RNN)

    April: 18.04.2017

    • Simon - Textanalytics mit ML
  8. MLUGS Treffen im Februar 2017

    Unser achtes Treffen ist am Dienstag, dem 21.2. in der Marienstrasse 23 bei aexea.

    Themen:

    • zwei praktische Beispiele mit Keras
    • RStudio

    Wann:

    21. Februar 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  9. Bericht MLUGS Treffen im Januar 2017

    Protokoll

    Vorstellungsrunde

    • Andreas, Aexea, Softwareentwickler
    • Frank, selbständig, hat nichts mit ML im letzten Monat gemacht
    • Arne, selbständig, will was mit ML machen
    • Sigfried, Thyssen-Krupp-Aufzüge, interessiert an ML
    • Wilhelm, software-entwickler, ML nur privat
    • Michael, Aexea, software-entwickler
    • Chrstian, Daimler, Senior-Data-Scientist
    • Andreas, tesat, Luftundraumfahrt-Ingenieur
    • Uwe, selbständig, auch Raumfahrt, macht was mit Kaggle, will ML in der Raumfahrt anwenden
    • Andreas, Landeskontrolverband BW, Milchleistungsprüfung
    • Agrar-Informatikerin Dr. Laura Dale

    Andreas Werner: Vorhersage von Rinderkrankheiten mit Milchspektraldaten

    • beim Landesverband BW für Leistungs- und Qualitätsprüfungen in der Tierzucht e.V. http://www.lkvbw.de/
    • ca. 3mio Milchproben/Jahr
    • Spektralanalyse der Inhaltsstoffe
    • Diagnosen der Tierärzte werden bei ca. 1000 Betrieben gespeichert
    • Ziel: Ketosis-Risiko modellieren
    • alle Proben werden auf stabile Geräte (standardisierte) umgerechnet
    • von 1033 Bändern (FFT) werden 212 Bänder verwendet
    • Ausreiser werden gefiltert (nur bei den Gesundproben)
    • Methode: Lasso/Elastic-Net + Glmnet.Logit
    • Ergebnis: Simmental (Fleckvieh) ist weniger betroffen als Holstein und Braunvieh
    • Landwirt bekommt auf einer Webseite seine Kühe einzeln klassifiziert

    Was soll in den nächsten Terminen gemacht werden?

    • Vorträge? Workshops? Ideen?
      • Prof. Maucher von der HdM fragen
      • hands-on mit h2o arbeiten, für Einsteiger
      • bei Kaggle als Gruppe mitmachen https://www.kaggle.com/c/data-science-bowl-2017
      • https://keras.io/
      • https://www.kaggle.com/c/data-science-bowl-2017

    nächster Termin: 21.2.2017

    Themen:

    • zwei praktische Beispiele mit Keras
    • RStudio
  10. MLUGS Treffen im Januar 2017

    Unser siebtes Treffen ist am Dienstag, dem 17.01. in der Marienstrasse 23 bei aexea.

    Themen:

    • Andreas Werner: Vorhersage von Rinderkrankheiten mit Milchspektraldaten
    • (Vorschläge sind willkommen)

    Wann:

    17. Januar 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart