1. MLUGS Treffen im Januar 2018

    Unser fünfzehntes Treffen ist am Dienstag, dem 16.01. in der Marienstrasse 23 bei AX Semantics (aexea).

    Language: German only.

    Themen:

    • Andreas Madsack - Erfahrungsbericht: DeepLearning basierte Dependency Parser (SyntaxNet, DRAGNN, CoreNLP, Spacy)

    • Uwe Sterr - Diskussion: Signalprozessierung mit machine learning

      • Methoden (NN, SVM)
      • Vorgehensweisen
      • Preprocessing (FFT, STFFT, wavelets)
    • (weitere Vorschläge sind willkommen!)

    Wann:

    16. Januar 2018 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, AX Semantics (aexea) (1. OG)

    Bitte meldet euch an unter:

    https://www.meetup.com/Machine-Learning-UserGroup-Stuttgart

  2. Bericht MLUGS Treffen im November 2017

    Protokoll

    Vorstellungsrunde

    • Michael; AX Semantics; Software-Entwickler
    • Andreas; AX Semantics; Software-Entwickler
    • Uwe;ST2C;macht Raumfahrt
    • Wilhelm;privat;Software-Entwickler
    • Silvana;;Data-Scientist,eigentlich NLP
    • Jörg;privat;Finanz-ML

    Uwe Sterr - Entity Embeddings of Categorical Variables

    mlugs 2018

    • nächster Termin Januar
    • meetup statt letsmeet yay/nay? yay
    • Termine vorher anlegen/announcen!
    • das schwere sind die Vorträge

    Wilhelm Brasch - OCR mit Deep Learning

    • privates DL projekt
    • chinesische untertitel erkennung
    • fast alle chinesischen videos haben untertitel und diese entsprechen meist der gesprochenen Sprache
    • ziel ist es 3000 schriftzeichen zu können (als chinesischlernender)
    • trainingsset: 1000/kategorie -> 10000 kategorien -> 10mio
    • generator kann unendlich viele daten erzeugen
    • der generator mit freetype; opencv/numpy
    • wichtig am model: batchnorm; relu
    • deutliche verbesserung brachte ein streifen generator
    • aktuell 99% accuracy
    • mit sliding window über den text. viele false positives

    • plan: mehr validierungsdaten; zusätzlich zur classification noch eine zeichendetection

    • andere idee: regression head, um den hintergrund rauszufiltern

    Michael Käufl - Hidden Technical Debt in Machine Learning Systems

    • https://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdf
    • von google
    • 9 Abschnitte
    • das teure ist die Wartung nicht die Entwicklung
    • "technical dept" soll die langzeitkosten aufzeigen
    • die gefahr liegt in der "hidden technical dept"
    • ziel vom abbau der technischen schuld ist bessere wartbarkeit zu bekommen
    • change anything changes everything
    • ein feature hinzufügen/modifizieren/entfernen kann das ganze model verändern
    • correction cascades: z.b. lernen einer korrektur auf basis eines ursprungsmodels. wenn man allerdings das ursprungsmodel anpasst, dann hat man probleme mit dem darauf aufbauenden model
    • unklare consumer. visibility dept!
    • data dependencies können sich wie building dept verhalten. vor allem weil das tooling noch nicht so gut ist
    • unstable data dependencies durch versionierung/tagging lösen
    • ML anti-patterns:
    • glue code - wechsel zu anderen packages ist schwerer -> common apis verwenden/entwickeln
    • pipeline jungles - datenaufbereiten ist das häufiger
    • dead experimental codepaths
    • abstraction dept - es gibt noch keine basic abstraction für ML
    • multi-language-smell
    • prototype-smell - weiterverwendung des prototyps
    • configuration dept - häufig nachrangig behandelte konfiguration
    • wie verhalten sich manuell gewählte thresholds auf real-world-probleme und veränderungen
    • monitoring + testing: prediction bias / action limits / up-stream producers (hat sich die qualität der fremd-daten verändert?)
    • reproducibility dept
    • cultural dept: ML research vs. engineering

    • conclusion:

    • time for new algorithmus to full scale test?
    • wie schnell können neue mitarbeiter auf den aktuellen stand gebracht werden?
  3. MLUGS Treffen im November 2017

    Unser vierzehntes Treffen ist am Dienstag, dem 21.11. in der Marienstrasse 23 bei aexea.

    Themen:

    • Uwe Sterr - Entity Embeddings of Categorical Variables - https://arxiv.org/pdf/1604.06737.pdf

    • Wilhelm Brasch - OCR mit Deep Learning

    • Michael Käufl - Hidden Technical Debt in Machine Learning Systems

    Wann:

    21. November 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  4. Bericht MLUGS Treffen im Oktober 2017

    Protokoll

    Vorstellungsrunde

    • Andreas; AX Semantics; Software-Entwickler
    • Wilhelm; Software-Entwickler, privat ML
    • Uwe; macht Raumfahrt, ML in der Raumfahrt
    • Barbara; macht Steno
    • Jörg; Privat; Buchhaltung

    Kaggle - Zillow’s Home Value Prediction

    https://www.kaggle.com/c/zillow-prize-1#timeline

    Deadline war am 2017-10-16.

    Object-Detection

    viele machen gerade (wieder) Object-Detection. Weil jetzt genug Leute Zeit hatten, um https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html auszuprobieren.

    Paperspace

    https://www.paperspace.com/&R=BI3LIF (mit referral code gibt es 10$ Guthaben zum rumspielen.)

    next

    Termin: 2017-11-21 Thema: Entity Embeddings of Categorical Variables - https://arxiv.org/pdf/1604.06737.pdf

  5. MLUGS Treffen im Oktober 2017

    Unser dreizehntes Treffen ist am Dienstag, dem 17.10. in der Marienstrasse 23 bei aexea.

    Themen:

    • Kaggle: Zillow’s Home Value Prediction - Nachbesprechung

      https://www.kaggle.com/c/zillow-prize-1#timeline

    • (weitere Vorschläge sind willkommen!)

    Wann:

    17. Oktober 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  6. Bericht MLUGS Treffen im September 2017

    Protokoll

    Vorstellungsrunde

    • Andreas; Aexea; Software-Entwickler
    • Frank; hat eine eigene Firma; interessiert sich für chatbots
    • Michael; Aexea; Softwa
    • Wilhelm; macht privat ML; Software-Entwickler
    • Andreas; ; Software-Entwickler
    • Jörg; privat; hat Kurs zu ML beendet, finance
    • Christian; Daimler; Software-Entwickler
    • Andreas; Luft- und Raumfahrttechniker, macht noch kein ML, macht python in der Raumfahrt
    • Benjamin; technischer BWLer; ist interessiert

    +1 Nachzügler

    Andreas Madsack - Feuchtigkeitsmessung aus Fotos mittels CNNs

    Original Talk: https://cfp.mrmcd.net/2017/talk/EFZ97G/ (inklusive youtube video)

    Data, Code and Experiment: https://github.com/mfa/cress-classify

    Kaggle - Zillow’s Home Value Prediction

    https://www.kaggle.com/c/zillow-prize-1#timeline

    • eine Lösung unter Verwendung von (Floydhub)[https://floydhub.com/] von Andreas

    misc

    • https://www.coursera.org/specializations/deep-learning
    • https://www.youtube.com/watch?v=IxQtK2SjWWM

    Instructors:

    • Chris Manning
    • Richard Socher

    next

    Termin: 2017-10-17 Themen: - Zillow Competition Nachbesprechung

  7. MLUGS Treffen im September 2017

    Unser zwölftes Treffen ist am Dienstag, dem 19.9. in der Marienstrasse 23 bei aexea.

    Themen:

    • Andreas Madsack - Feuchtigkeitsmessung aus Fotos mittels CNNs

      Schrittweise Demo des CNN aus https://cfp.mrmcd.net/2017/talk/EFZ97G/

    • Kaggle: Zillow’s Home Value Prediction

      https://www.kaggle.com/c/zillow-prize-1#timeline

    Wann:

    19. September 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  8. Bericht MLUGS Treffen im Juni 2017

    Protokoll

    Vorstellungsrunde

    • Andreas; Aexea; Software-Entwickler
    • Uwe; macht Raumfahrt; will ML in der Raumfahrt umsetzen
    • Eva; macht app/webapp; next personalisierung
    • Wilhelm; Software-Entwickler; macht DL privat
    • Jörg; Finance/Accounting
    • Andreas; Agrarinformatiker; Milchauswertungen
    • Ashant; E-Commerce; ERP/Personalisierung
    • Frank; App/Web und ML nebenher
    • Nandor; arbeitet mit Frank; macht Bioinformatik
    • Oliver; Optikerabrechnungszentrum; hat viele Daten
    • Sebastian; macht Big-Data auf dem Mainframe
    • Andreas; Luft- und Raumfahrttechniker; ist interessiert an ML

    • 1 Nachzügler

    Uwe Sterr - Timeseries Prediction

    • thema heute: feature extraction / nicht das ANN
    • bivariante / univariante (non)-linear measures
    • univariante linear measures:
      • variance, skewness, kurtosis are important statistical moments
      • FFT
      • Wavelets
      • Autoregressive moving averages
    • bivariante linear measures:
      • maximum linear cross-correlation
      • linear coherence (simmilarity between signals over time)
    • bivariante non-linear measures
      • non-linear interdepence (how do signals correlate in a non-linear system?)
      • phase synchronization measures
    • decomposition of time series:
      • observed, trend, seasonal, random are measures that we want to tackle with ML and use as an input rather than the "raw" data.
      • neural networks may replace standard algorithms

    Sebastian Muszytowski - Optical quality control on texture images

    • sollte was mit ML machen, weil es cool ist
    • Problem: Qualistätskontrolle von Defekten auf Texturen
    • erster Ansatz: alles in ein CNN. Fehlerquote von 100%
    • zweiter Ansatz: alles kleiner machen; statt 512x512 in 16x16 -> Problem overfitting
    • dritter (erfolgreicher) Ansatz: verwendet eine graustufenerkennungsalgorithmus und deren Ausgabe wird in ein NN gesteckt.
    • Learning: nicht alle Bildprobleme sind für CNN geeignet

    Nandor Poka, Gerhardt Informatik - Big Data problem(s) in biology / bio informatics: a short introduction to bio informatics and a few typical problems that are either data or computation intensive

    • macht PhD in Micro-Biologe
    • seit gestern arbeitet er in Stuttgart
    • "Human Genome Project" hat die Bioinformatik in den 00er Jahren deutlich voran gebracht
    • Areas
      • sequence analysis
      • image/signal processing
      • gene/protein expression
      • network and systems biology
    • current representation in sequencing: De Bruijn graph
    • aktuelles Problem: Parallelisierung von Graphenalgorithmen in einem verteilten System
    • How big is the current data:
      • for each sequencing performaned there is GB to TB of data
      • de-novo assembly size of millions of nodes is data intense
      • aligning read data - matching millions of sequences is compute intense

    next

    • 19.9.
    • Hausaufgabe: https://www.kaggle.com/c/zillow-prize-1
  9. MLUGS Treffen im Juni 2017

    Unser elftes Treffen ist am Dienstag, dem 20.6. in der Marienstrasse 23 bei aexea.

    Themen:

    • Uwe Sterr - Timeseries Prediction
    • Sebastian Muszytowski - Optical quality control on texture images
    • Nandor Poka, Gerhardt Informatik - Big Data problem(s) in biology / bio informatics: a short introduction to bio informatics and a few typical problems that are either data or computation intensive

    Wann:

    20. Juni 2017 um 18:30

    Wo:

    Marienstrasse 23, Stuttgart-West, aexea (1. OG)

    Bitte meldet euch an unter:

    https://www.letsmeet.click/c/machine-learning-user-group-stuttgart

  10. Bericht MLUGS Treffen im April 2017

    Protokoll

    Vorstellungsrunde

    • Andreas;aexea;Software-Entwickler
    • David;Diconium;Digital Analytics Consultant
    • Georg;;Dualer-Student Informatik
    • Alex;aexea;us-business-development
    • Michael;aexea;Software-Entwickler
    • Uwe;St2C;CEO
    • Ashant;;CEO

    1 Nachzügler

    kaggle Hands-On Titanic dataset

    a) using kaggle-website: - https://www.kaggle.com/c/titanic/kernels -> new script - i.e. https://www.kaggle.com/mfandreas/titanic/first-try/edit

    b) running in docker locally - https://github.com/Kaggle/docker-python

    docker run -v $PWD:/tmp/working -w=/tmp/working -p 8888:8888 --rm -it kaggle/python jupyter notebook --no-browser --ip="0.0.0.0" --notebook-dir=/tmp/working --NotebookApp.token=''
    

    Notebook zur letzten Lösung: https://www.kaggle.com/mfandreas/titanic/mlugs-hands-on/notebook

    next