Bericht MLUGS Treffen im Juni 2017
20. June 2017
Protokoll
Vorstellungsrunde
- Andreas; Aexea; Software-Entwickler
- Uwe; macht Raumfahrt; will ML in der Raumfahrt umsetzen
- Eva; macht app/webapp; next personalisierung
- Wilhelm; Software-Entwickler; macht DL privat
- Jörg; Finance/Accounting
- Andreas; Agrarinformatiker; Milchauswertungen
- Ashant; E-Commerce; ERP/Personalisierung
- Frank; App/Web und ML nebenher
- Nandor; arbeitet mit Frank; macht Bioinformatik
- Oliver; Optikerabrechnungszentrum; hat viele Daten
- Sebastian; macht Big-Data auf dem Mainframe
-
Andreas; Luft- und Raumfahrttechniker; ist interessiert an ML
-
1 Nachzügler
Uwe Sterr - Timeseries Prediction
- thema heute: feature extraction / nicht das ANN
- bivariante / univariante (non)-linear measures
- univariante linear measures:
- bivariante linear measures:
- maximum linear cross-correlation
- linear coherence (simmilarity between signals over time)
- bivariante non-linear measures
- non-linear interdepence (how do signals correlate in a non-linear system?)
- phase synchronization measures
- decomposition of time series:
- observed, trend, seasonal, random are measures that we want to tackle with ML and use as an input rather than the "raw" data.
- neural networks may replace standard algorithms
Sebastian Muszytowski - Optical quality control on texture images
- sollte was mit ML machen, weil es cool ist
- Problem: Qualistätskontrolle von Defekten auf Texturen
- erster Ansatz: alles in ein CNN. Fehlerquote von 100%
- zweiter Ansatz: alles kleiner machen; statt 512x512 in 16x16 -> Problem overfitting
- dritter (erfolgreicher) Ansatz: verwendet eine graustufenerkennungsalgorithmus und deren Ausgabe wird in ein NN gesteckt.
- Learning: nicht alle Bildprobleme sind für CNN geeignet
Nandor Poka, Gerhardt Informatik - Big Data problem(s) in biology / bio informatics: a short introduction to bio informatics and a few typical problems that are either data or computation intensive
- macht PhD in Micro-Biologe
- seit gestern arbeitet er in Stuttgart
- "Human Genome Project" hat die Bioinformatik in den 00er Jahren deutlich voran gebracht
- Areas
- sequence analysis
- image/signal processing
- gene/protein expression
- network and systems biology
- current representation in sequencing: De Bruijn graph
- aktuelles Problem: Parallelisierung von Graphenalgorithmen in einem verteilten System
- How big is the current data:
- for each sequencing performaned there is GB to TB of data
- de-novo assembly size of millions of nodes is data intense
- aligning read data - matching millions of sequences is compute intense
next
- 19.9.
- Hausaufgabe: https://www.kaggle.com/c/zillow-prize-1