Bericht MLUGS Treffen im Februar 2018
20. February 2018
Protokoll
Vorstellungsrunde
- Andreas, Software-Entwickler, AX Semantics
- Uwe, Nachrichten-Techniker, St2c (Raumfahrt)
- Qifeng, Bio-Chemie, Uni-Tübingen
- Wilhelm, Software-Entwickler, privat
- Jens, Data-Scientist, Gigatronic
- Patrick, Data-Scientist, Gigatronic
- Michael, Software-Entwickler, AX Semantics
- Omkar, Mechanik, Uni-Stuttgart
- Markus, Applikations-Ing, Mathworks
- Enrique, Software-Entwcickler, Mimacom
- Jan, Entwickler, Luxflux
- Sarah, Seo-Consultant, Diconium
- Jörg, Berater, Detecon
+2 Nachzügler
Uwe Sterr - Einführung ins reinforced learning anhand einer Verkehrssimulation und eines Beispiels aus der openai gym
Behandelte Themen: Markov Decision Process, Value Function, Q-Learning, Deep Q-Learning
Unter https://github.com/uwesterr/Connected-Autonomous-Driving findet ihr die Mindmap zum Vortrag.
Ziel: Was kann man mit RL lösen? Welche Probleme passen auf RL?
Beispiel: Autosimlulation vom MIT
Wir suchen für die Eingabe die passende Aktion, um das Ziel zu erreichen. Eine nichts-Aktion ist auch eine Aktion. Wenn die Aktion gut war, dann bekomme ich eine Belohnung. Ziel ist es die Belohnung zu maximieren.
dabei muss auch gelernt werden, welche aktionen sehr schlecht sind. die gewichte der aktionsübergänge können dabei auch gelernt werden. RL zu trainieren dauert unter Umständen sehr lange.
Q-Values am Beispiel von Gridworlds
pacman spielt man indem man ein CNN vorschaltet und dessen features nimmt man. die reward-function ist teil der loss-function
um alles zu sehen und nicht in einem lokalen minimun festzustecken, muss man hin und wieder exploration machen (irgendwas anderes machen)
da es so lange dauert, braucht man meistens einen simulator.
selber rumspielen mit openai: https://github.com/openai/gym
Ziel: Was kann man mit RL lösen? Welche Probleme passen auf RL?
https://www.alexirpan.com/2018/02/14/rl-hard.html
AlphaGo-Film: https://www.netflix.com/title/80190844
in gaming: - https://arxiv.org/pdf/1609.05521.pdf - https://arxiv.org/pdf/1708.04782.pdf
News
Conferences
Vergangene:
- Applied Machine Learning Days, Lausanne -- war wohl gut.
Zukunft: Liste mit Konferenzen in Europa
Kurse/Lernmaterial
- Der Kurs zu Sequence Models von Andrew Ng ist seit kurzem verfügbar
ML/AI in der Presse
KW 03
- RiseML bringt Deep Learning zu Kubernetes
- Google verspricht einfachen Zugriff auf Machine Learning in der Cloud
KW 04
- Facebook gibt eigene Objekterkennung frei (heise)
- Neuronale Netzwerke erschaffen Fake-Porn und Hitler-Parodien
KW 05
KW 06
- Sattelzug fährt autonom quer durch die USA
- Künstliche Intelligenz und große Gefühle
- Neues Open-Source-Framework für Machine-Learning-Modelle auf Kubernetes
KW 07
- Gesichtserkennung ist zuverlässig - bei weißen Männern
- Googles Cloud-TPU kosten 6,50 US-Dollar pro Stunde
- Effizientes Maschinenlernen
- Effizienteres Maschinenlernen für neuronale Netze
- ARM bringt Machine Learning in Smartphones
- Daten-Wissenschaftler Pedersen soll eBay schlauer machen
- Google beschleunigt Modell-Training mit Cloud TPUs
- Facebook kündigt C++ Library Tensor Comprehensions an
KW 08
- Deep-Learning-System analysiert Augenscans nach Krankheiten
- Google lässt Roboter spielerisch neue Fähigkeiten lernen
next
Thema: Einführung in Sequence-Models (Andreas Madsack)
mit praktischen Beispielen und Teaser auf Verwendung in der NLG
Date: 2018-03-20