Multiple Sources of Reward in Reinforcement Learning (bearbeitet)

Master's Thesis, Johannes Feldmaier, Forschungspraxis |


In dieser Masterarbeit soll der Algorithmus von Christian Shelton um Ansätze aus der Prospect Theory von Kahneman und Tversky erweitert werden. 

Im Ansatz soll eine Simulation eines Lade-/Entlade-Problems aus der Logistik implementiert werden und anschließend mittels Reinforcement Learning eine entsprechende Strategie gelernt werden. Diese Simulation soll anschließend erweitert werden, sodass der lernende Agent in der Simulation zusätzlich Gewinne und Verluste für jede Lieferung erhält. Diese Gewinne bzw. Verluste sollen dabei entsprechend den Grundsätzen der Prospect Theory gewichtet werden. 

Im Ergebnis erwarten wir ein dem Menschen ähnlicheres Verhalten während der Simulation. 

Voraussetzungen: Kenntnisse in Matlab/Python, Grundlagen Reinforcement Learning, Interesse an maschinellen Lernalgorithmen und der interdisziplinären Arbeit (Wirtschaftswissenschaften)

Art der Arbeit: Die Aufgabe eignet sich für eine Masterarbeit oder Forschungspraxis. Das Thema kann ab sofort bearbeitet werden.

Ansprechpartner: Für weitere Informationen melden Sie sich bei Johannes Feldmaier.