Xiaofeng Flint Fan
Theses & Labs
Past Theses & Labs | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Title | Type | Contact/Supervisor | Assigned | Student(s) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Federated Reinforcement Learning with Heterogeneous Environments [confidential] | S | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SUBER: An RL Environment with Simulated Human Behavior for Recommender Systems [confidential] | G | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | , | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reinforcement Learning of TSP Heuristics with Message Passing Neural Networks | G | Xiaofeng Flint Fan, Joël Mathys | FS 23 | , | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Decentralized Federated Policy Gradient with Provably Fast Convergence and Byzantine Fault Tolerance [confidential] | S | Xiaofeng Flint Fan, Florian Grötschla | HS 22 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reinforcement Learning for the Jass AI [confidential] | S | Benjamin Estermann, Xiaofeng Flint Fan | HS 22 |