Xiaofeng Flint Fan

fxf@u.nus.edu |
Theses & Labs
Past Theses & Labs | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Title | Type | Contact/Supervisor | Assigned | Student(s) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
![]() | Federated Reinforcement Learning with Heterogeneous Environments [confidential] | S | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | Hei Yi Mak | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | SUBER: An RL Environment with Simulated Human Behavior for Recommender Systems [confidential] | G | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | Nathan Corecco, Giorgio Piatti | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Reinforcement Learning of TSP Heuristics with Message Passing Neural Networks | G | Xiaofeng Flint Fan, Joël Mathys | FS 23 | Loic Holbein, Yannick Schmid | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Decentralized Federated Policy Gradient with Provably Fast Convergence and Byzantine Fault Tolerance [confidential] | S | Xiaofeng Flint Fan, Florian Grötschla | HS 22 | Philip Jordan | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Reinforcement Learning for the Jass AI [confidential] | S | Benjamin Estermann, Xiaofeng Flint Fan | HS 22 | Jonas Althaus |