Xiaofeng Flint Fan
![Xiaofeng Flint Fan Xiaofeng Flint Fan](http://tik-db.ee.ethz.ch/file/88010c11fbc991ff207fa2cc42c587ca/IMG238.jpeg)
Theses & Labs
Past Theses & Labs | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Title | Type | Contact/Supervisor | Assigned | Student(s) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
![]() | Federated Reinforcement Learning with Heterogeneous Environments [confidential] | S | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | SUBER: An RL Environment with Simulated Human Behavior for Recommender Systems [confidential] | G | Xiaofeng Flint Fan, Luca Lanzendörfer | FS 23 | , | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Reinforcement Learning of TSP Heuristics with Message Passing Neural Networks | G | Xiaofeng Flint Fan, Joël Mathys | FS 23 | , | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Decentralized Federated Policy Gradient with Provably Fast Convergence and Byzantine Fault Tolerance [confidential] | S | Xiaofeng Flint Fan, Florian Grötschla | HS 22 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | Reinforcement Learning for the Jass AI [confidential] | S | Benjamin Estermann, Xiaofeng Flint Fan | HS 22 |