-
DPGResearch/... 2024. 12. 17. 23:03
* DPG
* KL-Adaptive DPG
* KL-Adaptive DPG with baseline
* RL & DM
매번 느끼지만
연구를 발전시켜 가는 모습은 아름답다.
RM vs DM 통합적인 perspective를 제시하는 것도 good.
통찰력 있는 논문들 (예를 들어 PEFT 의 unifed view 를 제시한 논문처럼) 이 있다.
진정 연구자들의 모습이구나. 멋있어요.
'Research > ...' 카테고리의 다른 글
(2/3) GAN, F-Divergence, IPM (0) 2024.12.21 (1/3) GAN, F-Divergence, IPM (0) 2024.12.20 On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting (0) 2024.12.17 [DPG] Distributional Reinforcement Learning for Energy-Based Sequential Models (0) 2024.12.12 A Distributional Approach to Controlled Text Generation (0) 2024.12.09