-
문득 든 생각인데.. GAN도 일종의 RL 아닌감?Campus Life 2024. 12. 11. 13:49
GAN에서 generator가 생성한 image를 discriminator가 REAL/FAKE 판별하면 그 signal을 받아서 generator가 학습을 하잖아.
그러면 discriminator가 주는 signal을 일종의 reward로 보고, 이를 받아서 학습하는 generator를 agent라고 했을 때
이 interaction loop은
일종의 reinforcement 아닌감?
나 이 생각에서 오류가 있다면 누가 좀 알려주세요..ㅎㅎ
돌아오지 않는 메아리.... ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
나 누구한테 말하는 거니.. ㅎㅎㅎ ㅠㅠㅠㅠ
'Campus Life' 카테고리의 다른 글
어려운 게 default 값이지? (0) 2024.12.17 신기한 게 GAN도 결국 (0) 2024.12.17 Instability of Actor-Critic Algorithms diagnosed by DPO (0) 2024.12.14 DPO objective 쉽고 상세하게 deriving (0) 2024.12.13 가끔 논문 보며 웃는다 (0) 2024.12.05