[3줄 RL] 에이전트는 궁금해요

2021. 8. 6. 22:13AI Paper Review/Deep RL Papers [EN]

<arxiv> https://arxiv.org/pdf/1705.05363.pdf

1. 안 가본 state를 방문하면 exploration이 정말 잘될 텐데

2. 그럼 안 가본 state를 궁금해하는 모델을 만들자. self-supervised prediction 모델을 학습한 다음 에러만큼 리워드를 주면 curiosity를 정의할 수 있을것이다.

ICM module

3. sparse한 리워드에 잘 먹히며, 심지어 No reward setting!!! 에서도 잘 된다고 한다.

Experimental Results