[3줄 RL] 에이전트는 궁금해요
2021. 8. 6. 22:13ㆍAI Paper Review/Deep RL Papers [EN]
<arxiv> https://arxiv.org/pdf/1705.05363.pdf
1. 안 가본 state를 방문하면 exploration이 정말 잘될 텐데
2. 그럼 안 가본 state를 궁금해하는 모델을 만들자. self-supervised prediction 모델을 학습한 다음 에러만큼 리워드를 주면 curiosity를 정의할 수 있을것이다.
3. sparse한 리워드에 잘 먹히며, 심지어 No reward setting!!! 에서도 잘 된다고 한다.
'AI Paper Review > Deep RL Papers [EN]' 카테고리의 다른 글
[3줄 RL] Curiosity+Contrastive=Sample Efficiency (0) | 2021.08.14 |
---|---|
[3줄 RL] Back to basic (0) | 2021.08.10 |
[3줄 RL] RL + Contrastive = sample efficiency (0) | 2021.08.01 |
[3줄 RL] RL로 QP 풀기 (0) | 2021.07.30 |
[3줄 RL] 빨간 Q (0) | 2021.07.28 |