[3줄 RL] 에이전트는 궁금해요

[3줄 RL] 에이전트는 궁금해요

2021. 8. 6. 22:13ㆍAI Paper Review/Deep RL Papers [EN]

<arxiv> https://arxiv.org/pdf/1705.05363.pdf

1. 안 가본 state를 방문하면 exploration이 정말 잘될 텐데

2. 그럼 안 가본 state를 궁금해하는 모델을 만들자. self-supervised prediction 모델을 학습한 다음 에러만큼 리워드를 주면 curiosity를 정의할 수 있을것이다.

3. sparse한 리워드에 잘 먹히며, 심지어 No reward setting!!! 에서도 잘 된다고 한다.

'AI Paper Review > Deep RL Papers [EN]' 카테고리의 다른 글

[3줄 RL] Curiosity+Contrastive=Sample Efficiency (0)	2021.08.14
[3줄 RL] Back to basic (0)	2021.08.10
[3줄 RL] RL + Contrastive = sample efficiency (0)	2021.08.01
[3줄 RL] RL로 QP 풀기 (0)	2021.07.30
[3줄 RL] 빨간 Q (0)	2021.07.28

[3줄 RL] Curiosity+Contrastive=Sample Efficiency 2021.08.14
[3줄 RL] Back to basic 2021.08.10
[3줄 RL] RL + Contrastive = sample efficiency 2021.08.01
[3줄 RL] RL로 QP 풀기 2021.07.30

Bellman Bellman 님의 블로그입니다.

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Bellman

Bellman

태그

최근글

댓글

공지사항

아카이브

'AI Paper Review > Deep RL Papers [EN]' 카테고리의 다른 글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역