[3줄 RL] COBRA!

2021. 8. 15. 23:59AI Paper Review/Deep RL Papers [EN]

<arxiv> https://arxiv.org/pdf/1905.09275.pdf
1. Goal-Objected RL 셋업은 매우 Sample-Efficient한 접근을 가능하게 했고, Model-Based+Representation Learning또한 Sample Efficiency를 업그레이드 했지만 아직 복잡한 환경에 사용하기는 어렵다. Curiosity 기반 Exploration은 매우 Sparse한 환경에서도 Robust한 학습을 보여줬다.

2. 이거 3가지를 다 섞은 모델은 어떨까? Object들의 Representation을 Curiosity에 기반해 잘 뽑아낼 수 있으면서도 Robust하고 Sample-Efficient하지 않을까? COBRA를 소개합니다!

보다시피 다 섞어 놓았다 정말.

3. Curiosity에 기반한 학습으로 Object들의 Representation을 잘 뽑을 수 있었고, 그에 따라 성능과 Robustness가 향상되었다.