[3줄 RL] 이미지로 LQR하기
2021. 7. 4. 18:10ㆍAI Paper Review
<arxiv> https://arxiv.org/pdf/1808.09105.pdf
1. 기존 Model-Free DRL은 이미지 observation같은 거로도 잘 학습하지만 sample efficiency가 다소 떨어지고, Model Based Method인 LQR 같은 건 sample efficiency가 좋지만 이미지 같은 건 쓸수 있을리가 없는데 이거 어떻게 두개 못 합칠까?
2. 그래! 이미지를 간단한 행렬로 만들어주는 Representation Learning을 사용해서 거기에 LQR을 적용하면 되겠구나.
3. 최종 성능은 막 좋지 않지만 2시간만에 image observation 만으로 complex manipulation 문제를 풀 정도로 sample efficient한 알고리즘이 나왔는데, 사실 필자는 성능보다도 representation learning+LQR이라는 컨셉이 더 값지다고 생각한다.
'AI Paper Review' 카테고리의 다른 글
[3줄 Vision] BERT+DOGE=BEIT (0) | 2021.07.22 |
---|---|
[3줄 Survey] RL for CO (0) | 2021.07.18 |
[3줄 RL] 암호학과 강화학습의 조합 (0) | 2021.07.06 |
[3줄 퓨샷] Free Lunch For Few-Shot Learning: Distribution Calibration (0) | 2021.06.29 |
[3줄 NLP] How could Neural Networks understand Programs? (0) | 2021.06.29 |