[3줄 RL] 운송수단도 RL로
2021. 7. 18. 10:19ㆍAI Paper Review/Deep RL Papers [EN]
<openreview> https://openreview.net/pdf?id=SkyQShLaf
1. 현대의 교통 시스템은 많이 복잡해져서 최적화가 필요하며, 이것은 커다란 nonlinear combinatorial optimization으로 풀 수 있다.
2. 차원의 저주를 피하기 위해 오토인코더를 사용하여 현재 상태(origin-dest pairs) 를 축소하여 DQN 네트워크에 피드하고, 에이전트는 O-D 페어를 어떻게 추가할지를 결정하고 효율성 등을 리워드로 받는다.
3. 결론적으로는 최적화가 잘 되는 것을 보여주었으며, Neural Combinatorial Optimization+Deep RL 컨셉이 할수있는 일이 정말 많은 것 같다는 생각이 든다. 독자님들도 이런 어플리케이션 논문 재밌는거 있으면 추천해주시라.
'AI Paper Review > Deep RL Papers [EN]' 카테고리의 다른 글
[3줄 RL] 과학적 발견도 에이전트에게 맡겨둬! (0) | 2021.07.21 |
---|---|
[3줄 RL] 리워드 없이도 배운다 (1) | 2021.07.19 |
[3줄 RL] RL+Self-Supervised=Adaptation (2) | 2021.07.15 |
[3줄 RL] 재무부 대신 에이전트 (0) | 2021.07.13 |
[3줄 RL] SMiRL: Surprise Minimizing Reinforcement Learning in Unstable Environme (0) | 2021.07.02 |