[3줄 RL] 재무부 대신 에이전트

2021. 7. 13. 22:09AI Paper Review/Deep RL Papers [EN]

<arxiv> https://arxiv.org/pdf/2004.13332.pdf

1. 세금정책은 공평하면서도 효율적인 방향으로 만들어져야 한다. 우리는 세금정책과 같은 것들을 Agent-Based Simulation이라는 물건으로 해결할 수 있는데, 간단하게 말하면 가상세계를 만들어 에이전트끼리 상호작용하는 것을 관찰하는 것이다.

2. 효율성이 각기 다른(생산성이 다른) 에이전트들을 집어넣고 세금정책을 결정하는 에이전트도 집어넣은 다음, 각각에 대해 강화학습을 수행한다. 생산성이 다른 에이전트들은 건설, 거래, 이동을 통해 생산성을 최대화하고, 세금정책을 결정하는 에이전트는 생산성과 공평성을 최대화한다. 기본적으로 두가지 에이전트들은 모두 그리드에 표현된 오픈 맵을 본다.

3. 미국의 세금정책과 베이스라인 세금정책에 비해 큰 폭으로 효율성을 향상시켰다. 강화학습+Agent-Based Modeling으로 의사결정과정을 최적화하는 접근은 매우 유망한 접근으로 생각한다.