2021/06(14)
-
WHAT MATTERS FOR ON-POLICY DEEP ACTOR-CRITIC METHODS? A LARGE-SCALE STUDY
https://openreview.net/pdf?id=nIAxjsniDzg We train over 250’000 agents in five continuous control environments of different complexity and provide insights and practical recommendations for the training of on-policy deep actor-critic RL agents. 0. Deep Actor-Critic Methods Policy-Based 계열의 Deep Actor-Critic Method들은 Hopper, Humanoid와 같은 D4RL 벤치마크에 있는 continuous task에서 아주 좋은 성능을 냈다. REINFORCE, TR..
2021.06.16 -
Decision Transformer: Attention is all RL Need?
https://arxiv.org/pdf/2106.01345.pdf Instead of training a policy through conventional RL algorithms like temporal difference (TD) learning, We will train transformer models on collected experience using a sequence modeling objective. 0. 기존 RL의 학습방법과 Credit Assignement Problem 기존 RL은 위대한 수학자 Bellman에 의해 만들어진 Bellman Equation, 즉 TD를 이용해 학습했다. TD 러닝의 아이디어는 아주 간단하다. t스텝에는 t+1 스텝의 리워드를 알 수 없다. 그러므로 ..
2021.06.12 -
퀀트 논문은 어디서 찾나? [지속적인 업데이트 예정]
Google Scholar (https://scholar.google.co.kr) 가장 나이브하고 좋은 방법이다. Quantative Finance, Asset Allocation, Cryptocurrencies, Trading 등으로 검색하면 많이 나온다 Google 학술 검색 COVID-19에 관한 기사 거인의 어깨에 올라서서 더 넓은 세상을 바라보라 - 아이작 뉴턴 죄송합니다. 자바스크립트를 사용하도록 설정하지 않으면 일부 기능이 작동하지 않을 수 있습니다. 최적의 scholar.google.co.kr Arxiv (https://arxiv.org/archive/q-fin) 우리의 오랜 친구 아카이브는 퀀트 논문도 다 정리해 놓았다. 최신 논문을 읽고 이해할 수 있는 수준이 아니면 찾기 힘든 것은 단..
2021.06.11 -
[KOREAN] MLP Mixer: An all-MLP Architecture for Vision
https://arxiv.org/pdf/2105.01601.pdf As the history of computer vision demonstrates, the availability of larger datasets coupled with in- creased computational capacity often leads to a paradigm shift 큰 이벤트가 될 논문이라 생각해서 나중에 입문하실 초보 분들을 위해 초보가 한국어로 리뷰를 작성하기로 했다. 1. 비전을 위한 신경망 아키텍쳐 비전을 위한 신경망 아키텍쳐들은 본 글의 머릿말과 같이 데이터셋의 크기가 커지고, 컴퓨터 자원의 성능이 올라감에 따라 패러다임이 계속 바뀌어 왔다. 기존 휴리스틱, 머신러닝 기반 컴퓨터 비전부터, ResNet과..
2021.06.09 -
매우 짧고 간단한 스크립트로 Binance 선물/현물 데이터 모두 다운받기
0. 사용 가능한 스크립트만 받아다 쓰실 분들은 맨 밑에 깃헙 링크가 있으니 가서 받고 쓰시면 된다. 1. CCXT CCXT(CryptoCurrency eXchange Trading library) 는 매우 많은 암호화폐 거래소 API를 커버하는 라이브러리이다. php, python, js 등을 지원하는 매우 활용도가 높은 라이브러리이다. 데이터 다운로드, 주문 등이 가능하다. 2. Binance Binance는 거래대금 기준 세계 1위 선물거래소이다. 아주 다양한 (현재 시점 100개 이상) 의 USDT 기반 선물과 인버스 선물을 지원한다. 미국 등을 제외한 바이낸스가 사용가능한 국가에서는 대부분 바이낸스를 쓰는 것 같다. 3. 스크립트 그럼 긴말없이 CCXT를 이용해 모든 바이낸스 선물 데이터를 다운..
2021.06.09 -
LHOPT: A Generalizable Approach to Learning Optimizers
https://arxiv.org/abs/2106.00958 A Generalizable Approach to Learning Optimizers A core issue with learning to optimize neural networks has been the lack of generalization to real world problems. To address this, we describe a system designed from a generalization-first perspective, learning to update optimizer hyperparameters instead arxiv.org A core issue with learning to optimize neural netwo..
2021.06.06