[3줄 AutoML] 도메인 전문가 게섯거라, 에이전트가 피쳐도 뽑아줄게

2021. 7. 13. 21:57카테고리 없음

<arxiv> https://arxiv.org/pdf/1709.07150.pdf

1. Feature Extraction은 머신러닝에서 되게 큰 문제인데, 도메인 전문가를 고용해야 하기 때문이고 이분들의 몸값은 대개 많이 비싸기 때문이다. 이것을 자동화할 수는 없을까? 라는 질문이 떠오른다.

2. Feature Extraction은 되게 어려운 문제지만 사실 아웃풋은 그냥 로우 데이터에 어떤 연산을 적용해 무엇을 무엇과 조합하는지에 대한 계산, 즉 계산 그래프로써 표현될 수 있는데 또 이런거 잘 찾는 방법론이 강화학습 이라는 것을 우리는 NAS와 NOS 등에서 보았다. 그래서 이번에도 강화학습을 들고 왔다!

각 노드는 풀고자 하는 문제의 부분해(피쳐) 이다
정해진 스텝(budget)를 고려하여 적절히 exploration-exploitation 가능한 Q Learning을 활용한다.


3. 로우데이터를 그대로 넣는 모델은 물론 기존 Automated FE 모델들까지 뛰어넘는 모습이다. 금융 데이터에 이거 써보면 어떨지 정말 궁금하다.