Read

[주식논문] 캔들스틱차트와 CNN을 이용한 갭 예측 연구

quantoasis 2023. 2. 4. 13:15
반응형

 

 
알고리즘트레이딩은 규칙기반 매매를 함으로써 투자자가 가질 수 있는 각종 편향(bias)을 벗어날 수 있다는 장점이 있습니다. 그러나 끊임없이 변하는 시장에서 살아남기 위해서는 지속적으로 전략을 변경시켜야 한다는 단점이 있죠. 
 
인공지능의 출현은 이러한 문제를 해결할 수 있는 대안으로 떠올랐습니다. 데이터만 주면 알아서 학습하고, 시장에 따라 진화하며, 감정의 휘둘림 없이 매매할 수 있게 된 것이죠.
 
이 논문은 인공지능 방식인 합성곱신경망(CNN)을 이용하여 다음날 갭을 예측하는 연구를 진행했습니다.
 
 

 
위와 같은 사진에 다음날 주가갭을 라벨링했는데요, 2017년1월부터 2021년 12월30일까지 KOSPI200을 구성하는 모든 종목의 1분봉 데이터가 사용되었습니다. 전체 사진은 245,492개 이지만, 학습을 위해 갭상승과 하락을 개수를 맞추었네요.
 

아래는 학습에 사용된 CNN모형입니다. 활성화함수로 LReLU가 사용되었는데, ReLU가 입력값이 음수일때 0을 반환하는 것과 달리, LReLU는 음의 경우에도 약간의 기울기를 부여하여 가중치를 업데이트 합니다.
 
옵티마이저는 선행연구를 참고하여 SGD를 사용하였고, Dropout도 0.5를 주어 모델의 안정성을 높히는 작업을 했습니다.

 
아래는 학습 결과입니다. 학습이 진행될 때마다 정확도는 상승하고 손실은 하락, 잘 학습이 되는 그래프가 나왔습니다.
 

 
학습 후 검증단계에서 모형이 뱉어낸 결과를 해석하는것이 중요한데요, 정밀도는 갭상승에서 0.58, 갭하락에서 0.54 그리고 재현율에서는 갭상승이 0.39 갭하락이 0.71이 나왔습니다.
 
투자결정에 있어 정밀도가 재현율보다 더 좋은 지표라고 언급되어있는데요, 정밀도는 "오른다고 예측한 주식이 실제 오른 비율" 이구요, 재현율은 "전체 오른 주식 중 모형이 오른다고 예측한 비율" 입니다.  후자는 그냥 투자기회를 잃어버리는 거지만, 전자는 손실과 관되기 때문에 정밀도가 더 중요한 평가지표입니다.

 
제안된 모형으로 표본외 샘플 검증을 했습니다. 모형은 확률로 다음날 상승할 주식을 분류하는데요, 이 확률을 10분위를 내어 상위 10%는 롱, 하위 10%는 숏 한 결과입니다.  롱숏실험에서 좋은 성과를 나타냈네요. 그러나 이는 거래비용이 포함되지 않았기 때문입니다.
 

 
거래비용을 포함하게 된다면 조금 애매한 성과가 나타납니다. 그러나 거래세가 계속 낮아지는 추이를 고려하면 향후에 활용가능할 가치가 있어보입니다.

 
이 논문에도 한계점이 여럿 있는데요.  시뮬레이션 실험이 종가매수로 가정되어있는데, 장이 끝나고 개별종목들의 사진을 찍고 매수할만한 시간이 고려되지 않았습니다. 물론 장후 시간외거래에서 매수나 매도할 수 있지만 유동성문제가 크겠죠. 
또한, 모형의 시뮬레이션방식을 좀더 과학적으로 했다면 신뢰성이 높아졌을 것 같습니다. lopez de prado(2018)의 combinatorial purged cross validation같은 방식이 대안이 될 수 있겠네요.
 
감사합니다.
 
김찬수, 최흥식 and 김선웅. (2023). 캔들스틱 차트와 합성곱 신경망을 이용한 주가 갭 예측 연구. 한국산학기술학회논문지, 24(1), 587-597.

캔들스틱 차트와 합성곱 신경망을 이용한 주가 갭 예측 연구

기술적 분석에서 가장 활용도가 높은 캔들스틱 차트는 주가의 추세를 직관적으로 파악할 수 있는 도표이다. 캔들스틱 차트 분석으로 수익을 얻을 수 있다면 딥러닝 알고리즘은 학습을 통해 주

www.kci.go.kr

 

반응형