머신러닝 3

[트레이딩] 클러스터링 기법을 이용한 롱숏 시스템 트레이딩(1)

이번 포스팅에서는 머신러닝 기법중 비지도학습인 클러스터링을 이용한 롱숏트레이딩에 대해 적어보겠습니다. 이 연구를 하게된 계기는 아래 논문때문인데요. 논문의 방법론은 아래와 같습니다. 1. 클러스터링 기법으로 KOSPI200 개별종목을 군집화 2. 군집 내에서 수익률 순위로 페어를 결정 3. 페어간 수익률 차이(spread)를 표준편차로 나타내 임계값을 넘으면 롱숏 전략 수행 백테스트결과는 아래와 같은데 훌륭해 보이죠? :: Journal of Korean Society of Industrial and Systems Engineering :: 1. 서 론 페어 트레이딩은 유사한 가격흐름을 지닌 두 종목 간의 스프레드를 활용하는 투자전략으로 주로 기업의 펀더멘털 보다는 주식 시계열 특성에 기반 한 통계적 차..

Sysmetic trading 2023.04.27

[주식논문] 고빈도 자료를 이용한 머신러닝 모형의 예측력 비교 분석

이번에 리뷰할 논문은 고빈도 자료를 이용한 머신러닝 모형의 예측력 비교분석 이라는 논문입니다. 본 논문의 저자는 Lopez pe Prado의 Advanced Financial Machine Learning의 내용을 국내데이터에 적용하여 머신러닝 모형에 학습을 시킨 후 예측력을 평가했습니다. 특히, 주문흐름(order flow)를 통해 새로운 정보가 들어왔음을 확인하고, 이를 이용해 VIB(volume imbalanced bar)를 만들어 학습했네요. VIB가 미시구조상에서 갖게되는 의미는 아래와 같습니다. 주문 흐름은 매수주도 주문 거래량에서 매도주도 주문 거래량을 뺀 것이다. 매수주도 거래는 시장가 주문을 통한 매수 주문, 매도주도 거래는 시장가 주문을 통한 매도 주문이다. 정보를 가지지 않은 거래자들..

Read 2023.01.01

[AFML] 데이터의 구조(달러바 vs 볼륨바)

이번 포스팅에서는 시간바, 볼륨바, 달러바의 통계적 특성을 알아보도록 하겠습니다. AFML에서 2장에서 중요하게 다루는 것은 시계열 데이터를 이벤트 드리븐 형태로 표현하는 것입니다. 시간바(timebar)는 아래와 같은 이유 때문에 머신러닝 학습에 좋지 않은 편향을 보일 수 있기 때문입니다. (1) 거래량이 적을때는 오버샘플링, 거래량이 클 때는 오버샘플링 (2) 계열상관, 이분산성, 수익률의 비정규성을 보임 우선 1분 단위 삼성전자 데이터로 미리 만들어 놓은 달러바(dollarbar) 볼륨바(volumebar)를 import시켰습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt columns =['date','time'..

Sysmetic trading 2022.12.16