기금넷 공식사이트 - 금 선물 - 머신러닝을 양적 거래에 적용하는 방법
머신러닝을 양적 거래에 적용하는 방법
머신러닝을 퀀트 트레이딩에 적용하는 방법 (1)
한 친구가 중국에서는 퀀트 분야에 머신러닝을 적용하는 경우 효과가 별로 좋지 않냐고 묻더군요. 간단한 전략으로. 사실 퀀트 트레이딩에 머신러닝을 적용하는 것은 항상 딜레마에 직면하지만, 해결 불가능한 딜레마는 아닙니다. 머신러닝이 안 되는 경우가 많은 것이 아니라, 정확하고 과학적인 통계적 사고를 가지고 머신러닝을 활용할 줄 아는 사람이 정말 적다는 것입니다.
머신러닝에는 특징 선택, 특징 엔지니어링, 모델 선택, 데이터 전처리, 결과 검증 및 분석 등 일련의 모델링 프로세스가 포함됩니다. 넓은 관점에서 보면 단순히 모델만의 문제는 아닙니다. 선택. 따라서 "서포트 벡터 머신을 사용하여 주식의 상승과 하락을 성공적으로 예측하는 것"과 같은 연구를 머신러닝을 퀀트 트레이딩에 적용한 것이라고 생각한다면, 이러한 편협한 이해는 의심할 바 없이 진주 상자를 사서 눈을 돌리는 것과 같습니다. 머신러닝 분야 곳곳에 흩어진 진주를 찾아보세요. 머신러닝의 등장을 역사적 과정에서 고려한다면 그것은 추세의 지속에 지나지 않는다. 이제 과거의 모호하고 불확실한 경험은 체계적인 데이터 분석을 통해 확인할 수 있고, 머신러닝 알고리즘은 눈에 띄지 않는 패턴을 가져올 수 있다. 표면에.
제 생각에는 향후 개발 방향은 두 가지입니다.
1. 퀀트 트레이딩을 위한 통계 학습 알고리즘이 제안되어 노이즈가 크고 분포가 불안정한 상황에 적합합니다. 재무 데이터 분석
2. 머신러닝에 대한 열정은 도구 중심에서 문제 중심으로 다시 돌아왔습니다.
문제 중심 방식으로 머신러닝 알고리즘에서 적절한 도구를 선택하는 방법에 대한 몇 가지 아이디어를 공유하세요.
1. 다중 요인 모델에 대한 요인 가중치 계산
다중 요인 모델을 구축하고 일련의 요인을 선택한 후 다양한 요인에 따라 각 요인을 어떻게 조정합니까? 시장 상황은 어떻습니까? 이전 연구에서는 랜덤 포레스트 알고리즘이 다른 알고리즘에 비해 비선형성, 노이즈, 극도로 선형적인 독립변수를 갖는 훈련 세트에 대해 더 나은 분석 결과를 갖는 것으로 나타났습니다. 따라서 현재 다중요인모형의 가중치에 대하여 현기의 수익률을 이용하여 이전기의 요인에 대해 랜덤포레스트 회귀분석을 수행하여 다음기의 다중요인모형의 요인가중치를 결정한다.
2. 결측값 처리
결측값 처리는 정량적 재무분석에서 피할 수 없는 문제입니다. 합리적인 결측값 처리 방법을 선택하는 것은 데이터 자체의 특성, 결측 데이터의 상황, 해당 경제적 중요성, 수행하기 위해 데이터를 사용하는 데 필요한 계산에 따라 달라집니다. 다요인 모델을 구축하려고 할 때 두 가지 결측값 대체 방법을 선택했습니다. (1) 기대값 최대화 알고리즘을 사용하여 동일한 변수의 알려진 데이터를 사용하여 결측값의 최대 우도 추정을 수행합니다. (2) 모델에 포함된 모든 요소를 특성 변수로 간주하고 동일한 가중치를 부여한 다음 기계 학습의 K-최근접 이웃 알고리즘을 사용하여 가장 유사한 목표를 찾아서 누락된 값이 대체된 후 일부 영향력은 강화되지 않습니다.
실제로 정량화 분야에서는 머신러닝이 선형 모델의 본질적인 결함이나 단점을 해결하기 때문에 여전히 깊이 관여하고 있습니다. 볼록 최적화 및 차원 축소(시장 특성 추출)와 같은 분야의 응용 프로그램을 제외하면 "비동적" 및 "비선형성"은 현재 두 가지 중요한 단점입니다. 재정적 관계는 정적이지 않으며 많은 경우 선형적이지도 않습니다. 이때 통계 학습의 장점이 반영되어 시장에 빠르게 적응하거나 시장을 보다 "정확하게" 설명할 수 있습니다.
중국에서는 머신러닝을 정량화에 적용하는 것은 분야와 빈도와 많은 관련이 있습니다. 예를 들어 CTA는 주식보다 더 많이 사용될 수 있습니다. 데이터 처리의 차원은 주식보다 훨씬 작으며 주식보다 시장의 길이와 역학을 더 잘 포착할 수 있습니다. 주식시장의 모멘텀은 선물시장보다 약하고, 그 추세는 주식보다 더 분명하고 덜 시끄럽습니다. 이러한 특성은 머신러닝이 작동하는 데 더 유리합니다.
국내 일부 거래 실행 알고리즘 설계에는 머신러닝이 활용될 가능성이 매우 높다.
특정 샘플을 사용하여 훈련한 후에는 주문장의 특성을 학습하여 다음 핸디캡의 변화에 대해 확률론적 예측을 할 수 있습니다.
내가 딥러닝 같은 머신러닝 방법에 대해 여전히 조심스럽게 낙관하는 이유는 이해 시장에서 현재 방법의 대부분이 이러한 방법과 동일한 차원에 있지 않기 때문이다. 이러한 장점은 서로를 비교하게 만든다. 다른 방법을 사용하면 더 많은 수익을 얻을 수 있습니다. 즉 시장을 이해하는 새로운 관점이 알파를 가져올 수 있다는 것이다.