기금넷 공식사이트 - 금 선물 - 23 고주파 거래 주문 흐름 분석

23 고주파 거래 주문 흐름 분석

점 프로세스 기초

여러분이 교통플랫폼 뒤에 쪼그리고 앉아 사람들이 오가는 것을 보고 있다고 가정해 봅시다. 승객의 도착에는 일종의 수학 법칙이 있는 것 같아서 모든 사람의 도착 시간을 기록했다. 이 사람들의 도착 시간을 모델링할 수 있는 방법은 무엇입니까? 너는 점차 명상 상태에 들어간다. 아마도 이 점들이 형성하는 집합체의 특징을 정련하는 것은 좋은 생각일 것이다. 너는 여행객의 도착률이 반드시 중요한 특징이라고 생각한다. 외진 작은 버스 정류장이라면 오랫동안 사람을 만나지 못할 수도 있습니다. 네가 시내 중심의 큰 역에 도착했을 때, 붐비는 사람들이 너를 계산하기 어렵게 할 수 있다. 다른 사람이 도착하는 시간 간격은 또 다른 흥미로운 특징이다. 승객들은 공장에서 나온 제품이 아니므로, 반드시 간격이 도착할 때까지 기다리지 않을 것이다. 그럼 다른 승객이 도착하는 간격에는 어떤 법칙이 있나요? 이러한 질문에 답하기 위해서는 확률의 언어를 사용하거나, 좀 더 정확히 말하자면, 점과정을 사용해야 한다.

포아송 과정

포아송 프로세스에는 다음과 같은 특성이 있습니다.

교차하지 않는 기간에 도착하는 수량은 서로 독립적이다. 두 점은 거의 동시에 도착하지 않을 것이다. 주어진 기간 동안의 도착 횟수는 포아송 분포를 따르며, 분포의 평균은 기간의 길이에 비례합니다.

수학적 수준에서 이 특성을 가진 과정을 설명하기 위해, 우리는 먼저 두 번째 성격부터 시작하여 n (a, B) 으로 A 를 표시한다.

0 에 가까운 δ t 에 대해서는 어떤 t 에 대해서도 선언합니다

P(N(t, t? +? δ t] =1) = λ δ T.

λ는 단위 시간 내의 이벤트 수를 나타내므로 이벤트의 강도로 정의할 수 있습니다.

두 점이 동시에 도착하지 않기 때문에 짧은 시간 내에 두 개의 발생 확률은 약 0 이다.

P(N(t, t? +? δ t > =? 2) → 0

그런 다음 임의의 기간 (A, B) 에 대해 먼저 몇 개의 작은 기간으로 나누고, 다른 기간의 독립성에 따라 이항 분포로 확률 분포를 계산한 다음 포아송 분포를 대략적으로 계산할 수 있습니다.

N (a, B) 은 매개변수 B-A 의 포아송 분포를 대략적으로 따르는 것을 볼 수 있습니다.

이제 두 사건 사이의 간격 분포를 살펴 보겠습니다. T 0 의 간격은 t0 의 이 기간 동안 이벤트가 발생하지 않는다는 것을 의미하므로 쉽게 계산할 수 있습니다.

우리는 구간 복종 지수 분포의 성질을 이용하여 포아송 과정에 복종하는 사건을 시뮬레이션할 수 있다. K 번째 이벤트의 시간은 k- 1 이벤트 시간에 매개 변수가 λ인 지수 분포 임의 변수입니다.

예를 들어, 우리는 0.5 의 포아송 과정을 시뮬레이션할 수 있고, 총 50 개의 이벤트를 시뮬레이션할 수 있습니다. 우리는 사건과 시간의 관계를 그릴 수 있습니다.

우리는 또한 누적 사건과 시간의 관계를 그릴 수 있다. 우리의 추산에 따르면, 50 개의 0.5 사건이 발생하는 데는 약 100 시간이 소요되며, 우리는 차트에서 이를 검증할 수 있다.

* * 호크스 프로세스 * *

포아송 과정에서 강도는 변하지 않고, 사건의 발생은' 기억 없음' 원칙을 따른다. 현실 세계에서, 많은 상황이 이 가설에 부합되지 않는다. 예를 들어, 범죄 행위는 종종 공간집합성을 가지고 있는데, 이는 범죄자들이 손을 잡은 후 근래에 범죄를 계속하는 경향이 있기 때문이다. 고주파 거래에서는 추세 거래자가 큰 주문을 추적하여 시장이 단기간에 대량의 주문으로 유입될 수 있도록 합니다. 이러한 시스템에서는 이벤트 속도가 균일하지 않습니다. 이 공간 집합이나 긍정적인 피드백의 메커니즘을 어떻게 설명할 수 있을까요? 우리는 모델을 확장해야 한다. 하나의 값으로 고정한 것이 아니라, 시간에 관한 함수인, 즉 (T) 를 만들 수 있도록 해야 한다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 시간명언)

더 정확한 정의는 δ t 가 0 에 가까울 때:

P(N(t, t? +? δ t] =1) = λ (t) δ T.

다른 가정도 비슷하다. 동네 내 두 개 이상의 사건이 발생할 확률이 0 에 육박한다.

λ(t) 는 다음과 같이 정의됩니다.

λ0(t) 은 배경의 강도를 나타내고, v(t-ti) 는 시간 t 이전 이벤트의 긍정적인 영향을 나타내며, v 함수는 커널 함수입니다. 간단히 말해서, ti 가 시간 T 에 가까울수록 시간 T 에 미치는 영향이 커져야 한다.

우리는 비교적 간단한 핵 함수, 즉 지수 함수를 사용하여 호크스 과정이 무엇을 할 수 있는지 살펴본다. 정의할 수 있다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 성공명언)

100 개의 이벤트를 시뮬레이션하여 이벤트 및 해당 강도를 그래프로 그릴 수 있습니다.

수치 계산을 통해 결과가 합리적인지 확인할 수 있습니다.

강도의 실제 평균은 Nt/t, 약 100/ 150 이며 이론적 평균을 도출할 수 있습니다.

그림에서 λ0 은 μ에 대한 우리의 정의입니다. 그래프의 μ는 우리가 실제와 비교하고자 하는 강도의 평균 E [T] 를 나타냅니다. 첫 번째 줄에서 두 번째 행으로의 변환은 λ(t) 에 기반을 두고 있습니다.

이론값을 계산할 수 있다.

E[λ(t)] = μ/(1-(α/β)) = 2/3

실제 상황에 접근하면 시뮬레이션이 정확하다는 것을 알 수 있다.

지수 커널 하크스 프로세스의 시뮬레이션 및 최적화

지수 커널 함수의 하크스 과정을 시뮬레이션했습니다. 이벤트 수를 늘리면 (예: 100 에서 1000 으로 증가) 프로그램 실행 시간이 크게 늘어난다는 것을 알 수 있습니다. 이는 해당 순간에 해당하는 강도를 계산할 때 모든 이전 이벤트 순간을 호출해야 하기 때문에 복잡성은 O (n 2) 이기 때문입니다.

Hawkes 프로세스의 매개 변수 추정

후자의 함수인 nlminb 는 함수 값을 최소화하므로 위의 우도 함수에 음의 우도 함수를 입력합니다.

최적화된 매개변수는 실제 매개변수 (0.5, 0.3, 1.2) 에 매우 가깝기 때문에 최대 우도 추정이 매우 효과적이라는 것을 알 수 있습니다.

Hawkes 프로시저의 커널 함수는 여러 가지 형식으로 지정할 수 있습니다. 지수 커널 함수 외에도 전력 법칙 커널 함수를 사용할 수 있으며, 커널 함수의 특정 형태를 지정할 필요도 없습니다. 커널 함수는 비패라메트릭 방법을 통해 얻을 수 있습니다.

주문 플로우 데이터 표시

금융시장에서 거래할 때, 당신은 매입가격과 판매가격과 그에 상응하는 수량을 보여주는 주문서를 볼 수 있습니다. 예를 들어 비트코인 시장의 주문서:

Action_itme 은 주문 유형을 나타냅니다. 여기서 "m" 은 주문 패드에 대한 변경 사항, 즉 한도 주문입니다. 그리고' T' 는 무역을 의미하고, 시장 목록이라고 할 수 있다. Ask price 와 ask vol 은 각각 최적의 판매 가격과 수량을 나타내고, bid price 와 bid vol 은 각각 최적의 매입 가격과 수량을 나타냅니다. Price 와 vol 은 각각 주문에 해당하는 가격과 수량을 나타냅니다. 시간은 1970 부터 시작하는 시간 (초) 입니다.

시간의 정확도는 10 의 마이너스 7 승, 즉 마이크로초에 이르렀다.

함수를 R 언어로 변환하는 시간 형식으로 첫 번째 데이터를 찾은 시간은 오후 5 시입니다.

미국 스탠더드 푸르 500 의 거래 시간은 오전 8 시 30 분부터 오후 3 시까지이기 때문에, 우리는 2 분 검색법을 사용하여 거래 시간 내 데이터를 추출하고 이름을 trade 로 지정했습니다.

주문 간격 분석

75 번째 백분위수와 평균은 약 0.02s 로 표준푸르 500 선물의 거래가 매우 빈번하고 유동성이 매우 좋다는 것을 보여준다.

이상은 주문 구간 분포도입니다. 0.0 1 보다 큰 간격이 거의 없으므로 시각화를 위해 0.0 1 보다 작은 간격을 선택했습니다. 우리는 분포가 매우 편향되어 있고, 대부분의 구간은 매우 작다는 것을 관찰할 수 있다.

지수 분포를 사용하여 0.04 보다 작은 차수 구간을 맞추면 실제 데이터의 감쇠 속도가 해당 최적 매개변수보다 훨씬 빠르다는 것을 알 수 있습니다. 지수 분포 감쇠가 매우 빠르기 때문에 동네 간 비율이 얼마나 큰지를 알 수 있어 진정한' 고주파' 거래라고 할 수 있다.

고주파 거래에서는 시장 상인이라는 상인이 시장에 매판과 매판을 걸어 모두 팔면 차액을 벌 수 있다. 그들은 보통 가격을 낮추어 시장에 유동성을 제공한다. 물론, 그들도 그들만의 전략을 가지고 있다. 예를 들어, 마켓 메이커는 일반적으로 시장 시세가 나올 때 주문을 조정하므로 즉시 주문을 하여 가격 제한 주문을 따를 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 시장명언) 우리는 통계적으로 시장에 이런 현상이 있는지 없는지를 본다.

1 과 0.0 1 을 선택했습니다. 부드럽다면 0.0 1 해당 분위수는 1 의 1% 정도여야 합니다. 그러나 실제로 분위수가 높을수록 이 법칙은 성립되지 않고 99.99 와 99.999 분위수에서 10 분의 1 을 넘는다.

이는 사건의 도착이 고도로 모이는 특징을 가지고 있어 포아송 과정으로 간단히 설명할 수 없다는 것을 보여준다.

유동성 연구

유동성이란 당신이 거래하고 싶을 때, 당신이 신속하게 대종 거래를 할 수 있는 능력이 있는지 여부입니다. 속도, 깊이 및 폭의 세 가지 요소로 구성됩니다.

깊이는 주로 주문량과 관련이 있다. 쌍방의 주문이 많을수록 감당할 수 있는 매입 또는 판매 압력이 커질수록 유동성이 좋다.

폭은 주로 가격과 관련이 있다. 시장에서는 거래량이 적은 입찰을 볼 수 있습니다. 그들의 매수와 매가 사이의 거리는 매우 넓습니다. 그래서 만약 우리가 단일 시장가격으로 매매를 한다면 큰 손실이 있을 것입니다. 그리고 일부 거래량이 큰 입찰의 경우, 그들의 매수와 매가 사이의 거리는 매우 작을 수 있기 때문에, 우리는 시장 가격 목록 아래 실시간 거래를 안심하고 할 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 거래명언)

우리 데이터 중 최적 매수와 최적 매가밖에 없기 때문에 심도 분석을 할 수 없다. 우리는 구매가와 판매가의 거리 (이 거리를 가격차이라고 함) 를 분석하여 폭을 분석할 수 밖에 없다.

보시다시피 시차는 대부분 25( 1 기준점) 로 표준푸르 500 선물의 유동성이 매우 좋다는 것을 알 수 있습니다.

가격 목록의 상대 가격 분석

제한 가격 목록을 준비할 때, 우리는 보수적인 사람이 되는 것, 최적의 가격에서 벗어나는 다음 주문서, 또는 최적 가격에 가까운 다음 주문서와 같은 많은 선택권을 가지고 있습니다. 이렇게 하면 큰 확률로 빠른 거래가 성사될 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 가격명언)

우리는 상대 가격을 다음과 같이 정의합니다

Bid_relative_price = (최적 매입 가격)/분필 거래점

Ask_relative_price = (주문 가격-최적 가격) /tick

이렇게 하면 가격 제한표의 상대적 가격의 통계적 분포를 볼 수 있는 통계를 만들 수 있다.

그림에서 볼 수 있듯이 0 이전 매매 주문서의 상대 가격은 거의 같다.

지수 커널 하커스 프로세스 피팅

시각적으로, 한정가격은 매매 쌍방의 보루를 형성하고, 시가는 상대의 보루를 공격한다. 그렇다면 공격력으로서 시장 가격표는 매매 쌍방의 힘 게임에 매우 중요하다.

시간이 같은 주문을 병합하고 초기 값에서 모든 시간을 뺍니다.

맞춤된 베타 값은 이전 이벤트가 이후 이벤트에 미치는 영향이 빠르게 감소한다는 것을 보여 줍니다. 주의 1/beta 는 Hawkes 프로세스의 메모리 시간으로 정의되며, 이 시간을 초과하는 후속 이벤트는 기본적으로 이 이벤트의 영향을 받지 않습니다. 여기 충격 주기가 1 밀리초도 안 되는 것을 볼 수 있습니다. 주파수가 정말 빠르다는 뜻입니다.

포지티브 피드백 강도 분석

소로스는 그의' 금융연금술' 에서 투자자와 거래자의 인지편차가 표지의 기본면을 바꿀 수 있다는 이론을 제시했다. 예를 들어, 주식 한 마리가 계속 상승하면 투자자들이 기본면을 더 잘 이해할 수 있게 되어 주가가 더욱 상승하게 되어 긍정적인 피드백을 형성할 수 있다.

하지만 긍정적인 피드백을 정량적으로 분석하는 방법은 항상 문제였다. Hawkes 과정에서 lambda 의 표현식에 따라 이벤트의 강도를 두 부분으로 나눌 수 있습니다. 하나는 배경의 강도이고, 다른 하나는 이전 이벤트에 의해 발생한 강도입니다. 이 "파생" 강도의 평균은 양수 피드백의 강도로 볼 수 있습니다.

예를 들어, 지수 핵에서는 적분을 통해 양수 피드백 메커니즘의 비율을 알파/β로 계산할 수 있습니다. 우리는 하루를 13 개 세그먼트로 나누어 30 분 간격으로 각 세그먼트의 배경 강도와 반사도가 각각 얼마인지 알아보았다.

그런 다음 모델링을 시도하고 수량 요소를 고려할 수 있습니다.

주문 수량의 지수

우리는 주문 수량의 영향이 선형이라고 가정했지만, 정말 그렇습니까? 우리가 주문수량에 제곱지수를 더하려고 하면 실력의 표현은

매개변수에서 K 의 값이 0.5 정도라는 것을 알 수 있습니다. 이는 순서의 영향이 선형 증가가 아니라 양의 근호라는 것을 나타냅니다. 이것은 매우 흥미로운 현상으로, 주문량의 영향이 한계적으로 감소했다는 것을 보여준다.