기금넷 공식사이트 - 금 선물 - 단일 모델과 혼합 모델의 차이점

단일 모델과 혼합 모델의 차이점

오랫동안 선물 시장의 안정적인 운영은 줄곧 거래소의 관심의 초점으로 선물 품종의 기능에 중요한 역할을 해 왔다. 계약 거래의 창고량은 선물 시장 운영의 중요한 지표이자 선물 관리 위험을 이용하는 기본 지표이다. 시장 동향에 대한 이해를 높이고 운영 예측 능력을 향상시키기 위해 본 문서는 계약의 과거 운영 규칙 및 위험 통제 조치 매개변수를 기반으로 데이터 분석을 수행하고, 과거 데이터 및 위험 통제 매개변수를 입력 특성으로 추출하고, 다양한 기계 학습 알고리즘을 기반으로 통합 모델을 구축하고, 그리드 검색을 사용하여 최적의 매개변수를 설정하고, 향후 5 일 동안 선물 계약의 거래량과 보유량을 예측합니다. 실험 결과 예측거래량의 평균 정확도가 70% 에 육박하고 보유량의 평균 정확도가 83% 에 육박하는 것으로 나타났다. 이와 함께 이 글은 사례 분석 형식으로 융합 모델과 그리드 검색 기술이 예측 정확도를 높이는 데 중요한 역할을 한다는 것을 증명했다.

I. 프로젝트 배경

선물 거래는 현물 시장의 청우계로 상품의 장기 가격 책정을 위한 기준을 제공하며, 호위 실체 경제의 꾸준한 운영에 중요한 의의가 있다. 선물 거래 가격은 서로 다른 참가자 * * * 와 같은 견적으로 구성됩니다. 헤지스는 시장 고정의 이윤을 이용하여 가격 변동의 위험을 관리하는 반면 투기자들은 시장을 판단하고 이윤을 얻으려 한다. 시장 거래가 과열되면 선물 가격이 왜곡되어 현물 가격에서 벗어나 투자자와 헤지기업에 손실을 줄 수 있습니다. 반대로 유동성이 부족할 때 선물가격은 시장 참가자의' * * * 지식' 을 정확하게 반영하지 못한다. 따라서 안정적인 시장 참여는 선물 거래의 합리적인 가격 책정을 위한 중요한 토대이다. 시장 열을 예측하는 것은 시장 정서를 조절하는 데 있어 위험 통제 조치를 합리적으로 사용하여 시장을 안정시키는 것이 중요하다. 이 글은 핵심 문제를 예측시장 열, 즉 예측품종의 거래 포지션으로 정의한다. 일반적으로 선물시장 거래 포지션 추세는 선물의 가격 변동, 돌발 여론 사건, 정책 영향 등 여러 가지 요인에 의해 영향을 받는다. 여러 요인의 영향으로 간단한 규칙 알고리즘은 거래 위치를 효과적으로 예측하기 어렵다. 이를 바탕으로 이 문서에서는 여러 차원에서 유효한 피쳐를 추출하고 세 개의 독립 기계 학습 모델을 사용하여 데이터 간의 다양한 관계를 캡처하려고 합니다. 마지막으로 그리드 검색법으로 세 가지 모델의 결과를 융합하여 최종 예측 결과를 출력합니다. 이 문서의 조직 구조는 다음과 같습니다. 2 장은 과거 운영 데이터를 분석하고 위험 통제 매개변수, 결제 가격 및 거래 위치 간의 관계를 연구합니다. 3 장에서는 피쳐 추출 및 세 개의 단일 모델 구성에 대해 자세히 설명합니다. 네 번째 장에서는 모델 융합 및 가중치 그리드 검색 기술을 소개합니다. 제 5 장 설계 실험은 모델의 유효성을 검증하고, 설계 방법은 모델 결과를 설명합니다. 여섯 번째 장은 모델의 해석 가능한 방법이다. 일곱 번째 장은 요약과 전망입니다.

둘째, 역사적 운영 분석

기계 학습과 관련된 문제에서 데이터 분석은 피쳐 추출의 품질과 모형의 최종 효과를 결정하는 전체 데이터 모델링의 기초입니다. 데이터 분석은 목표 문제를 이해하고 모델의 반복 빌드를 안내하는 데 중요한 역할을 합니다. 이 문서의 데이터 분석은 여러 차원을 포괄하며 다음 네 가지 측면을 선택하여 거래소의 과거 데이터를 간략하게 분석합니다.

(a) 주요 계약의 수명주기 (bimodal 현상)

역사적 데이터를 돌이켜보면, 모든 계약은 상장이 퇴장하는 전체 주기 동안 거래 창고가 점차 증가한 후 감소하는 과정을 거치게 된다. (윌리엄 셰익스피어, 윈스턴, 계약명언) (윌리엄 셰익스피어, 계약, 계약, 계약, 계약) 이 가운데 주력계약의 상당 부분 (40% 에 가까운) 이 전체 상장퇴시 주기 동안' 쌍봉' 현상을 보일 것으로 보인다. 쌍봉' 현상은 계약이 주력이 된 후 거래량과 창고량이 두 차례 최고봉을 거친다는 것을 의미하며, 그 중 거래량이 특히 두드러진다. 우리는 그림 1 과 그림 2 를 각각 유리 선물 1705 와 면화 선물 180 1 의 거래 포지션 추세를 보여줍니다. 그림에서 볼 수 있듯이 유리와 면화는 비농과 농업의 두 가지 주요 범주에 속하지만 거래량은 전형적인 쌍봉 구조를 보여준다. 이 현상의 한 가지 가능한 원인은 계약이 주력 계약이 되면 거래자금이 빠르게 유입되어 거래가 급속히 확대되기 때문이다. 둘째, 전 주력 계약이 교부 탈퇴 단계에 진입하여 주력 계약이 두 번째 정점에 이르렀다. 쌍봉 현상의 주기성은 우리가 품종 운행 법칙을 파악하고 거래 창고 위치를 예측하는 데 지도적 역할을 한다.

그림 1. 유리 1705 계약 거래 포지션 추세 차트

그림 2. 면화 180 1 계약 거래 포지션 추세 차트

(b) 품종 거래 위치와 가격의 관계

거래와 창고량의 영향 요인을 검토하기 위해 이 글은 가격 변동과 거래 창고량 간의 관계를 중점적으로 연구하였다. 거래 시장에는' * * * 지식' 이 있는데, 바로 가격의 변동이 거래 위치를 확대할 수 있다는 것이다. 따라서 이 글은 가격 변동과 거래 위치 변동 사이의 피어슨 관련 계수 1 을 계산하려고 합니다. 이 글은 장기 운행 차원에서 가격 변동이 거래량과 창고량의 확대를 실질적으로 야기할 수 있는지를 연구한다. 우리는 다음 세 가지 지표를 정의했습니다.

여기서 T 는 현재 날짜, N 은 시간차, PT 는 T 일 결제가격, VT 는 T 일 거래량, HT 는 T 일 소지를 나타냅니다. 이에 따라 PT-N, VT-N, HT-N 은 각각 T-N 일의 해당 값을 나타냅니다. Pdelta 는 t 일과 T-N 일 사이의 가격 변동률의 절대값, Vdelta 는 해당 거래량 변동비의 실제값, Hdelta 는 창고 변동비의 실제값을 나타냅니다. N 이 [1-5] 일로 설정된 경우 각각 Pdelta, Vdelta 및 Hdelta 사이의 피어슨 계수를 계산합니다. 실험에서 우리는 정상소 20 16 부터 20 18 까지의 모든 상장 품종을 선정하여 품종 아래의 모든 상장 계약을 요약했다. 자세한 내용은 아래 표를 참조하십시오.

표 1. 가격 변동 및 거래 위치 변화의 상관 계수 표

표 1 에서 PD 1-HD 1 은 n 값이 1 일 때 Pdelta 와 Hdelta 사이의 상관 계수를 나타냅니다. PD 1-VD 1 n 값이 1 일 때 Pdelta 와 Vdelta 사이의 상관 계수를 나타냅니다. 표에서 쉽게 알 수 있듯이, 다른 N 값에서 모든 품종의 관련 계수는 양수이므로 거래 위치의 변화와 가격 변동의 절대값 사이에는 긍정적인 관계가 있습니다. 하지만 학계에서는 상관 계수 | r | >;; 0.8, 두 변수 사이에는 높은 상관 관계가 있습니다. 0.6 일 때

(3) 품종 거래 위치와 위험 통제 조치 매개 변수 간의 장기 관계

가격 변동 외에도, 이 글은 위험 통제 매개변수가 거래 포지션에 미치는 장기적인 영향을 연구했다. 위험 통제 매개 변수의 설정은 시장 열을 조절하고 시장 변화를 완화하는 것입니다. 보증금, 수수료 등의 매개변수가 거래 포지션의 변동 차원과 다르다는 점을 감안하면 관련 매개변수와 거래 포지션 변동의 상관 관계를 분석할 때 변동 계수를 사용하여 다양한 위험 통제 매개변수에 따른 거래 및 포지션 운영을 측정하기로 했다. 구체적인 계산 방법은 다음과 같다.

변이 계수가 클수록 거래 위치는 평균에 비해 변동폭이 커진다. 이 문서는 20 16 에서 20 18 까지의 각 품종에 대한 관련 데이터를 기준으로 각각 다른 품종의 변이 계수를 계산하고 피어슨 계수를 사용하여 위험 제어 매개변수와 변이 계수의 관계를 계산합니다. 이 글은 평금 창고의 보증금과 수수료를 중점적으로 분석하였다. 구체적인 결과는 표 2 와 표 3 에 나와 있다. 관련 계수 계산에는 관련 위험 제어 매개변수를 여러 번 조정해야 한다는 점을 감안하여 표 2 와 표 3 에는 선택한 구간 내의 적합한 품종만 분석을 위해 남아 있습니다.

표 2. 보증금 및 품종 장기 변동의 변이 계수

표 3. Pingjin 창고 수수료 및 품종의 장기 변동에 대한 변동 계수

표 2 와 표 3 에서 볼 수 있듯이, 전반적으로 보증금과 평창 수수료의 수치는 거래 포지션 변동의 변동 계수와 음의 관계를 맺고 있다. 보증금이나 평창 수수료가 늘어나면 해당 품목에 대한 거래 포지션 변동 비율은 상대적으로 작으며 구체적인 수치는 품종 차이에 따라 크게 달라진다. 관찰표에 따르면 일부 품종의 관련 계수가 양수인 것으로 나타났다. 조정점이 일방적인 시세나 대폭적인 변동시세에 모여 있기 때문일 수 있다. 위의 분석을 바탕으로 위험 통제 조치의 매개변수를 피쳐 시퀀스에 도입하여 예측의 기초로 삼기로 결정했습니다.

(D) 품종 거래 위치와 위험 통제 조치 매개변수 간의 단기 관계.

장기 차원 외에도 이 글은 20 16 부터 20 18 까지의 관련 데이터를 바탕으로 위험 통제 매개변수의 단기 변화가 시장 운영에 미치는 영향을 검토하려고 합니다. 데이터 분석을 통해 시장 전체에서 보증금과 수수료의 변화가 거래 포지션에 미치는 단기적 영향은 무작위적이고 뚜렷한 법칙이 없다. 이에 따라 이 문서는 거래 특성에 따라 고객을 장기, 단기, 대형 및 소규모 고객으로 분류하기로 결정했습니다. 。 전반적으로 보증금이 창고 보유량에 미치는 영향은 비교적 뚜렷하고, 평창 수수료가 거래량에 미치는 영향은 비교적 뚜렷하다. 자세한 내용은 그림 3 과 그림 4 를 참조하십시오. 그림 3 의 네 개의 작은 그림은 네 개의 고객 기반에서 보증금 조정 범위와 위치 간의 관계를 나타냅니다. X 축은 보증금 조정 전후의 수치 변화 폭을 나타내고 Y 축은 보증금 조정 전후 5 일 동안 평균 포지션의 변화 범위를 나타냅니다. 그래프의 모든 점은 역사상 진정한 조정을 나타낸다. 그림 4 에서 X 축은 평금창고 수수료의 조정 폭을 나타내고 Y 축은 조정 전후 5 일 동안 평균 거래량의 변화 폭을 나타냅니다. 그림 3 을 보면 보증금이 인상될 때 큰 고객과 장기 고객의 창고 보유량이 감소하는 추세를 볼 수 있습니다. 보증금이 하향 조정될 때, 소고객과 단선 고객의 소지가 상승세를 보이고 있다. 그림 4 를 보면 평금창고 수수료 인상이 단기 고객 거래량 감소에 뚜렷한 영향을 미친다는 것을 알 수 있다. 이는 일반 인식과도 일치한다. 이에 따라 수수료를 낮추는 것은 단기 소규모 고객의 거래량을 촉진하는 데 어느 정도 역할을 한다.

단기적으로는 위험 통제 조치의 매개변수가 서로 다른 고객 집단의 거래 위치에 어느 정도 영향을 미친다. 따라서 이 문서에서는 위험 제어 매개변수 측정의 변경 값도 피쳐 벡터에 도입합니다.

그림 3. 고객군에 따라 보증금 조정 폭이 조정점 전후 5 일 동안의 창고 평균과 관계가 있다.

그림 4. 고객군에 따라 평창 수수료 조정 폭이 조정점 전후 5 일 평균 거래량 변화와 관계가 있다.

셋째, 피쳐 엔지니어링 및 모델 구축

상술한 분석을 종합해 보면, 거래 위치는 여러 요인의 영향을 받고, 요인에 따라 영향의 정도가 다르다. 이 문서에서는 다중 모델 융합을 사용하여 데이터 간의 다양한 관계를 포착하고, 심층적인 가치를 발굴하며, 향후 거래 위치를 예측하려고 합니다. 구체적인 문제는 모든 계약의 경우 T 일 마감 후 현재 위험 통제 조치 매개변수와 당일 과거 운영 데이터를 기준으로 향후 5 거래일의 거래량과 보유량을 추정하는 것으로 정의됩니다.

수치 예측과 관련된 문제에서 피쳐 선택은 모델 구축의 중요한 토대이며 모델의 효과를 결정합니다. 데이터 분석 및 실험 반복을 통해 이 문서에서는 결제 매개변수, 시장 특성, 고객 특성, 계약 특성 등 네 가지 주요 범주 ***3 17 차원 기능을 선택하기로 결정했습니다. 그 중에서도 결제 매개변수에는 역사적 가격 변동, 계약간 가격 차이 등의 다차원 특징이 포함됩니다. 시장 특성에는 역사적 거래 위치와 관련된 데이터 특성이 포함됩니다. 고객 특성에는 서로 다른 속성 고객의 특성 데이터와 서로 다른 고객 집단의 거래 특성이 포함됩니다. 계약 특성은 주로 계약 실행 특성 및 계약 단계를 추출하고 예측 결과를 제한합니다.

표 4. 데이터 특성 테이블

위의 3 17 차원 중 7 개 차원은 계약 바인딩 특성이고 3 10 차원은 과거 거래와 관련된 시계열 특성입니다. 피쳐 추출 후 이 문서에서는 세 가지 기계 학습 모델을 만들기 시작합니다. 구체적으로 아래와 같다.

(a) 통합 이동 평균 자동 회귀 (아리마)

통계 및 경제 분야에서 ARIMA (자동 회귀 통합 이동 평균) 모델은 일반적으로 고정 시계열에 적용되거나 미분 고정 프로세스를 통해 평균 방정식의 비부드러움을 제거하는 데 사용되는 일반적인 시계열 예측 알고리즘입니다. 여기서, 자동 회귀 (AR) 는 시계열을 처리하는 통계적 방법으로, 시퀀스 자체의 임의 변수의 서로 다른 시간에 대한 연관성을 측정하고, 이전 시간 변수의 값을 사용하여 현재 시간의 값을 예측하며, 선형이라고 가정합니다. 이 방법은 금융 시퀀스 관련성의 모델링에 광범위하게 적용된다. 이동 평균 모델 (MA) 은 시계열에서 단일 변수를 모델링하는 또 다른 방법입니다. 이 문서의 문제는 ARIMA 의 일반적인 시나리오에 더 적합하기 때문에 거래 위치의 시계열을 캡처하는 데 사용하기로 결정했습니다.

(2) 지원 벡터 머신을 기반으로 한 회귀 모델

아리마 모델은 캡처 시계열의 상관 관계를 기반으로 향후 거래량을 직접 예측합니다. 동시에, 우리는 더 많은 정보를 이용하여 더 나은 예측 결과를 얻기를 원한다. 우리는 지원벡터기로 미래 거래량과 창고 보유량의 변동을 예측하기로 했다. 지원 벡터기는 분류 및 회귀 문제에 널리 사용되는 기계 학습 모델입니다. 이 방법의 핵심은 "핵 함수" 를 사용하여 저위도의 비선형 피쳐를 효율적으로 처리하고 고차원 피쳐 공간에 매핑하는 것입니다. 고차원 공간에서 초평면을 찾아 데이터를 분류하거나 회귀합니다.

(III) 시퀀스 대 시퀀스 모델 (Seq2Seq)

Seq2Seq 모델 (Sequence to Sequence) 은 Google Brain 팀과 Yoshua Bengio 팀이 제안한 심도 있는 신경망으로 번역, 자동 텍스트 요약 및 회귀 예측 문제에 널리 사용됩니다. 처음에는 Seq2Seq 가 주로 자연어 처리와 관련된 문제를 해결하는 데 사용되었습니다. 그러나 시계열 관계를 발굴할 수 있는 강력한 능력으로 최근 몇 년 동안 숫자 시퀀스의 예측에 점차 적용되었다. 그림과 같이 이 문서에 사용된 네트워크는 인코더와 디코더 프로세스를 통해 지난 10 일 동안의 시장 특징을 입력 시퀀스로 향후 5 일 동안의 거래량이나 창고 순서에 매핑합니다. 인코더는 비선형 함수를 사용하여 입력 시퀀스를 숨겨진 레이어의 숨겨진 벡터로 결합하여 입력 시퀀스 정보 및 잠재적 관계를 표현할 수 있습니다. 디코더는 전송된 숨겨진 벡터를 디코딩하고 T~T+4 일의 입력 시세 특성과 결합하여 향후 T+ 1~T+5 일의 거래 위치를 매일 예측합니다.

그림 5. 5 의 흐름도. Seq2Seq 모델

넷째, 다중 알고리즘 융합 모델의 구축

선물 시장은 급변하고 있으며, 고객층의 거래 창고 보유 행위는 여러 가지 요인에 의해 영향을 받고 있으며, 단일 모델은 과거 데이터를 맞추기 쉽다.