Hình 1 Biểu đồ thị trường thúc đẩy đơn đặt hàng
Nghiên cứu về sổ đặt hàng thuộc lĩnh vực nghiên cứu cấu trúc vi mô thị trường, lý thuyết cấu trúc vi mô thị trường lấy lý thuyết giá cả và lý thuyết nhà cung cấp trong kinh tế vi mô làm nguồn tư tưởng của nó, trong khi phân tích các vấn đề cốt lõi của nó về giao dịch tài sản tài chính và quá trình và nguyên nhân hình thành giá của nó, sử dụng nhiều lý thuyết và phương pháp như cân bằng chung, cân bằng địa phương, lợi nhuận biên, chi phí biên, sự liên tục của thị trường, lý thuyết kho dự trữ, lý thuyết trò chơi, kinh tế thông tin.
Theo tiến trình nghiên cứu ở nước ngoài, lĩnh vực cấu trúc vi mô của thị trường được đại diện bởi O
Các thị trường chứng khoán trong nước và thị trường tương lai đều thuộc về thị trường điều khiển lệnh, hình dưới đây là hình ảnh sơ đồ sổ lệnh thị trường cấp 1 của hợp đồng tương lai chỉ số IF1312. Thông tin trực tiếp từ trên không có nhiều, thông tin cơ bản bao gồm mua một giá, bán một giá, mua một lượng và bán một lượng. Trong một số bài báo học thuật ở nước ngoài, và sổ lệnh tương ứng cũng có sổ thông tin, bao gồm dữ liệu chụp đơn đặt hàng chi tiết nhất, bao gồm số lượng đặt hàng, giá giao dịch, loại thông tin của mỗi đơn đặt hàng, vì thị trường trong nước không công khai sổ thông tin, vì vậy chúng tôi chỉ có thể dựa vào sổ lệnh giao dịch tần suất cao.
Hình 2 Chứng chỉ tương lai chính hợp đồng Level-1 sổ lệnh
Mô hình hóa động của sổ sách đơn hàng, có hai phương pháp chính, một là phương pháp kinh tế đo lường cổ điển và một là phương pháp học máy. Phương pháp kinh tế đo lường là một phương pháp nghiên cứu truyền thống cổ điển, chẳng hạn như phân tích MRR phân tích chênh lệch giá, phân tích Huang và Stoll phân tích, nghiên cứu mô hình ACD thời gian đơn đặt hàng, nghiên cứu mô hình logistic dự đoán giá.
Nghiên cứu học thuật về học máy trong lĩnh vực tài chính cũng rất tích cực, ví dụ như năm 2012 Phương pháp Forecasting trends of high_frequency KOSPI200 index data using learning classifiers Phương pháp này là một ý tưởng nghiên cứu phổ biến, sử dụng các chỉ số phân tích kỹ thuật phổ biến (MA, EMA, RSI, v.v.) để đưa ra các phương pháp phân loại học máy để dự đoán thị trường.
Hình 3 Kiến trúc hệ thống mô hình sổ hàng dựa trên máy học
SVM phát triển từ siêu phẳng phân loại tối ưu trong trường hợp phân loại tuyến tính. Đối với hai loại vấn đề phân loại, đặt tập mẫu huấn luyện là ((xi,yi), i = 1,2...l, l là số cá nhân trong mẫu huấn luyện, xi là mẫu huấn luyện, yi thuộc về {-1+,1} là ký hiệu loại của mẫu nhập xi ((output mong đợi)).
Một siêu phẳng phân loại tối ưu không chỉ phân loại tất cả các mẫu một cách chính xác (tỷ lệ lỗi đào tạo là 0), mà còn có thể làm cho biên giới giữa hai lớp lớn nhất, biên giới được định nghĩa là tổng của khoảng cách nhỏ nhất của tập dữ liệu đào tạo đến siêu phẳng phân loại đó. Một siêu phẳng phân loại tối ưu có nghĩa là sai số phân loại trung bình cho dữ liệu thử nghiệm nhỏ nhất.
Nếu có một siêu phẳng trong không gian vector d chiều:
F ((x) = w * x + b = 0
Để phân biệt được hai loại dữ liệu trên, siêu phẳng này được gọi là giao diện phân vùng. Ở đây w * x là nội khối của hai vector w và x trong không gian vector chiều d.
Nếu chia giao diện:
w*x+b=0
Đường giao diện được gọi là giao diện ưu việt nhất nếu có thể tạo ra khoảng cách tối đa giữa hai mẫu gần nhất của giao diện đó.
Hình 4 SVM phân loại thứ hai giao diện tối ưu
Phân tích các phương trình giao diện tối ưu có thể làm cho khoảng cách giữa hai loại mẫu
Vì vậy, đối với bất kỳ mẫu nào,
Để có được giao diện tối ưu nhất, ngoài việc đáp ứng các công thức trên, bạn cũng phải giảm thiểu.
Do đó, mô hình toán học của vấn đề SVM là:
SVM cuối cùng đã trở thành một vấn đề lập trình tối ưu nhất, và các nghiên cứu trong giới học thuật tập trung vào việc giải quyết nhanh chóng, phổ biến sang nhiều lớp, ứng dụng cho các vấn đề thực tế, v.v.
SVM ban đầu được đề xuất cho các vấn đề phân loại hai, và theo yêu cầu ứng dụng thực tế hiện nay, nó được phát triển thành các vấn đề đa lớp. Các thuật toán đa lớp hiện có bao gồm một, nhiều, một, một, mã lỗi, DAG-SVM và trình phân loại SVM đa lớp i.
Bảng 1 Cơ sở chỉ số dựa trên sổ đặt hàng thị trường cấp
Theo quy mô thay đổi giá trung bình ΔP trong Δt trong sổ đặt hàng, chúng được chia thành ba loại.
Dưới đây là biểu đồ phân bố động lượng giá trung gian của các hợp đồng chính IF1311 vào ngày 29 tháng 10, với dữ liệu thị trường 32400 tick mỗi ngày.
Trong trường hợp Δt = 1 tick, giá trung gian thay đổi giá trị tuyệt đối 0.2 khoảng 6000 lần, thay đổi giá trị tuyệt đối 0.4 khoảng 1500 lần, thay đổi giá trị tuyệt đối 0.6 khoảng 150 lần, thay đổi giá trị tuyệt đối 0.8 lớn hơn 50 lần, thay đổi giá trị tuyệt đối lớn hơn 1 bằng khoảng 10 lần.
Trong trường hợp Δt = 2tick, giá trung gian thay đổi giá trị tuyệt đối 0.2 khoảng 7000 lần, thay đổi giá trị tuyệt đối 0.4 khoảng 3000 lần, thay đổi giá trị tuyệt đối 0.6 khoảng 550 lần, thay đổi giá trị tuyệt đối 0.8 khoảng 205 lần, thay đổi giá trị tuyệt đối lớn hơn bằng 1 khoảng 10 lần.
Chúng tôi cho rằng sự thay đổi ở giá trị tuyệt đối lớn hơn bằng 0.4 là cơ hội giao dịch tiềm năng. Trong trường hợp Δt = 1 tick, có khoảng 1700 cơ hội mỗi ngày; trong trường hợp Δt = 2 tick, có khoảng 4000 cơ hội mỗi ngày.
Hình 5 IF1311 Biểu đồ thay đổi giá trung bình vào ngày 29 tháng 10 (Δt = 1 tick)
Hình 6 IF1311 Biểu đồ thay đổi giá trung bình vào ngày 29 tháng 10 (Δt = 2 tick)
Do sự phức tạp và thời gian đào tạo của mô hình SVM trong trường hợp mẫu lớn, chúng tôi đã chọn dữ liệu thị trường lịch sử với khoảng thời gian tương đối ngắn, ví dụ như dữ liệu thị trường cấp 1 của hợp đồng IF1311 vào tháng 10, để xác minh hiệu quả của mô hình.
Đánh giá Δt: Đánh giá Δt nhỏ hơn, yêu cầu chi tiết giao dịch cao hơn, khó có lợi nhuận trong giao dịch thực tế khi Δt = 1 tick. Để so sánh hiệu quả của mô hình, giá trị 1 tick, 2 tick, 3 tick;
Các chỉ số đánh giá mô hình: độ chính xác mẫu, độ chính xác kiểm tra, thời gian dự đoán.Bảng 2 dự đoán hiệu quả của 1 tick với dữ liệu 1 tick
Bảng 3 dự đoán hiệu quả của tick 2 với dữ liệu 1 tick
Bảng 4 dự đoán hiệu quả của 2tick với dữ liệu 2tick
Từ dữ liệu của ba bảng trên, chúng ta có thể rút ra một số kết luận: Độ chính xác cao nhất là khoảng 70% và độ chính xác 60% có thể được chuyển thành chiến lược giao dịch.
Bảng 5 Chiến lược mô phỏng giao dịch vào ngày 31 tháng 10
Số lần giao dịch trong ngày là 605 lần, bao gồm các trường hợp thủ tục, 339 lần lợi nhuận, tỷ lệ thắng 56%, lợi nhuận ròng 11.814.99 đô la.
Giá trượt theo lý thuyết là 14.520 đô la, phần này là chìa khóa cho chiến lược thực tế, nếu chi tiết giao dịch được kiểm soát một cách chính xác hơn, thì có thể giảm giá trượt và tăng lợi nhuận ròng, nếu chi tiết giao dịch không được kiểm soát đúng cách hoặc thị trường biến động bất thường, giá trượt sẽ lớn hơn, nhưng lợi nhuận ròng sẽ giảm, do đó, sự thành công của giao dịch tần số cao thường phụ thuộc vào việc thực hiện chi tiết.
Hình 7: Chiến lược mô phỏng thu nhập vào ngày 31 tháng 10
Thông báo gốc: Tác giả của bài viết này, xin lưu ý nguồn gốc.
Evan1987Xuân Xuân, đang học cách nghiên cứu các đơn đặt hàng