Các cơ chế giao dịch của thị trường chứng khoán có thể được chia thành hai loại: thị trường dẫn lời và thị trường dẫn lời, trước đây dựa vào việc cung cấp thanh khoản bằng cách làm đại lý, sau đó cung cấp thanh khoản thông qua lệnh giới hạn, giao dịch được hình thành bằng cách mua và bán theo yêu cầu của nhà đầu tư.
Hình 1 Biểu đồ thị trường thúc đẩy đơn đặt hàng
Nghiên cứu về sổ đặt hàng thuộc lĩnh vực nghiên cứu cấu trúc vi mô thị trường, lý thuyết cấu trúc vi mô thị trường lấy lý thuyết giá cả và lý thuyết nhà cung cấp trong kinh tế vi mô làm nguồn tư tưởng của nó, trong khi phân tích các vấn đề cốt lõi của nó về giao dịch tài sản tài chính và quá trình và nguyên nhân hình thành giá của nó, sử dụng nhiều lý thuyết và phương pháp như cân bằng chung, cân bằng địa phương, lợi nhuận biên, chi phí biên, sự liên tục của thị trường, lý thuyết kho dự trữ, lý thuyết trò chơi, kinh tế thông tin.
Theo tiến trình nghiên cứu ở nước ngoài, lĩnh vực cấu trúc vi mô của thị trường được đại diện bởi O
Các thị trường chứng khoán trong nước và thị trường tương lai đều thuộc về thị trường điều khiển lệnh, hình dưới đây là hình ảnh sơ đồ sổ lệnh thị trường cấp 1 của hợp đồng tương lai chỉ số IF1312. Thông tin trực tiếp từ trên không có nhiều, thông tin cơ bản bao gồm mua một giá, bán một giá, mua một lượng và bán một lượng. Trong một số bài báo học thuật ở nước ngoài, và sổ lệnh tương ứng cũng có sổ thông tin, bao gồm dữ liệu chụp đơn đặt hàng chi tiết nhất, bao gồm số lượng đặt hàng, giá giao dịch, loại thông tin của mỗi đơn đặt hàng, vì thị trường trong nước không công khai sổ thông tin, vì vậy chúng tôi chỉ có thể dựa vào sổ lệnh giao dịch tần suất cao.
Hình 2 Chứng chỉ tương lai chính hợp đồng Level-1 sổ lệnh
Mô hình hóa động của sổ sách đơn hàng, có hai phương pháp chính, một là phương pháp kinh tế đo lường cổ điển và một là phương pháp học máy. Phương pháp kinh tế đo lường là một phương pháp nghiên cứu truyền thống cổ điển, chẳng hạn như phân tích MRR phân tích chênh lệch giá, phân tích Huang và Stoll phân tích, nghiên cứu mô hình ACD thời gian đơn đặt hàng, nghiên cứu mô hình logistic dự đoán giá.
Nghiên cứu học thuật về học máy trong lĩnh vực tài chính cũng rất tích cực, ví dụ như năm 2012 Phương pháp Forecasting trends of high_frequency KOSPI200 index data using learning classifiers Phương pháp này là một ý tưởng nghiên cứu phổ biến, sử dụng các chỉ số phân tích kỹ thuật phổ biến (MA, EMA, RSI, v.v.) để đưa ra các phương pháp phân loại học máy để dự đoán thị trường.
Dưới đây là một cấu trúc hệ thống của một chiến lược giao dịch học máy điển hình, bao gồm dữ liệu sổ lệnh, phát hiện đặc điểm, xây dựng mô hình và xác minh và một số mô-đun chính của cơ hội giao dịch.
Hình 3 Kiến trúc hệ thống mô hình sổ hàng dựa trên máy học
Trong những năm 1970, Wapnik và những người khác bắt đầu xây dựng một hệ thống lý thuyết hoàn thiện hơn về lý thuyết học tập thống kê (SLT, Statistical Learning Theory), được sử dụng để nghiên cứu các quy tắc thống kê và tính chất của các phương pháp học tập trong trường hợp mẫu hạn chế, xây dựng một khuôn khổ lý thuyết tốt cho các vấn đề học máy với mẫu hạn chế, giải quyết tốt hơn các vấn đề thực tế như mẫu nhỏ, phi tuyến tính, số chiều cao và điểm cực nhỏ tại địa phương. Năm 1995, Vapnik và những người khác đã đưa ra một phương pháp học tập chung mới hỗ trợ động cơ vector SVM, sau đó nó đã được chú ý rộng rãi và được áp dụng cho các lĩnh vực khác nhau, và nó đã cho thấy hiệu suất tốt hơn nhiều so với các phương pháp ban đầu.
SVM phát triển từ siêu phẳng phân loại tối ưu trong trường hợp phân loại tuyến tính. Đối với hai loại vấn đề phân loại, đặt tập mẫu huấn luyện là ((xi,yi), i = 1,2...l, l là số cá nhân trong mẫu huấn luyện, xi là mẫu huấn luyện, yi thuộc về {-1+,1} là ký hiệu loại của mẫu nhập xi ((output mong đợi)).
Một siêu phẳng phân loại tối ưu không chỉ phân loại tất cả các mẫu một cách chính xác (tỷ lệ lỗi đào tạo là 0), mà còn có thể làm cho biên giới giữa hai lớp lớn nhất, biên giới được định nghĩa là tổng của khoảng cách nhỏ nhất của tập dữ liệu đào tạo đến siêu phẳng phân loại đó. Một siêu phẳng phân loại tối ưu có nghĩa là sai số phân loại trung bình cho dữ liệu thử nghiệm nhỏ nhất.
Nếu có một siêu phẳng trong không gian vector d chiều:
F ((x) = w * x + b = 0
Để phân biệt được hai loại dữ liệu trên, siêu phẳng này được gọi là giao diện phân vùng. Ở đây w * x là nội khối của hai vector w và x trong không gian vector chiều d.
Nếu chia giao diện:
w*x+b=0
Đường giao diện được gọi là giao diện ưu việt nhất nếu có thể tạo ra khoảng cách tối đa giữa hai mẫu gần nhất của giao diện đó.
Hình 4 SVM phân loại thứ hai giao diện tối ưu
Phân tích các phương trình giao diện tối ưu có thể làm cho khoảng cách giữa hai loại mẫu
Vì vậy, đối với bất kỳ mẫu nào,
Để có được giao diện tối ưu nhất, ngoài việc đáp ứng các công thức trên, bạn cũng phải giảm thiểu.
Do đó, mô hình toán học của vấn đề SVM là:
SVM cuối cùng đã trở thành một vấn đề lập trình tối ưu nhất, và các nghiên cứu trong giới học thuật tập trung vào việc giải quyết nhanh chóng, phổ biến sang nhiều lớp, ứng dụng cho các vấn đề thực tế, v.v.
SVM ban đầu được đề xuất cho các vấn đề phân loại hai, và theo yêu cầu ứng dụng thực tế hiện nay, nó được phát triển thành các vấn đề đa lớp. Các thuật toán đa lớp hiện có bao gồm một, nhiều, một, một, mã lỗi, DAG-SVM và trình phân loại SVM đa lớp i.
Ví dụ như thị trường kỳ hạn chỉ số chứng khoán cấp 1, sổ lệnh bao gồm các chỉ số cơ bản như mua, bán, mua, bán, và các chỉ số khác như độ sâu, độ lệch, chênh lệch giá tương đối, các chỉ số khác bao gồm khối lượng nắm giữ, khối lượng giao dịch, chênh lệch giá, tổng cộng 17 chỉ số, như trong bảng dưới đây.
Bảng 1 Cơ sở chỉ số dựa trên sổ đặt hàng thị trường cấp
Từ góc nhìn vi mô thị trường, có hai cách để đo động lượng giá trong thời gian ngắn, một là động lượng giá trung gian và một là giá chênh lệch chéo.
Theo quy mô thay đổi giá trung bình ΔP trong Δt trong sổ đặt hàng, chúng được chia thành ba loại.
Dưới đây là biểu đồ phân bố động lượng giá trung gian của các hợp đồng chính IF1311 vào ngày 29 tháng 10, với dữ liệu thị trường 32400 tick mỗi ngày.
Trong trường hợp Δt = 1 tick, giá trung gian thay đổi giá trị tuyệt đối 0.2 khoảng 6000 lần, thay đổi giá trị tuyệt đối 0.4 khoảng 1500 lần, thay đổi giá trị tuyệt đối 0.6 khoảng 150 lần, thay đổi giá trị tuyệt đối 0.8 lớn hơn 50 lần, thay đổi giá trị tuyệt đối lớn hơn 1 bằng khoảng 10 lần.
Trong trường hợp Δt = 2tick, giá trung gian thay đổi giá trị tuyệt đối 0.2 khoảng 7000 lần, thay đổi giá trị tuyệt đối 0.4 khoảng 3000 lần, thay đổi giá trị tuyệt đối 0.6 khoảng 550 lần, thay đổi giá trị tuyệt đối 0.8 khoảng 205 lần, thay đổi giá trị tuyệt đối lớn hơn bằng 1 khoảng 10 lần.
Chúng tôi cho rằng sự thay đổi ở giá trị tuyệt đối lớn hơn bằng 0.4 là cơ hội giao dịch tiềm năng. Trong trường hợp Δt = 1 tick, có khoảng 1700 cơ hội mỗi ngày; trong trường hợp Δt = 2 tick, có khoảng 4000 cơ hội mỗi ngày.
Hình 5 IF1311 Biểu đồ thay đổi giá trung bình vào ngày 29 tháng 10 (Δt = 1 tick)
Hình 6 IF1311 Biểu đồ thay đổi giá trung bình vào ngày 29 tháng 10 (Δt = 2 tick)
Do sự phức tạp và thời gian đào tạo của mô hình SVM trong trường hợp mẫu lớn, chúng tôi đã chọn dữ liệu thị trường lịch sử với khoảng thời gian tương đối ngắn, ví dụ như dữ liệu thị trường cấp 1 của hợp đồng IF1311 vào tháng 10, để xác minh hiệu quả của mô hình.
Thời kỳ dữ liệu: Dữ liệu thị trường hợp đồng IF1311 tháng 10
Đánh giá Δt: Đánh giá Δt nhỏ hơn, yêu cầu chi tiết giao dịch cao hơn, khó có lợi nhuận trong giao dịch thực tế khi Δt = 1 tick. Để so sánh hiệu quả của mô hình, giá trị 1 tick, 2 tick, 3 tick;
Các chỉ số đánh giá mô hình: độ chính xác mẫu, độ chính xác kiểm tra, thời gian dự đoán.Bảng 2 dự đoán hiệu quả của 1 tick với dữ liệu 1 tick
Bảng 3 dự đoán hiệu quả của tick 2 với dữ liệu 1 tick
Bảng 4 dự đoán hiệu quả của 2tick với dữ liệu 2tick
Từ dữ liệu của ba bảng trên, chúng ta có thể rút ra một số kết luận: Độ chính xác cao nhất là khoảng 70% và độ chính xác 60% có thể được chuyển thành chiến lược giao dịch.
Ví dụ như vào ngày 31 tháng 10, chúng tôi thực hiện giao dịch giả định, chi phí giao dịch tương lai chứng khoán của tổ chức thường là chi phí giao dịch tương lai chứng khoán của tổ chức thường là 0.26/10000, chúng tôi giả định số lần giao dịch không giới hạn, giả sử mỗi giao dịch có giá trượt một bên là 0.2 điểm và mỗi lần đặt cược là một tay.
Bảng 5 Chiến lược mô phỏng giao dịch vào ngày 31 tháng 10
Số lần giao dịch trong ngày là 605 lần, bao gồm các trường hợp thủ tục, 339 lần lợi nhuận, tỷ lệ thắng 56%, lợi nhuận ròng 11.814.99 đô la.
Giá trượt theo lý thuyết là 14.520 đô la, phần này là chìa khóa cho chiến lược thực tế, nếu chi tiết giao dịch được kiểm soát một cách chính xác hơn, thì có thể giảm giá trượt và tăng lợi nhuận ròng, nếu chi tiết giao dịch không được kiểm soát đúng cách hoặc thị trường biến động bất thường, giá trượt sẽ lớn hơn, nhưng lợi nhuận ròng sẽ giảm, do đó, sự thành công của giao dịch tần số cao thường phụ thuộc vào việc thực hiện chi tiết.
Hình 7: Chiến lược mô phỏng thu nhập vào ngày 31 tháng 10
Thông báo gốc: Tác giả của bài viết này, xin lưu ý nguồn gốc.
Evan1987Xuân Xuân, đang học cách nghiên cứu các đơn đặt hàng