Strategi perdagangan frekuensi tinggi berdasarkan buku pesanan pembelajaran mesin

Penulis:Penemu Kuantitas - Mimpi Kecil, Dibuat: 2016-11-16 16:52:38, Diperbarui: 2016-11-16 16:55:18

Strategi perdagangan frekuensi tinggi berdasarkan buku pesanan pembelajaran mesin

  • ### Pertama, teori Mekanisme perdagangan pasar sekuritas dapat dibagi menjadi dua jenis, yaitu pasar yang didorong oleh penawaran dan pasar yang didorong oleh pesanan. Yang pertama bergantung pada pemasar untuk memberikan likuiditas, yang kedua memberikan likuiditas melalui daftar harga yang dibatasi, dan perdagangan dibentuk melalui penawaran yang ditugaskan oleh investor untuk membeli dan menjual.

基于机器学习的订单簿高频交易策略Gambar 1 Pembelian Memimpin Peta Pasar

  • (I) Daftar Harga Terbatas

    Penelitian buku pesanan termasuk dalam kategori penelitian struktur mikro pasar, teori struktur mikro pasar menggunakan teori harga dan teori vendor dalam ekonomi mikro sebagai sumber pemikiran, dan dalam analisis masalah utamanya tentang perdagangan aset keuangan dan proses dan penyebab pembentukan harga, ia menggunakan berbagai teori dan metode seperti keseimbangan umum, keseimbangan lokal, keuntungan marginal, biaya marginal, kesinambungan pasar, teori persediaan, teori permainan, ekonomi informasi, dan sebagainya.

    Dari kemajuan penelitian di luar negeri, bidang struktur mikro pasar yang diwakili oleh O Hara, sebagian besar teori didasarkan pada pasar dagang (yaitu pasar yang didorong oleh penawaran), seperti model persediaan dan model informasi, dll. Tahun ini, pemicu pesanan telah secara bertahap menempati posisi teratas di pasar perdagangan yang sebenarnya, tetapi penelitian khusus untuk pasar pemicu pesanan masih relatif sedikit.

    Pasar sekuritas domestik dan pasar berjangka adalah pasar yang didorong oleh pesanan. Gambar berikut adalah gambar daftar pesanan industri Level_1 dari kontrak berjangka indeks saham IF1312. Tidak banyak informasi yang diperoleh langsung dari atas, informasi dasar termasuk harga beli, harga jual, jumlah beli dan jumlah jual. Dalam beberapa makalah akademik di luar negeri, ada juga buku informasi yang sesuai dengan buku pesanan, termasuk data pengambilan pesanan yang paling rinci, termasuk jumlah pesanan, harga yang dikirim, jenis informasi pesanan, karena informasi dari buku informasi pasar domestik tidak terbuka, maka perdagangan frekuensi tinggi hanya dapat mengandalkan buku pesanan.

    基于机器学习的订单簿高频交易策略Gambar 2 Bursa saham futures kontrak utama Level-1 buku pesanan

  • (ii) Perkembangan penelitian buku pesanan perdagangan frekuensi tinggi

    Ada dua metode pemodelan dinamis buku pesanan, yaitu metode ekonomi pengukuran klasik dan metode pembelajaran mesin. Metode ekonomi pengukuran adalah metode penelitian klasik yang populer, seperti analisis perbedaan harga penelitian MRR, Huang dan Stoll, model ACD yang mempelajari durasi pesanan, dan model logistik yang mempelajari perkiraan harga.

    Penelitian akademis dalam bidang keuangan juga sangat aktif, seperti tahun 2012 yang membahas tentang Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. Ini adalah ide penelitian umum yang menggunakan indikator analisis teknis yang umum (MA, EMA, RSI, dll.) untuk memprediksi pasar. Namun, praktik ini tidak cukup menggali informasi dinamika buku pesanan, yaitu penelitian yang menggunakan informasi dinamika buku pesanan untuk melakukan perdagangan tinggi masih relatif sedikit di dalam negeri dan luar negeri, dan ini adalah bidang yang layak dipelajari secara mendalam.

  • Aplikasi pembelajaran mesin dalam transaksi frekuensi tinggi di buku pesanan

    • #### (I) Arsitektur Sistem Gambar berikut adalah arsitektur sistem dari strategi perdagangan pembelajaran mesin yang khas, termasuk data buku pesanan, penemuan fitur, membangun dan memverifikasi model, dan beberapa modul utama peluang perdagangan. Perlu dicatat bahwa proses perdagangan dipicu oleh peristiwa pasar, dan kedatangan pasar tik adalah salah satu peristiwa tersebut.

    基于机器学习的订单簿高频交易策略Gambar 3 Arsitektur sistem pemodelan buku pesanan berbasis pembelajaran mesin

    • #### (B) Memperkuat mesin vektor Pada tahun 1970-an, Wapnik dan lain-lain mulai membangun sistem teori yang lebih baik, yaitu teori pembelajaran statistik (SLT), yang digunakan untuk mempelajari hukum statistik dan sifat metode pembelajaran dalam kasus sampel terbatas, membangun kerangka teori yang baik untuk masalah pembelajaran mesin sampel terbatas, dan lebih baik memecahkan masalah praktis seperti sampel kecil, non-linier, bilangan dimensi tinggi, dan titik terendah lokal. Pada tahun 1995, Wapnik dan lain-lain dengan jelas mengemukakan metode pembelajaran umum baru yang mendukung vektor gerak (SVM, Support Vector Machine), teori ini mendapat perhatian luas dan diterapkan ke berbagai bidang, dan telah menunjukkan kinerja awal yang jauh lebih baik daripada metode tersebut.

    SVM adalah pengembangan dari superplane klasifikasi optimal dalam kasus pembagian linier. Untuk dua jenis masalah klasifikasi, set sampel pelatihan adalah ((xi,yi), i = 1,2... l, l adalah jumlah individu dalam sampel pelatihan, xi adalah sampel pelatihan, yi adalah tanda kelas dari sampel input xi ((output yang diharapkan)).

    Superplanet klasifikasi optimal tidak hanya dapat memisahkan semua sampel dengan benar (skor kesalahan pelatihan adalah 0), tetapi juga dapat membuat margin terbesar antara kedua kelas, yang didefinisikan sebagai jumlah jarak terendah dari dataset pelatihan ke superplanet klasifikasi tersebut. Superplanet klasifikasi optimal berarti bahwa rata-rata kesalahan klasifikasi terhadap data uji adalah terkecil.

    Jika ada sebuah superplane dalam ruang vektor d-dimensi:

    F ((x) = w*x+b=0

    Untuk dapat memisahkan kedua jenis data di atas, kita menyebut superplane ini sebagai antarmuka pembagian. Di sini w * x adalah dalaman dua vektor w dan x dalam ruang vektor d dimensi.

    Jika Anda membagi antarmuka:

    w*x+b=0

    Margin yang dapat membuat jarak antara dua sampel yang paling dekat dengan antarmuka tersebut menjadi maksimum disebut antarmuka yang paling optimal.

    基于机器学习的订单簿高频交易策略Gambar 4 Peta antarmuka paling optimal untuk kategori SVM biner

    Integrasi dari persamaan antarmuka optimal dapat membuat jarak antara dua jenis sampel

    基于机器学习的订单簿高频交易策略

    Jadi untuk sampel apa pun,

    基于机器学习的订单簿高频交易策略

    Untuk mendapatkan antarmuka yang optimal, selain memuaskan rumus di atas, Anda harus meminimalkannya.

    Dengan demikian, model matematika dari masalah SVM adalah:基于机器学习的订单簿高频交易策略

    SVM akhirnya menjadi masalah perencanaan yang paling dioptimalkan, dengan fokus penelitian akademis terutama pada solusi cepat, penyebaran ke multiklasik, aplikasi masalah praktis, dll.

    SVM awalnya dibuat untuk masalah klasifikasi biner, dan kemudian diperluas ke masalah multiklas berdasarkan kebutuhan aplikasi praktis saat ini. Algoritma multiklas yang sudah ada termasuk satu-ke-banyak, satu-ke-satu, pengkodean kesalahan, DAG-SVM, dan Multi i-class SVM classifier.

    • #### (III) Pengambilan indikator buku pesanan Sebagai contoh, dalam pasar saham indeks berjangka Level-1, buku pesanan terutama terdiri dari indikator dasar seperti harga beli, harga jual, volume beli, volume jual, dan dapat menghasilkan indikator seperti kedalaman, kemiringan, selisih harga relatif, indikator lain termasuk volume kepemilikan, volume transaksi, margin, dll, total 17 indikator, seperti yang ditunjukkan di bawah ini.

    Tabel 1 Perpustakaan indikator berdasarkan buku pesanan level

    基于机器学习的订单簿高频交易策略

    • #### (IV) Pendaftaran Pendaftaran Pendaftaran Pendaftaran Pendaftaran Dari sudut pandang mikro pasar, ada dua metode pengukuran pergerakan harga dalam waktu singkat, yaitu pergerakan harga tengah dan penyeberangan harga. Dalam artikel ini, kami memilih pergerakan harga tengah yang lebih sederhana dan intuitif.

    基于机器学习的订单簿高频交易策略

    Berdasarkan ukuran perubahan ΔP harga tengah dalam buku pesanan Δt dibagi menjadi tiga kategori.

    Gambar di bawah ini adalah distribusi pergerakan harga pertengahan kontrak utama IF1311 pada 29 Oktober, dengan data pasar tik 32400 per hari.

    Dalam kasus Δt = 1 tick, perubahan nilai absolut harga tengah 0.2 sekitar 6000 kali, perubahan nilai absolut 0.4 sekitar 1500 kali, perubahan nilai absolut 0.6 sekitar 150 kali, perubahan nilai absolut 0.8 lebih besar dari 50 kali, perubahan nilai absolut lebih besar dari 1 sekitar 10 kali.

    Dalam kasus Δt = 2tick, perubahan nilai absolut harga tengah 0.2 sekitar 7000 kali, perubahan nilai absolut 0.4 sekitar 3000 kali, perubahan nilai absolut 0.6 sekitar 550 kali, perubahan nilai absolut 0.8 sekitar 205 kali, dan perubahan nilai absolut lebih besar dari 1 sekitar 10 kali.

    Kami menganggap bahwa perubahan nilai mutlak lebih besar dari 0.4 adalah peluang potensial. Dalam kasus Δt = 1 tik, ada sekitar 1700 peluang per hari; dalam kasus Δt = 2 tik, ada sekitar 4000 peluang per hari.

    基于机器学习的订单簿高频交易策略

    Gambar 5 IF1311 Tabel perubahan harga pada 29 Oktober (Δt = 1 tick)

    基于机器学习的订单簿高频交易策略

    Gambar 6 IF1311 Tabel perubahan harga pada 29 Oktober (Δt = 2 tick)

  • Dan ketiga, bukti strategis.

    Karena kompleksitas pelatihan yang relatif tinggi dan waktu pelatihan yang lebih lama dalam kasus sampel besar model SVM, data pasar historis yang kami pilih memiliki rentang waktu yang relatif pendek, dengan data pasar Level_1 kontrak IF1311 pada bulan Oktober sebagai contoh untuk memverifikasi efektivitas model.

    • #### (1) Pemeriksaan efek model Periode data: data pasar kontrak IF1311 pada bulan Oktober;

    Mengambil nilai Δt: Semakin kecil Δt, semakin tinggi persyaratan untuk detail transaksi. Saat Δt = 1 tik, sangat sulit untuk mendapatkan keuntungan dalam transaksi yang sebenarnya. Untuk membandingkan efek model, di sini masing-masing nilai 1 tik, 2 tik, 3 tik;

    Indikator penilaian model: akurasi sampel, akurasi tes, waktu prediksi.基于机器学习的订单簿高频交易策略Tabel 2 memprediksi efek dari 1 tick dengan data 1 tick

    基于机器学习的订单簿高频交易策略Tabel 3 memprediksi efek dari tick 2 dengan data 1 tick

    基于机器学习的订单簿高频交易策略Tabel 4 Mengprediksi efek 2tick dengan data 2tick

    Dari data dari tiga tabel di atas, kita dapat membuat beberapa kesimpulan: Keakuratan tertinggi adalah sekitar 70%, dan keakuratan 60% dapat diterjemahkan menjadi strategi perdagangan.

    • #### (B) Strategi Simulasi Pendapatan Sebagai contoh, pada tanggal 31 Oktober, kami melakukan perdagangan simulasi, dan biaya transaksi futures saham lembaga umumnya adalah biaya transaksi futures saham lembaga umumnya adalah 0.2610000Jika kita mengasumsikan bahwa jumlah transaksi tidak terbatas, maka kita mengasumsikan bahwa setiap transaksi dengan harga satu sisi adalah 0.2 poin dan setiap transaksi dengan jumlah satu tangan.

    Tabel 5 Strategi Simulasi Perdagangan pada 31 Oktober基于机器学习的订单簿高频交易策略

    Jumlah transaksi sepanjang hari 605 kali, termasuk kasus prosedur, keuntungan 339 kali, tingkat kemenangan 56%, laba bersih 11814.99 yuan.

    Jika detail pesanan dikendalikan dengan lebih tepat, maka harga gulung dapat dikurangi dan keuntungan bersih dapat ditingkatkan. Jika detail pesanan dikendalikan dengan tidak benar, atau pasar bergeser, harga gulung akan lebih besar, sedangkan keuntungan bersih akan berkurang, sehingga keberhasilan perdagangan frekuensi tinggi sering kali tergantung pada pelaksanaan detail.

    Gambar 7 Hasil dari simulasi strategi pada 31 Oktober基于机器学习的订单簿高频交易策略

Pengucapan dari kata "sosial" (sosial) [sosial]


Informasi lebih lanjut

Evan1987Goodwin sedang belajar bagaimana meneliti orderan.