4
tập trung vào
1090
Người theo dõi

Dữ liệu lớn thực tế

Được tạo ra trong: 2018-01-26 12:11:58, cập nhật trên: 2019-07-31 18:03:38
comments   0
hits   1744

Dữ liệu lớn trên chiến trường: Nhu cầu kiểm tra dữ liệu ngoài mẫu của chiến lược định lượng

Dữ liệu lớn thực tế

  • #### NO:01

Cuộc sống của con người, từ trẻ đến lớn, từ lớn đến già, thực sự là một quá trình liên tục phạm lỗi, sửa chữa và phạm lỗi, hầu như không ai có thể được ngoại lệ. Có thể đã phạm phải nhiều lỗi, có vẻ như rất thấp ở thời điểm hiện tại; hoặc có thể đã bỏ lỡ nhiều cơ hội để lên xe, chẳng hạn như bất động sản, internet, tiền kỹ thuật số, v.v …

Tôi đã từng nghe người ta nói: “Tôi không nên”… “Nếu tôi”…

Tôi đã lo lắng về vấn đề này trong một thời gian dài, và sau đó tôi dần hiểu. Thật ra, đó không phải là một điều đáng sợ, bởi vì mỗi lựa chọn, dù đúng hay sai, sẽ đưa chúng ta ra khỏi kết quả đã được đặt ra trước và đi đến một điều chưa biết; và suy nghĩ của chúng ta, chỉ mở ra tầm nhìn của Thiên Chúa ngoài dữ liệu lịch sử.

  • #### NO:02

Tôi đã thấy rất nhiều hệ thống giao dịch, có thể đạt tỷ lệ thành công trên 50% khi đánh giá lại. Với tỷ lệ thắng cao như vậy, có thể có tỷ lệ thua lỗ trên 1:1. Tuy nhiên, không có ngoại lệ, một khi các hệ thống này được đưa vào thị trường thực, về cơ bản là thua lỗ.

Dữ liệu lớn thực tế

Tuy nhiên, giao dịch là một vấn đề phức tạp, nhìn lại là rất rõ ràng, nhưng nếu chúng ta không có quang cảnh của Thiên Chúa, trở lại ban đầu, vẫn còn không biết làm thế nào. Điều này dẫn đến vấn đề gốc rễ của định lượng và giới hạn của dữ liệu lịch sử.

  • #### NO:03

Nhưng trong trường hợp dữ liệu hạn chế, làm thế nào để tận dụng tối đa dữ liệu hạn chế để kiểm tra toàn diện các chiến lược giao dịch?

Nguyên tắc cơ bản của kiểm tra trục xuất: đào tạo mô hình với dữ liệu lịch sử dài trước, và kiểm tra mô hình với dữ liệu tương đối ngắn sau đó, sau đó liên tục di chuyển cửa sổ lấy dữ liệu về phía sau, lặp lại các bước đào tạo và kiểm tra.

Dữ liệu lớn thực tế

Dữ liệu huấn luyện: 2000-2001, dữ liệu thử nghiệm: 2002; Dữ liệu huấn luyện: 2001-2002; Dữ liệu thử nghiệm: 2003; Dữ liệu đào tạo: 2002-2003, dữ liệu thử nghiệm: 2004; Dữ liệu huấn luyện: 2003-2004, dữ liệu thử nghiệm: 2005; Dữ liệu huấn luyện: 2004-2005 và dữ liệu thử nghiệm: 2006;

…và những thứ tương tự…

Cuối cùng, kết quả thử nghiệm của các năm 2002, 2003, 2004, 2005, 2006 …) được thống kê để đánh giá tổng hợp hiệu suất của chiến lược.

Nguyên tắc kiểm tra trục xuất có thể được giải thích trực quan như trong hình dưới đây:

Dữ liệu lớn thực tế

Hình trên cho thấy hai phương pháp khác nhau để kiểm tra theo trục xuất.

Loại thứ nhất: Mỗi lần kiểm tra, dữ liệu kiểm tra ngắn hơn, số lần kiểm tra nhiều hơn. Loại thứ hai: Mỗi lần kiểm tra, dữ liệu kiểm tra dài hơn, số lần kiểm tra ít hơn.

Trong ứng dụng thực tế, có thể thử nghiệm nhiều lần bằng cách thay đổi độ dài của dữ liệu thử nghiệm để đánh giá tính ổn định của mô hình đối với dữ liệu không ổn định.

  • #### NO:04

Nguyên tắc cơ bản của kiểm tra chéo: chia toàn bộ dữ liệu thành N phần, mỗi lần sử dụng N-1 phần trong số đó để đào tạo và sử dụng phần còn lại để kiểm tra.

Dữ liệu lớn thực tế

Hãy chia các năm 2000-2003 thành 4 phần. Quá trình kiểm tra chéo là như sau: Dữ liệu đào tạo: 2001-2003, dữ liệu thử nghiệm: 2000; Dữ liệu huấn luyện: 2000-2002, dữ liệu thử nghiệm: 2003 Dữ liệu huấn luyện: 2000, 2001, 2003, dữ liệu thử nghiệm: 2002; Dữ liệu huấn luyện: 2000, 2002, 2003, dữ liệu thử nghiệm: 2001;

Dữ liệu lớn thực tế

Như hình trên: ưu điểm lớn nhất của kiểm tra chéo là tận dụng đầy đủ dữ liệu giới hạn, mỗi dữ liệu đào tạo cũng là dữ liệu thử nghiệm. Tuy nhiên, có những nhược điểm rõ ràng khi kiểm tra chéo được áp dụng cho kiểm tra mô hình chiến lược:

Khi dữ liệu giá không ổn định, kết quả kiểm tra mô hình thường không đáng tin cậy. Ví dụ, sử dụng dữ liệu năm 2008 để đào tạo, thử nghiệm với dữ liệu năm 2005. Rất có thể môi trường thị trường năm 2008 đã thay đổi rất nhiều so với năm 2005, do đó kết quả kiểm tra mô hình không đáng tin cậy.

2, tương tự như điều 1, trong kiểm tra chéo, nếu sử dụng mô hình đào tạo dữ liệu mới nhất và mô hình thử nghiệm dữ liệu cũ hơn, điều này không hợp lý.

  • #### NO:05

Ngoài ra, khi kiểm tra mô hình chiến lược đối số hóa, cả kiểm tra trục xuất và kiểm tra chéo đều gặp phải vấn đề chồng chéo dữ liệu.

Dữ liệu lớn thực tế

Trong khi phát triển mô hình chiến lược giao dịch, hầu hết các chỉ số kỹ thuật đều dựa trên dữ liệu lịch sử có độ dài nhất định. Ví dụ: sử dụng chỉ số xu hướng, tính toán dữ liệu lịch sử trong 50 ngày qua, và vào ngày giao dịch tiếp theo, chỉ số này được tính toán từ 50 ngày trước ngày giao dịch, sau đó tính toán dữ liệu của cả hai chỉ số là giống nhau trong 49 ngày, điều này sẽ dẫn đến sự thay đổi không rõ ràng của chỉ số mỗi hai ngày liền kề.

Dữ liệu lớn thực tế

Dữ liệu chồng lên nhau có thể gây ra các tác động sau:

1 , Sự thay đổi chậm trong kết quả dự đoán của mô hình dẫn đến sự thay đổi chậm trong giữ vị thế, đó là sự chậm trễ của chỉ số mà chúng ta thường nói.

  1. Một số giá trị thống kê không có trong kiểm tra kết quả mô hình, do liên quan đến chuỗi dẫn đến dữ liệu lặp lại, khiến một số kết quả kiểm tra thống kê không đáng tin cậy.
  • #### NO:06

Chiến lược giao dịch tốt sẽ có thể có lợi nhuận trong tương lai. Thử nghiệm ngoài mẫu, ngoài việc có thể phát hiện khách quan chiến lược giao dịch, có thể tiết kiệm thời gian khách hàng một cách hiệu quả hơn.

Trong hầu hết các trường hợp, việc sử dụng trực tiếp các tham số tối ưu của toàn bộ mẫu là rất nguy hiểm.

Nếu tất cả dữ liệu lịch sử trước thời điểm tối ưu hóa tham số được phân biệt, phân chia thành dữ liệu trong mẫu và dữ liệu ngoài mẫu, trước tiên sử dụng dữ liệu trong mẫu để tối ưu hóa tham số, sau đó sử dụng dữ liệu ngoài mẫu để thử nghiệm ngoài mẫu, thì có thể loại bỏ lỗi này, đồng thời có thể kiểm tra xem chiến lược tối ưu hóa có phù hợp với thị trường trong tương lai hay không.

  • #### NO:07

Cũng giống như giao dịch, chúng ta không bao giờ có thể vượt qua thời gian để đưa ra một quyết định đúng đắn cho chính mình mà không có một sai lầm nào. Nếu có bàn tay của Thiên Chúa hoặc khả năng vượt qua từ tương lai trở lại, thì không cần kiểm tra, giao dịch trực tiếp trực tuyến cũng có thể tràn ngập. Và những người như tôi phải kiểm tra chiến lược của chúng tôi trong dữ liệu lịch sử.

Tuy nhiên, ngay cả khi có lịch sử với dữ liệu khổng lồ, lịch sử dường như rất thiếu đối với tương lai vô tận và không thể dự đoán được. Vì vậy, hệ thống giao dịch dựa trên lịch sử từ dưới lên, cuối cùng sẽ bị chìm theo thời gian. Vì lịch sử không có tương lai vô hạn. Vì vậy, một hệ thống giao dịch đầy đủ và tích cực phải được hỗ trợ bởi các nguyên tắc / logic bên trong của nó.

Dữ liệu lớn thực tế

  • #### NO:08

Chúng tôi (người phát minh định lượng, nền tảng giao dịch định lượng) nhằm thay đổi vòng định lượng hiện tại không có hàng hóa khô cạn, giao tiếp đóng cửa, gian lận, tạo ra một vòng định lượng thuần khiết hơn. Trên thế giới này, không ai tạo ra kiến thức và lý thuyết, chúng chỉ tồn tại từ lâu và đang chờ chúng ta khám phá.

Dữ liệu lớn thực tế

Chia sẻ là một thái độ, và là sự khôn ngoan!

Khách sạn trực tuyến Tác giả Hukybo