Tài nguyên đang được tải lên... tải...

Làm thế nào để xác định các chiến lược giao dịch thuật toán

Tác giả:Tốt, Tạo: 2019-03-27 11:08:57, Cập nhật:

Trong bài viết này, tôi muốn giới thiệu với bạn về các phương pháp mà tôi tự xác định các chiến lược giao dịch thuật toán có lợi nhuận. Mục tiêu của chúng tôi hôm nay là hiểu chi tiết cách tìm, đánh giá và chọn các hệ thống như vậy. Tôi sẽ giải thích cách xác định các chiến lược là về sở thích cá nhân cũng như về hiệu suất chiến lược, làm thế nào để xác định loại và số lượng dữ liệu lịch sử để thử nghiệm, làm thế nào để đánh giá một chiến lược giao dịch một cách không có đam mê và cuối cùng là làm thế nào để tiến tới giai đoạn kiểm tra lại và thực hiện chiến lược.

Xác định sở thích cá nhân của riêng bạn về giao dịch

Để trở thành một nhà giao dịch thành công - dù là theo quyết định hoặc thuật toán - bạn cần phải tự hỏi mình một số câu hỏi trung thực.

Tôi sẽ nói rằng sự xem xét quan trọng nhất trong giao dịch là nhận thức được tính cách của riêng bạn. Giao dịch, và giao dịch thuật toán đặc biệt, đòi hỏi một mức độ kỷ luật, kiên nhẫn và tách rời về cảm xúc đáng kể. Vì bạn đang để cho một thuật toán thực hiện giao dịch của bạn cho bạn, cần phải có quyết tâm không can thiệp vào chiến lược khi nó đang được thực hiện. Điều này có thể cực kỳ khó khăn, đặc biệt là trong thời gian rút tiền kéo dài. Tuy nhiên, nhiều chiến lược đã được chứng minh là rất có lợi nhuận trong một bài kiểm tra hậu quả có thể bị hủy hoại bởi sự can thiệp đơn giản. Hiểu rằng nếu bạn muốn bước vào thế giới giao dịch thuật toán bạn sẽ được kiểm tra về mặt cảm xúc và để thành công, bạn cần phải vượt qua những khó khăn này!

Những câu hỏi này sẽ giúp xác định tần suất của chiến lược mà bạn nên tìm kiếm. Đối với những người trong số bạn có việc làm toàn thời gian, một chiến lược tương lai trong ngày có thể không phù hợp (ít nhất là cho đến khi nó được tự động hóa hoàn toàn!). Những hạn chế thời gian của bạn cũng sẽ quyết định phương pháp của chiến lược. Nếu chiến lược của bạn thường xuyên giao dịch và phụ thuộc vào nguồn cấp tin đắt tiền (như một đầu cuối Bloomberg), bạn rõ ràng sẽ phải thực tế về khả năng của mình để chạy thành công trong khi ở văn phòng! Đối với những người trong số bạn có nhiều thời gian hoặc các kỹ năng để tự động hóa chiến lược của mình, bạn có thể muốn xem xét một chiến lược giao dịch tần suất cao (HFT) kỹ thuật hơn.

Tôi tin rằng cần phải tiến hành nghiên cứu liên tục về các chiến lược giao dịch của bạn để duy trì danh mục đầu tư có lợi nhuận nhất quán. Rất ít chiến lược ở lại dưới radar mãi mãi. Do đó, một phần đáng kể thời gian dành cho giao dịch sẽ được thực hiện nghiên cứu liên tục. Hãy tự hỏi mình liệu bạn có sẵn sàng làm điều này hay không, vì nó có thể là sự khác biệt giữa lợi nhuận mạnh hoặc giảm chậm hướng tới tổn thất.

Bạn cũng cần xem xét vốn giao dịch của mình. Số tiền tối thiểu được chấp nhận chung cho một chiến lược định lượng là 50.000 USD (khoảng 35.000 bảng Anh cho chúng tôi ở Anh). Nếu tôi bắt đầu lại, tôi sẽ bắt đầu với số tiền lớn hơn, có lẽ gần 100.000 USD (khoảng 70.000 bảng Anh). Điều này là do chi phí giao dịch có thể cực kỳ đắt cho các chiến lược tần suất trung bình đến cao và cần phải có đủ vốn để hấp thụ chúng trong thời gian rút tiền. Nếu bạn đang xem xét bắt đầu với ít hơn 10.000 USD thì bạn sẽ cần phải hạn chế bản thân với các chiến lược tần suất thấp, giao dịch trong một hoặc hai tài sản, vì chi phí giao dịch sẽ nhanh chóng ăn vào lợi nhuận của bạn.

Kỹ năng lập trình là một yếu tố quan trọng trong việc tạo ra một chiến lược giao dịch thuật toán tự động. Có kiến thức về một ngôn ngữ lập trình như C ++, Java, C #, Python hoặc R sẽ cho phép bạn tự tạo ra bộ lưu trữ dữ liệu đầu cuối, công cụ kiểm tra lại và hệ thống thực thi. Điều này có một số lợi thế, chủ yếu là khả năng hoàn toàn nhận thức được tất cả các khía cạnh của cơ sở hạ tầng giao dịch. Nó cũng cho phép bạn khám phá các chiến lược tần số cao hơn vì bạn sẽ có toàn quyền kiểm soát đống công nghệ của mình. Mặc dù điều này có nghĩa là bạn có thể kiểm tra phần mềm của riêng bạn và loại bỏ lỗi, nhưng nó cũng có nghĩa là bạn sẽ dành nhiều thời gian hơn để mã hóa cơ sở hạ tầng và ít hơn để thực hiện các chiến lược, ít nhất là trong phần đầu của sự nghiệp giao dịch của mình. Bạn có thể thấy rằng bạn thoải mái giao dịch trong Excel hoặc MATLAB và có thể thuê ngoài phát triển các thành phần khác. Tuy nhiên, tôi sẽ không khuyên bạn nên làm điều này, đặc biệt cho những người ở tần số cao.

Bạn cần tự hỏi mình bạn hy vọng đạt được gì bằng giao dịch thuật toán. Bạn có quan tâm đến thu nhập thường xuyên, nhờ đó bạn hy vọng thu lợi nhuận từ tài khoản giao dịch của mình? Hoặc, bạn có quan tâm đến lợi nhuận vốn dài hạn và có thể giao dịch mà không cần rút tiền? Sự phụ thuộc thu nhập sẽ quyết định tần suất của chiến lược của bạn. Việc rút thu nhập thường xuyên hơn sẽ yêu cầu một chiến lược giao dịch tần suất cao hơn với sự biến động ít hơn (tức là tỷ lệ Sharpe cao hơn).

Cuối cùng, đừng bị lừa bởi khái niệm trở nên cực kỳ giàu có trong một khoảng thời gian ngắn! Giao dịch Algo không phải là một kế hoạch giàu có nhanh chóng - nếu có gì thì nó có thể là một kế hoạch nghèo đói nhanh chóng.

Nguồn cung cấp ý tưởng giao dịch thuật toán

Mặc dù nhận thức phổ biến ngược lại, thực tế là khá đơn giản để xác định vị trí các chiến lược giao dịch có lợi nhuận trong phạm vi công cộng. Không bao giờ có ý tưởng giao dịch dễ dàng hơn so với ngày nay. Tạp chí tài chính học thuật, máy chủ in trước, blog giao dịch, diễn đàn giao dịch, tạp chí giao dịch hàng tuần và các văn bản chuyên môn cung cấp hàng ngàn chiến lược giao dịch để dựa vào ý tưởng của bạn.

Mục tiêu của chúng tôi là thiết lập một đường ống chiến lược sẽ cung cấp cho chúng tôi một luồng các ý tưởng giao dịch đang diễn ra. Lý tưởng nhất là chúng tôi muốn tạo ra một cách tiếp cận có phương pháp để tìm kiếm, đánh giá và thực hiện các chiến lược mà chúng tôi gặp phải. Mục tiêu của đường ống là tạo ra một lượng phù hợp của các ý tưởng mới và cung cấp cho chúng tôi một khuôn khổ để từ chối phần lớn các ý tưởng này với tối thiểu sự xem xét cảm xúc.

Chúng ta phải cực kỳ cẩn thận để không để những thành kiến nhận thức ảnh hưởng đến phương pháp ra quyết định của chúng ta. Điều này có thể đơn giản như có sự ưa thích cho một loại tài sản hơn một loại khác (vàng và các kim loại quý khác xuất hiện trong tâm trí) bởi vì chúng được coi là kỳ lạ hơn. Mục tiêu của chúng ta luôn luôn là tìm kiếm các chiến lược có lợi nhuận nhất quán, với kỳ vọng tích cực. Việc lựa chọn loại tài sản nên dựa trên các cân nhắc khác, chẳng hạn như hạn chế vốn giao dịch, phí môi giới và khả năng đòn bẩy.

Nếu bạn hoàn toàn không quen thuộc với khái niệm chiến lược giao dịch thì nơi đầu tiên để tìm kiếm là trong các sách giáo khoa đã được thành lập. Các văn bản cổ điển cung cấp một loạt các ý tưởng đơn giản, đơn giản hơn, để làm quen với giao dịch định lượng. Dưới đây là một lựa chọn mà tôi khuyên bạn nên dành cho những người mới bắt đầu giao dịch định lượng, dần dần trở nên tinh vi hơn khi bạn làm việc qua danh sách:

  • Giao dịch định lượng: Làm thế nào để xây dựng doanh nghiệp giao dịch thuật toán của riêng bạn (Wiley Trading) - Ernest Chan
  • Giao dịch thuật toán và DMA: Giới thiệu về các chiến lược giao dịch truy cập trực tiếp - Barry Johnson
  • Tùy chọn biến động & Giá: Chiến lược và kỹ thuật giao dịch tiên tiến - Sheldon Natenberg
  • Giao dịch biến động - Euan Sinclair
  • Thương mại và trao đổi: Cơ cấu vi mô thị trường cho các học viên - Larry Harris

Để có danh sách dài hơn về sách giao dịch định lượng, vui lòng truy cập danh sách đọc QuantStart.

Nơi tiếp theo để tìm các chiến lược phức tạp hơn là trên các diễn đàn giao dịch và blog giao dịch. Tuy nhiên, một lưu ý thận trọng: Nhiều blog giao dịch dựa trên khái niệm phân tích kỹ thuật. Phân tích kỹ thuật liên quan đến việc sử dụng các chỉ số cơ bản và tâm lý học hành vi để xác định xu hướng hoặc mô hình đảo ngược giá tài sản.

Mặc dù cực kỳ phổ biến trong không gian giao dịch nói chung, phân tích kỹ thuật được coi là không hiệu quả trong cộng đồng tài chính định lượng. Một số người đã đề xuất rằng nó không tốt hơn so với việc đọc bách sinh vật hoặc nghiên cứu lá trà về sức mạnh dự đoán của nó! Trong thực tế, có những cá nhân thành công sử dụng phân tích kỹ thuật. Tuy nhiên, với một hộp công cụ toán học và thống kê phức tạp hơn, chúng ta có thể dễ dàng đánh giá hiệu quả của các chiến lược dựa trên TA và đưa ra quyết định dựa trên dữ liệu thay vì dựa trên những cân nhắc hoặc quan niệm trước.

Dưới đây là danh sách các blog và diễn đàn giao dịch thuật toán được tôn trọng:

  • Cả đường phố
  • Số lượng
  • Thương mại định lượng (Ernest Chan)
  • Quantopian
  • Quantpedia
  • Trụ sở ETF
  • Quant.ly
  • Diễn đàn thương nhân ưu tú
  • Phòng thí nghiệm tài sản
  • Tài chính hạt nhân
  • Diễn đàn Wilmott

Một khi bạn đã có một số kinh nghiệm trong việc đánh giá các chiến lược đơn giản hơn, đã đến lúc xem xét các dịch vụ học thuật phức tạp hơn. Một số tạp chí học thuật sẽ khó truy cập, không có đăng ký cao hoặc chi phí một lần. Nếu bạn là thành viên hoặc cựu sinh viên của một trường đại học, bạn nên có thể truy cập một số tạp chí tài chính này. Nếu không, bạn có thể xem các máy chủ in trước, đó là kho lưu trữ internet của các bản thảo cuối cùng của các bài báo học thuật đang được đánh giá bằng các đồng nghiệp. Vì chúng tôi chỉ quan tâm đến các chiến lược mà chúng tôi có thể sao chép thành công, kiểm tra lại và có lợi nhuận, đánh giá bằng các đồng nghiệp ít quan trọng hơn đối với chúng tôi.

Nhược điểm chính của các chiến lược học thuật là chúng thường có thể lỗi thời, yêu cầu dữ liệu lịch sử khó hiểu và đắt tiền, giao dịch trong các lớp tài sản không thanh khoản hoặc không tính đến phí, trượt hoặc chênh lệch. Nó cũng có thể không rõ liệu chiến lược giao dịch có được thực hiện với lệnh thị trường, lệnh giới hạn hoặc liệu nó có chứa dừng lỗ v.v. Do đó, điều tuyệt đối cần thiết là bạn tự nhân rộng chiến lược càng tốt càng tốt, kiểm tra lại và thêm chi phí giao dịch thực tế bao gồm nhiều khía cạnh của các lớp tài sản mà bạn muốn giao dịch.

Dưới đây là danh sách các máy chủ in trước phổ biến hơn và các tạp chí tài chính mà bạn có thể lấy ý tưởng từ:

  • arXiv
  • SSRN
  • Tạp chí chiến lược đầu tư
  • Tạp chí Tài chính tính toán
  • Tài chính toán học

Điều gì về việc hình thành các chiến lược định lượng của riêng bạn?

  • Cơ cấu vi mô thị trường - Đặc biệt đối với các chiến lược tần số cao hơn, người ta có thể sử dụng cơ cấu vi mô thị trường, tức là hiểu về động lực sổ đơn đặt hàng để tạo ra lợi nhuận. Các thị trường khác nhau sẽ có các giới hạn công nghệ, quy định, người tham gia thị trường và hạn chế khác nhau, tất cả đều có thể khai thác thông qua các chiến lược cụ thể. Đây là một lĩnh vực rất phức tạp và các nhà thực hành bán lẻ sẽ khó có thể cạnh tranh trong không gian này, đặc biệt là khi cạnh tranh bao gồm các quỹ phòng hộ định lượng lớn, vốn hóa tốt với khả năng công nghệ mạnh mẽ.
  • Cấu trúc quỹ - Các quỹ đầu tư tập hợp, chẳng hạn như quỹ hưu trí, đối tác đầu tư tư nhân (quỹ phòng hộ), cố vấn giao dịch hàng hóa và quỹ tương hỗ bị hạn chế bởi cả quy định nặng nề và dự trữ vốn lớn của họ. Do đó, một số hành vi nhất quán có thể được khai thác với những người linh hoạt hơn. Ví dụ, các quỹ lớn bị hạn chế về khả năng do kích thước của chúng. Do đó, nếu họ cần nhanh chóng dỡ bỏ (bán) một lượng chứng khoán, họ sẽ phải phân tán nó để tránh "chuyển thị thị trường". Các thuật toán tinh vi có thể tận dụng điều này và các đặc điểm khác trong một quá trình chung được gọi là điều chỉnh cấu trúc quỹ.
  • Học máy / trí tuệ nhân tạo - Các thuật toán học máy đã trở nên phổ biến hơn trong những năm gần đây trên thị trường tài chính. Các bộ phân loại (như Naive-Bayes, et al.) các bộ khớp chức năng phi tuyến tính (mạng thần kinh) và các thói quen tối ưu hóa (định thuật di truyền) đều được sử dụng để dự đoán đường dẫn tài sản hoặc tối ưu hóa các chiến lược giao dịch. Nếu bạn có nền tảng trong lĩnh vực này, bạn có thể có một số hiểu biết về cách áp dụng các thuật toán cụ thể cho một số thị trường nhất định.

Tất nhiên, có nhiều lĩnh vực khác để nghiên cứu. Chúng tôi sẽ thảo luận chi tiết về cách đưa ra các chiến lược tùy chỉnh trong một bài viết sau.

Bằng cách tiếp tục theo dõi các nguồn này hàng tuần, hoặc thậm chí hàng ngày, bạn đang thiết lập bản thân để nhận được một danh sách phù hợp của các chiến lược từ một loạt các nguồn khác nhau.

Đánh giá các chiến lược giao dịch

Điều đầu tiên, và có lẽ là quan điểm rõ ràng nhất là bạn có thực sự hiểu được chiến lược hay không. Bạn có thể giải thích chiến lược một cách ngắn gọn hay nó đòi hỏi một chuỗi các cảnh báo và danh sách tham số vô tận? Ngoài ra, chiến lược có cơ sở tốt, vững chắc trong thực tế không? Ví dụ, bạn có thể chỉ ra một số lý do hành vi hoặc hạn chế cấu trúc quỹ có thể gây ra các mô hình bạn đang cố gắng khai thác không? Liệu hạn chế này có chịu được sự thay đổi chế độ, chẳng hạn như một sự gián đoạn môi trường quy định đáng kể không? Chiến lược có dựa trên các quy tắc thống kê hoặc toán học phức tạp không? Nó có áp dụng cho bất kỳ chuỗi thời gian tài chính nào hay nó cụ thể đối với lớp tài sản mà nó được tuyên bố có lợi nhuận không? Bạn nên liên tục suy nghĩ về các yếu tố này khi đánh giá các phương pháp giao dịch mới, nếu không bạn có thể lãng phí một lượng lớn thời gian để thử nghiệm và tối ưu hóa các chiến lược không có lợi nhuận.

Một khi bạn đã xác định rằng bạn hiểu các nguyên tắc cơ bản của chiến lược, bạn cần quyết định liệu nó có phù hợp với hồ sơ tính cách của mình như đã đề cập ở trên hay không. Đây không phải là một cân nhắc mơ hồ như nghe có vẻ! Các chiến lược sẽ khác nhau đáng kể về đặc điểm hiệu suất của chúng. Có một số loại tính cách có thể xử lý các giai đoạn giảm đáng kể hơn, hoặc sẵn sàng chấp nhận rủi ro lớn hơn để có lợi nhuận lớn hơn. Mặc dù thực tế là chúng ta, với tư cách là số lượng, cố gắng loại bỏ càng nhiều thiên vị nhận thức càng tốt và nên có thể đánh giá một chiến lược một cách không có đam mê, thiên vị sẽ luôn lướt vào. Do đó chúng ta cần một phương tiện nhất quán, không cảm xúc để đánh giá hiệu suất của các chiến lược. Dưới đây là danh sách các tiêu chí mà tôi đánh giá một chiến lược tiềm năng mới theo:

  • Phương pháp - Chiến lược dựa trên động lực, đảo ngược trung bình, trung lập với thị trường, định hướng? Chiến lược dựa trên các kỹ thuật thống kê hoặc máy học phức tạp (hoặc phức tạp!) khó hiểu và đòi hỏi bằng tiến sĩ thống kê để nắm bắt? Những kỹ thuật này có giới thiệu một lượng lớn các thông số, có thể dẫn đến thiên vị tối ưu hóa? Chiến lược có khả năng chịu được sự thay đổi chế độ (tức là quy định mới tiềm năng của thị trường tài chính)?
  • Tỷ lệ Sharpe - Tỷ lệ Sharpe mô tả theo phương pháp tính toán tỷ lệ phần thưởng/rủi ro của chiến lược. Nó định lượng mức độ lợi nhuận bạn có thể đạt được cho mức độ biến động mà đường cong vốn chủ sở hữu chịu đựng.
  • Đòn bẩy - Liệu chiến lược có cần đòn bẩy đáng kể để có lợi nhuận? Liệu chiến lược có yêu cầu sử dụng các hợp đồng phái sinh đòn bẩy (tương lai, quyền chọn, trao đổi) để có lợi nhuận? Các hợp đồng đòn bẩy này có thể có đặc điểm biến động cao và do đó có thể dễ dàng dẫn đến các cuộc gọi ký quỹ. Bạn có vốn giao dịch và tính khí cho sự biến động như vậy?
  • Tần số - Tần số của chiến lược được liên kết chặt chẽ với bộ sưu tập công nghệ của bạn (và do đó chuyên môn công nghệ), tỷ lệ Sharpe và mức chi phí giao dịch tổng thể. Tất cả các vấn đề khác được xem xét, các chiến lược tần số cao hơn đòi hỏi nhiều vốn hơn, phức tạp hơn và khó thực hiện hơn. Tuy nhiên, giả sử công cụ backtesting của bạn phức tạp và không có lỗi, chúng thường sẽ có tỷ lệ Sharpe cao hơn nhiều.
  • Sự biến động - Sự biến động có liên quan chặt chẽ đến rủi ro của chiến lược. Tỷ lệ Sharpe đặc trưng cho điều này. Sự biến động cao hơn của các loại tài sản cơ bản, nếu không được bảo hiểm, thường dẫn đến biến động cao hơn trong đường cong vốn chủ sở hữu và do đó tỷ lệ Sharpe nhỏ hơn.
  • Win/Loss, Average Profit/Loss - Các chiến lược sẽ khác nhau về đặc điểm win/loss và profit/loss trung bình của chúng. Người ta có thể có một chiến lược rất có lợi, ngay cả khi số lượng giao dịch thua lỗ vượt quá số lượng giao dịch thắng. Các chiến lược động lực có xu hướng có mô hình này vì chúng dựa vào một số lượng nhỏ trúng lớn để có lợi nhuận. Các chiến lược đảo ngược trung bình có xu hướng có hồ sơ đối lập nơi nhiều giao dịch là thắng, nhưng các giao dịch thua lỗ có thể khá nghiêm trọng.
  • Maximum Drawdown - Mức rút tối đa là tỷ lệ giảm lớn nhất từ đỉnh đến đáy trên đường cong vốn cổ phần của chiến lược. Các chiến lược động lực được biết đến là bị các giai đoạn rút kéo dài (do một chuỗi nhiều giao dịch thua lỗ gia tăng). Nhiều nhà giao dịch sẽ bỏ cuộc trong các giai đoạn rút kéo dài, ngay cả khi thử nghiệm lịch sử đã gợi ý đây là "kinh doanh như thường lệ" cho chiến lược. Bạn sẽ cần xác định tỷ lệ phần trăm rút (và trong khoảng thời gian nào) bạn có thể chấp nhận trước khi ngừng giao dịch chiến lược của mình. Đây là một quyết định rất cá nhân và do đó phải được xem xét cẩn thận.
  • Capacity/Liquidity - Ở cấp độ bán lẻ, trừ khi bạn đang giao dịch trong một công cụ không thanh khoản cao (như cổ phiếu vốn nhỏ), bạn sẽ không phải lo lắng nhiều về khả năng chiến lược. Capacity quyết định khả năng mở rộng của chiến lược để tiếp tục vốn. Nhiều quỹ phòng hộ lớn hơn phải chịu các vấn đề về khả năng đáng kể khi các chiến lược của họ tăng phân bổ vốn.
  • Các tham số - Một số chiến lược (đặc biệt là những chiến lược được tìm thấy trong cộng đồng học máy) đòi hỏi một lượng lớn các tham số. Mỗi tham số bổ sung mà một chiến lược đòi hỏi làm cho nó dễ bị thiên vị tối ưu hóa hơn (còn được gọi là curve-fitting). Bạn nên cố gắng nhắm mục tiêu các chiến lược với ít tham số nhất có thể hoặc đảm bảo bạn có đủ số lượng dữ liệu để kiểm tra chiến lược của mình.
  • Benchmark - Hầu như tất cả các chiến lược (trừ khi được đặc trưng là hoàn toàn lợi nhuận) được đo so với một số điểm chuẩn hiệu suất. Điểm chuẩn thường là một chỉ số đặc trưng cho một mẫu lớn của lớp tài sản cơ bản mà chiến lược giao dịch. Nếu chiến lược giao dịch cổ phiếu Mỹ vốn hóa lớn, sau đó S & P500 sẽ là một điểm chuẩn tự nhiên để đo chiến lược của bạn. Bạn sẽ nghe các thuật ngữ alpha beta, áp dụng cho các chiến lược của loại này. Chúng tôi sẽ thảo luận chi tiết về các hệ số này trong các bài viết sau.

Lưu ý rằng chúng tôi đã không thảo luận về lợi nhuận thực tế của chiến lược. Tại sao lại như vậy? Nhìn riêng biệt, lợi nhuận thực sự cung cấp cho chúng ta thông tin hạn chế về hiệu quả của chiến lược. Chúng không cung cấp cho bạn cái nhìn sâu sắc về đòn bẩy, biến động, chuẩn mực hoặc yêu cầu vốn. Do đó, các chiến lược hiếm khi được đánh giá chỉ dựa trên lợi nhuận của chúng. Luôn luôn xem xét các thuộc tính rủi ro của một chiến lược trước khi xem xét lợi nhuận.

Ở giai đoạn này, nhiều chiến lược được tìm thấy từ đường ống của bạn sẽ bị từ chối ngay lập tức, vì chúng sẽ không đáp ứng yêu cầu vốn, hạn chế đòn bẩy, dung nạp tối đa hoặc ưu tiên biến động của bạn. Các chiến lược còn lại có thể được xem xét để kiểm tra lại. Tuy nhiên, trước khi điều này có thể, cần phải xem xét một tiêu chí từ chối cuối cùng - đó là dữ liệu lịch sử có sẵn để kiểm tra các chiến lược này.

Thu thập dữ liệu lịch sử

Ngày nay, phạm vi các yêu cầu kỹ thuật trên các lớp tài sản để lưu trữ dữ liệu lịch sử là đáng kể. Để duy trì tính cạnh tranh, cả bên mua (quỹ) và bên bán (các ngân hàng đầu tư) đều đầu tư mạnh vào cơ sở hạ tầng kỹ thuật của họ. Điều bắt buộc là phải xem xét tầm quan trọng của nó. Đặc biệt, chúng tôi quan tâm đến các yêu cầu kịp thời, chính xác và lưu trữ. Bây giờ tôi sẽ phác thảo các nguyên tắc cơ bản để có được dữ liệu lịch sử và cách lưu trữ nó. Thật không may đây là một chủ đề rất sâu sắc và kỹ thuật, vì vậy tôi sẽ không thể nói tất cả mọi thứ trong bài viết này. Tuy nhiên, tôi sẽ viết nhiều hơn về điều này trong tương lai vì kinh nghiệm trước đây của tôi trong ngành công nghiệp tài chính chủ yếu liên quan đến việc mua lại, lưu trữ và truy cập dữ liệu tài chính.

Trong phần trước, chúng tôi đã thiết lập một đường ống chiến lược cho phép chúng tôi từ chối một số chiến lược dựa trên tiêu chí từ chối cá nhân của riêng chúng tôi. Trong phần này, chúng tôi sẽ lọc nhiều chiến lược dựa trên sở thích của riêng chúng tôi để có được dữ liệu lịch sử. Các cân nhắc chính (đặc biệt là ở cấp độ thực hành bán lẻ) là chi phí dữ liệu, yêu cầu lưu trữ và trình độ chuyên môn kỹ thuật của bạn. Chúng tôi cũng cần thảo luận về các loại dữ liệu có sẵn khác nhau và các cân nhắc khác nhau mà mỗi loại dữ liệu sẽ áp đặt lên chúng tôi.

Chúng ta hãy bắt đầu bằng cách thảo luận về các loại dữ liệu có sẵn và các vấn đề chính chúng ta sẽ cần phải suy nghĩ:

  • Dữ liệu cơ bản - Nó bao gồm dữ liệu về xu hướng kinh tế vĩ mô, chẳng hạn như lãi suất, số liệu lạm phát, hành động của công ty (phần cổ tức, chia cổ phiếu), hồ sơ SEC, tài khoản công ty, số liệu thu nhập, báo cáo cây trồng, dữ liệu khí tượng vv. Dữ liệu này thường được sử dụng để định giá các công ty hoặc tài sản khác trên cơ sở cơ bản, tức là thông qua một số phương tiện dự kiến dòng tiền trong tương lai. Nó không bao gồm các chuỗi giá cổ phiếu. Một số dữ liệu cơ bản có sẵn miễn phí từ các trang web của chính phủ. Dữ liệu cơ bản lịch sử dài hạn khác có thể cực kỳ tốn kém. Yêu cầu lưu trữ thường không đặc biệt lớn, trừ khi hàng ngàn công ty đang được nghiên cứu cùng một lúc.
  • Dữ liệu tin tức - Dữ liệu tin tức thường có tính chất chất. Nó bao gồm các bài viết, bài đăng trên blog, bài đăng trên microblog (tweets) và biên tập. Các kỹ thuật học máy như phân loại thường được sử dụng để giải thích tình cảm. Dữ liệu này cũng thường có sẵn miễn phí hoặc rẻ, thông qua đăng ký cho các phương tiện truyền thông.
  • Dữ liệu giá tài sản - Đây là lĩnh vực dữ liệu truyền thống của số lượng. Nó bao gồm các chuỗi thời gian giá tài sản. Cổ phiếu, sản phẩm thu nhập cố định, hàng hóa và giá ngoại hối đều nằm trong lớp này. Dữ liệu lịch sử hàng ngày thường dễ dàng để có được cho các lớp tài sản đơn giản hơn, chẳng hạn như cổ phiếu. Tuy nhiên, một khi tính chính xác và sạch sẽ được bao gồm và các khuynh hướng thống kê được loại bỏ, dữ liệu có thể trở nên đắt tiền. Ngoài ra, dữ liệu chuỗi thời gian thường có yêu cầu lưu trữ đáng kể đặc biệt là khi xem xét dữ liệu trong ngày.
  • Các công cụ tài chính - Chứng khoán, trái phiếu, hợp đồng tương lai và các tùy chọn phái sinh kỳ lạ hơn có các đặc điểm và tham số rất khác nhau. Do đó, không có cấu trúc cơ sở dữ liệu "một kích thước phù hợp với tất cả" có thể chứa chúng. Cần chú ý đáng kể đến việc thiết kế và thực hiện các cấu trúc cơ sở dữ liệu cho các công cụ tài chính khác nhau. Chúng tôi sẽ thảo luận về tình hình này một cách chi tiết khi chúng ta xây dựng cơ sở dữ liệu chính về chứng khoán trong các bài viết trong tương lai.
  • Tần số - Tần số dữ liệu càng cao, chi phí và yêu cầu lưu trữ càng lớn. Đối với các chiến lược tần số thấp, dữ liệu hàng ngày thường là đủ. Đối với các chiến lược tần số cao, có thể cần phải có dữ liệu cấp độ và thậm chí là bản sao lịch sử của dữ liệu sổ đơn đặt hàng giao dịch cụ thể. Thực hiện một công cụ lưu trữ cho loại dữ liệu này rất tốn kém về công nghệ và chỉ phù hợp với những người có nền tảng lập trình / kỹ thuật mạnh.
  • Các chỉ số chuẩn - Các chiến lược được mô tả ở trên thường được so sánh với một chỉ số chuẩn. Điều này thường biểu hiện như một chuỗi thời gian tài chính bổ sung. Đối với cổ phiếu, đây thường là một chỉ số chuẩn cổ phiếu quốc gia, chẳng hạn như chỉ số S & P500 (Mỹ) hoặc FTSE100 (Anh). Đối với một quỹ thu nhập cố định, nó hữu ích để so sánh với một giỏ trái phiếu hoặc các sản phẩm thu nhập cố định. tỷ lệ không rủi ro (tức là lãi suất thích hợp) cũng là một chỉ số chuẩn được chấp nhận rộng rãi. Tất cả các loại tài sản đều có một chỉ số chuẩn được ưa thích, vì vậy sẽ cần phải nghiên cứu dựa trên chiến lược cụ thể của bạn, nếu bạn muốn thu hút sự quan tâm đến chiến lược của mình từ bên ngoài.
  • Công nghệ - Các bộ đống công nghệ đằng sau một trung tâm lưu trữ dữ liệu tài chính rất phức tạp. Bài viết này chỉ có thể gãi bề mặt về những gì liên quan đến việc xây dựng một trung tâm. Tuy nhiên, nó tập trung vào một công cụ cơ sở dữ liệu, chẳng hạn như Hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS), chẳng hạn như MySQL, SQL Server, Oracle hoặc Công cụ lưu trữ tài liệu (tức là NoSQL). Điều này được truy cập thông qua mã ứng dụng logic kinh doanh truy vấn cơ sở dữ liệu và cung cấp quyền truy cập vào các công cụ bên ngoài, chẳng hạn như MATLAB, R hoặc Excel. Thông thường logic kinh doanh này được viết bằng C ++, C #, Java hoặc Python. Bạn cũng sẽ cần lưu trữ dữ liệu này ở đâu đó, hoặc trên máy tính cá nhân của riêng bạn, hoặc từ xa thông qua máy chủ internet. Các sản phẩm như Amazon Web Services đã làm cho điều này đơn giản và rẻ hơn trong những năm gần đây, nhưng nó vẫn sẽ yêu cầu chuyên môn kỹ thuật đáng kể để đạt được một cách mạnh mẽ.

Như bạn có thể thấy, một khi một chiến lược đã được xác định thông qua đường ống dẫn, nó sẽ cần thiết để đánh giá sự sẵn có, chi phí, sự phức tạp và chi tiết thực hiện của một bộ dữ liệu lịch sử cụ thể. Bạn có thể thấy cần thiết để từ chối một chiến lược chỉ dựa trên các cân nhắc dữ liệu lịch sử. Đây là một lĩnh vực lớn và các nhóm tiến sĩ làm việc với các quỹ lớn để đảm bảo định giá chính xác và kịp thời. Đừng đánh giá thấp những khó khăn của việc tạo ra một trung tâm dữ liệu mạnh mẽ cho mục đích backtesting của bạn!

Tuy nhiên, tôi muốn nói rằng nhiều nền tảng backtesting có thể cung cấp dữ liệu này cho bạn tự động - với một chi phí. Do đó, nó sẽ loại bỏ phần lớn các cơn đau thực hiện khỏi bạn, và bạn có thể tập trung hoàn toàn vào việc thực hiện và tối ưu hóa chiến lược. Các công cụ như TradeStation sở hữu khả năng này. Tuy nhiên, quan điểm cá nhân của tôi là thực hiện càng nhiều càng tốt nội bộ và tránh thuê ngoài các phần của ngăn xếp cho các nhà cung cấp phần mềm. Tôi thích các chiến lược tần số cao hơn do tỷ lệ Sharpe hấp dẫn hơn của chúng, nhưng chúng thường được kết hợp chặt chẽ với ngăn xếp công nghệ, nơi tối ưu hóa tiên tiến là rất quan trọng.

Bây giờ chúng ta đã thảo luận về các vấn đề xung quanh dữ liệu lịch sử, đã đến lúc bắt đầu thực hiện các chiến lược của chúng tôi trong một công cụ backtesting.


Thêm nữa