【參數.量化交易.投資有道】在量化交易策略的參數設計當中,通常其中一個參數作為訊號閥值,用以過濾較弱的訊號,控制策略的買賣頻率;另一個參數則用以去噪,把交易訊號變得平滑,讓策略可以待訊號趨勢變得明顯的時候才出手。
量化交易要留意參數設計
有做量化分析經驗的讀者在設計策略時,大多會發現一個現象,就是參數愈多,策略回溯測試的表現便愈好。這是正常的,因為參數愈多,就代表設計者加入愈多變數進策略中,那於優化過程中,策略便有更高自由度去顯示出更佳的表現。
純粹文字解釋可能較為抽象,相信舉些例子會讓讀者更清楚明白。
過度吻合為量化策略陷阱在沒任何條件下,價格升與跌的比例大致是一樣的,約為50:50。現在加入第一個條件:每月逢23號就沽空,博市場下跌。這時值博率相信仍是偏向50:50。
加入第二個條件:於6月才能沽空。由於坊間有傳「五窮六絕七翻身」,這時,值博率可能會高些。數據顯示,於過去至五年的6月24日沽空恒生指數的平均回報為135點,發現策略開始出現正回報。
此時,加入第三個條件:於2016年才沽空,即策略變為2016年6月24日沽空,這個策略回報便會飆升至602點。如此類推下去,不斷加入條件或變數,策略一定能變得更好。這便是一個非常明顯的過度吻合(Over-fitting)現象。因此,控制參數數目為非常重要的一環。
小心量化交易的陷阱
在建構策略的過程中,一定要避免墮入過度優化或過度吻合的陷阱。其中一個廣受量化分析師採用的方法叫作Walk forward analysis,即評估策略時採用的數據段,與優化過程中採用的數據段是分開的。
例如使用2014至2017年做回溯測試及參數優化,及後把策略及最佳參數,放於2018至2019年的數據測試。若發現兩個不同時間段測試的結果是相近的,那便能初步確認這個策略,沒有犯下過度優化的問題。
採樣數據的表現較佳
當然這個Walk forward analysis可以多做幾次,以增加可信性及統計顯著性,做法便是分為兩組以上的數據。例如使用2014至2015年數據優化後,把參數運用到2016年的數據;及後再使用2015至2016年數據優化,把參數運用到2017年,如此類推。若數次分析都發現策略於優化樣本以外的數據段(Out of sample data)都能保持表現的話,這便是一個好策略。
分析過程中,有一個現象很值得留意,就是若策略參數過多的話,通常優化樣本,或稱採樣數據(In sample data)的表現會極佳,但於樣本外數據的表現便會極差。情況就有如使用模擬資金測試時結果極佳,但使用真實資金炒賣時表現一蹶不振。
除因爲參數過多外,發生此情況亦有兩個可能:一,那並非一個有效能獲利的策略;二,於採樣數據中,所選擇的參數未能有效獲利。最好另外選擇一個表現穩定參數,再作測試。
免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。