【原】“因子流水線”的構(gòu)建邏輯

AI量化實(shí)驗(yàn)室 2024-08-18 發(fā)布于北京

展開全文

原創(chuàng)文章第623篇，專注“AI量化投資、世界運(yùn)行的規(guī)律、個(gè)人成長與財(cái)富自由"最新代碼已經(jīng)發(fā)布：

quantlab5.6代碼發(fā)布，重構(gòu)deap期貨截面多因子挖掘（附python代碼+全量期貨日線數(shù)據(jù)）

福特“流水線“式的因子工廠——可能的方向：

1、因子流水線：因子評價(jià)與篩選體系。

2、因子組合與機(jī)器學(xué)習(xí)。

3、遺傳算法及深度學(xué)習(xí)、大模型端對端挖因子。

4、止損與交易系統(tǒng)與實(shí)盤。

核心還是因子，因子本質(zhì)上是一個(gè)符號(hào)表達(dá)式，比如 ts_corr(open,log(volume))，表達(dá)“開盤價(jià)”與“對數(shù)成交額”之間的背離關(guān)系。

這個(gè)表達(dá)式是需要符合語法的，否則就沒辦法正常解析和計(jì)算。

生成表達(dá)式有幾種方式：

最常見的遺傳算法，它內(nèi)核有一棵語法樹，確保字段，參數(shù)，函數(shù)集都在預(yù)設(shè)的范圍內(nèi)。

其次是強(qiáng)化學(xué)習(xí)——一次生成一個(gè)token，token添加的時(shí)候，也會(huì)校驗(yàn)是否符合語法規(guī)則，如果規(guī)則不合適，reward就是-1，讓強(qiáng)化學(xué)習(xí)學(xué)習(xí)到規(guī)則。

def step(self, action: Token) -> Tuple[List[Token], float, bool, bool, dict]:
    if (isinstance(action, SequenceIndicatorToken) and
            action.indicator == SequenceIndicatorType.SEP):
        reward = self._evaluate()
        done = True
    elif len(self._tokens) < MAX_EXPR_LENGTH:
        self._tokens.append(action)
        self._builder.add_token(action)
        done = False
        reward = 0.0
    else:
        done = True
        reward = self._evaluate() if self._builder.is_valid() else -1.

    if math.isnan(reward):
        reward = 0.

    truncated = False  # Fk gymnasium
    return self._tokens, reward, done, truncated, self._valid_action_types()