设为首页 | 加入收藏 | 今天是2024年11月16日 星期六

聚合智慧 | 升华财富
产业智库服务平台

七禾网首页 >> 产业&金融精选

因子投资在期货CTA程序化模型中的应用浅谈

最新高手视频! 七禾网 时间:2019-11-11 18:16:51 来源:七禾网

大部分交易者,尤其是期货交易者,经过长期手工交易后发现价格某种规律,相信很多人都会尝试使用程序化方法来总结规律,并编写成自动或半自动CTA模型。再经过长时间积累后,大部分交易者拥有了很多信号模型,自然想到了组合和管理这些模型。


这就是本文的主题,顺应从信号模型到因子模型的行业趋势,聊聊期货CTA模型中的因子投资。


因子的本质就是信号模型的再次演化,让我们可以更好的评估模型绩效,评估信号产生后的收益情况,以及观察收益衰减情况。


什么是因子?


因子(factor,也可以称为要素)的本质是一个现象产生后,对于下周期收益率有关系,该现象既可称之为因子。如果能够持续检测到某种相关性,我们认为该因子对于下阶段收益率有预测能力,是一个有价值,可以入库或者实盘使用的因子。



虽然“预测”二字在很多时候显得非常牵强,毕竟收益的检测使用了相关系数(Correlation,可以使用普通相关系数pearson,也可以使用秩相关spearman)。但是投资模型都是建立在一个个假设基础上的,我们挖掘因子并使用因子,也是假设它的收益预测能力会延续,或者不能延续时,我们会剔除这个因子。



因子投资在股票市场上已经流行多年,因为股票天生有一个优势:众多股票可以在一个日期截面上,产生各种可以和大盘对比的信息,所以股票市场很早期就提出了单因子模型(CAPM定理),其本质认为个股收益率可以被指数收益率所解释。将个股和指数做线性回归,得到的beta(回归斜率)就是指数对个股收益率的影响强度。其他部分则统统称为alpha,是指数所不能解释的收益,也称为超额收益,或者无法解释的价格风险。


此后出现套利定价理论APT(Arbitrage Pricing Theory)是CAPM的推广,是学术界不满足于CAPM对于个股收益(或者说风险)的解释,而进行的理论框架延展。在此框架下,个股收益率被解释为多种因素的共同影响。如果用F1,F2,…,FnF1,F2,…,Fn表示我们考虑的因子的话,回归的模型就是α=b1F1+b2F2+⋯+bnFn。这里的b1、b2就是每个因子的影响力(系数),线性叠加各因子值和前面的系数,就得到了对于股票的打分。

直到1992年,三因子模型(Fama-French 3-factor model)提出,研究发现,股票的市场的beta值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异。后来又有了四因子、五因子、甚至中国版三因子模型,这些定价模型从风险解释的角度在描述收益率。


而二级市场业界则在思考,如何从收益角度,获取alpha超额收益,套利定价理论APT是所有多因子模型的理论基础。所以在个股横截面上,我们都在通过挖掘各种现象并检测其和下阶段收益率的关系(一般称为因子IC),并检测这个关系的稳定性(ICIR)


期货市场因子概览


股票因子的故事告一段落,让我们回到期货市场。在期货领域,如果说一定要找一个因素显著解释每个品种涨跌,那就是该品种自己的动量了。因为期货市场每个品种基本面差异大,难以找到共同影响因素,如货币等因素对于价格的影响趋于中长期,短期显著的收益影响都集中在该品种自身的基本面,而基本面不容易直接量化,价格动量成为一个容易理解的行为金融指标,被大家广泛采用。


期货因子投资在个人交易者领域较为难以推动的原因是,时间序列价格动量直到2016年都还非常有效,所以思考用其他因素来做模型的源动力不强。另外期货领域没有大盘这个概念,所以无法区分基本的收益来源(如beta和alpha),期货市场还有一个显著问题是横截面品种较少,所以难以进行IC因子收益检验。



但是这几年,情况有所变化,单一的动量因子赚钱已经不再那么容易,所以我们应该寻找更多有盈利潜质的现象,并经过测试确定其是一个期货市场的因子。《量化投资训练营》公众号2019年初写过一篇期货多因子的文章,各位读者可以参考。上图是海通证券研究分类的期货因子。今天的文章简单举2个例子,并且针对其中各位读者最感兴趣的动量因子,再做一些展开。


1、横截面动量因子


最早的动量效应名词,是由Jegadeesh和Titman(1993)提出的,是指股票的收益率有延续原来的运动方向的趋势,即过去一段时间收益率较高的股票在未来获得的收益率仍会高于过去收益率较低的股票。


区别于时间序列动量,横截面动量的交易规则是:在每个日期截面上,选择上涨最多的N个品种做多,下跌最多的N个品种做空。它的假设是: 强者恒强,弱者恒弱。 动量是相对出现于品种之间的,而不是以一个绝对数值,体现出方向性。截面动量模型的持仓是对冲形态的,每一期账户内总有N个品种多头,N个品种空头。


如果你一定要找一个解释,可以这样说:心理的认知偏差影响了投资者的决策行为,从而使股票市场对某种趋势反应过度或者反应不足,并最终导致动量效应和反转效应。


截面动量有几个关键问题:首先需要讨论的便是截面上不同品种的排名是否真的能够区分开来,也就是说截面效应是否真的有效。为了查看分组对收益表现的影响,有机构研报里,通过截面动量从大到小的排名进行分组,标记排名前20%为做多组,后20%为做空组。



但是在期货品种较少的年份,横截面上品种数量不足20个的情况下,每次做多做空的品种可能只有3~4个左右,无法形成一个稳定的组合。所以我们在后期测试中,也尝试了,前20%,前30%,前40%,这样三组参数。


其次是动量衡量和持有参数华泰期货的测试显示:横截面动量策略涉及的参数主要有回溯期和持有期。回溯期指计算动量因子的时间长度,用 R 表示,代表建仓日前一天开始向前推 R 天,计算这 R 天的平均收益率;持有期指建仓后持有组合的时间长度,用 H 表示,代表每隔 H 天建仓,持有组合至下个建仓日。


2、展期收益率因子


carry展期收益是一种重要的收益来源,你可以按照字面理解就是持有它,在很多市场carry都会产生收益。商品期货市场,远期合约和近期合约,存在套利机会,期货合约到期日之前,期货与现货除受供需影响外,亦受持有成本(cost of carry)的影响。由此可以理解carry收益,由期货的两个特性决定——期限性和收敛性。



上图是去年螺纹钢期货合约的价格情况,可以看到随着时间价格越来越低(期货贴水backward)。引用之前的文章来描述:若现货价格大于期货价格,或近月合约的期货价格大于远月合约的期货价格,称为期货贴水backward,或现货升水;若现货价格小于期货价格,或近月合约的期货价格小于远月合约的期货价格,称为期货升水Contango,或现货贴水。


按照机构提供的交易逻辑:若不同合约的展期收益率排名可在一定程度上体现“多强空弱”,这里的“强”、“弱”概念,即可根据展期收益率排名构建交易策略,从而在展期收益率的角度做到“顺势而为”。一般的交易规则是:做多展期收益率最高的品种,做空展期收益率最低的品种。在一个横截面的头部尾部,各选择30%的期货合约。



由于该因子也是一个有基本面因素的低频因子,所以每周调仓,做多展期收益率为正的且最高的前50%,做空为负且最低的后50%。在设置每次千1左右的冲击成本后,通过上图可以看到,展期收益率因子的表现也还不错。其实展期收益率的核心是它和动量因子不同源,所以更容易和动量策略搭配。


3、动量因子的进一步演化


动量的表达方式可以多种多样,不仅是收益率,还可以是ER效率系数,还可以考虑剔除掉近期的短期动量(因为短期暴涨暴跌后容易反转)等等。从股票方面的经验入手,在期货动量因子上,我们可以让其进一步增强。


在我们2019年初给七禾网提供的的免费培训中,提到了通过TB(交易开拓者)构建一个横截面工作区,然后在这个工作区中,可以撰写因子,并测试因子表现,如下图。其中RR[i]就是计算第i个品种的因子公式,在这里可以天马行空地改进成为自己想要的因子,然后测试其性能。



这里就要提到一个简单但是很多初学者忽略的概念,为什么反映几个波动的ER效率系数,和收益率,两者是不同的动量因子?因为ER效率系数Efficiency_Ratio = Abs(direction / volatility) ;。

方向性direction = ratio_price - price[10] ; 

波动性volatility = Summation( Abs(price - price[1]), 10);  


如果最近走势更趋近于单边趋势,ER系数会趋近于1,如果最近行情没有明显趋势,且震荡,ER系数会趋近于0。所以ER效率系数较高的品种,不仅方向性突出,而且波动率较低,在实测中,该因子的表现也比简单的收益率因子略好一些。



在基于python的平台上,也可以进一步开脑洞,开发因子。如2016年,著名的海外私募机构world quant公布了101个alpha因子。他们是通过计算机随机生成排列组合,然后基于因子检测平台,不断演化迭代得到的。


比如说其中的Alpha013号:

其公式为:(-1*rank(covariance(rank(close),rank(volume),5)))


含义可以理解为:计算过去5日的收盘价与交易量关联度(协方差),如果正相关则卖出做空,负相关则买入做多。国泰君安数量化团队也在之后构建了191个因子并公开,可参考《基于短周期价量特征的多因子选股体系》。这些研报都提供了期货横截面因子构造的新思路。



如上图所示:我们也尝试构造了几个因子(上图为单利1倍杠杆测试效果),并且在11月17日的公开课培训中,将这些因子的源码带给各位学员共同思考其原理。课程中还会大量讲解股票和期货中的因子评估方法。


    作者介绍:濮元恺

    2009年开始专注于程序化模型研究,随后经历股票多因子模型、商品期货时间序列模型等开发工作。

    2016年加入中国量化投资学会专家委员会。

    现任蝶威资产管理产品总监。

    曾作为励京投资管理(北京)有限公司创始团队,发行了多只阳光化私募基金产品,业绩稳定。其中稳利二号产品在朝阳永续私募行业2018年度排名(债券混合类基金)中排名第8。

    2018年撰写的《量化投资 技术分析实战》图书获得众多业内人士推荐成为畅销书,帮助很多量化投资交易者走上了起步之路。



    七禾网联合量化交易高手濮元恺先生推出了免费量化系列课程,同时分享股指日内、海龟高性能改进等10多套策略模型,带您学习和提高量化交易!


作者寄语:对于七禾网提供的免费培训,我依然坚持认为:这是一个难得的学习交流机会,我们并不仅是作为老师,期货市场高手如云,我们也不敢当老师,更多地是和各位朋友交流探讨,在学习过程中,共同提升交易水平。


相关链接:精品量化培训:从信号模型到截面因子投资,从中长期模型到多周期交易


往期一位学员的实盘净值曲线图


本次课程中将分享的模型测试曲线图

责任编辑:傅旭鹏

【免责声明】本文仅代表作者本人观点,与本网站无关。本网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

本网站凡是注明“来源:七禾网”的文章均为七禾网 www.7hcn.com版权所有,相关网站或媒体若要转载须经七禾网同意0571-88212938,并注明出处。若本网站相关内容涉及到其他媒体或公司的版权,请联系0571-88212938,我们将及时调整或删除。

联系我们

七禾研究中心负责人:刘健伟/翁建平
电话:0571-88212938
Email:57124514@qq.com

七禾科技中心负责人:李贺/相升澳
电话:15068166275
Email:1573338006@qq.com

七禾产业中心负责人:果圆/王婷
电话:18258198313

七禾研究员:唐正璐/李烨
电话:0571-88212938
Email:7hcn@163.com

七禾财富管理中心
电话:13732204374(微信同号)
电话:18657157586(微信同号)

七禾网

沈良宏观

七禾调研

价值投资君

七禾网APP安卓&鸿蒙

七禾网APP苹果

七禾网投顾平台

傅海棠自媒体

沈良自媒体

© 七禾网 浙ICP备09012462号-1 浙公网安备 33010802010119号 增值电信业务经营许可证[浙B2-20110481] 广播电视节目制作经营许可证[浙字第05637号]

认证联盟

技术支持 本网法律顾问 曲峰律师 余枫梧律师 广告合作 关于我们 郑重声明 业务公告

中期协“期媒投教联盟”成员 、 中期协“金融科技委员会”委员单位