徐文旭:量化为器 徐文旭:浙量学副会长、资深量化投资者、大机构风控部门负责人 精彩语录: 程序化交易,我觉得它的概念相对来讲可能有点窄了,就表示我交易这个动作是程序化,是让这个程序帮我做的。其实我们在做一个更大范畴的事情应该是量化投资。 投资为本,量化为器。 投资的要素包括这样几个方面,这个我们自己总结的,叫做价值、风险、杠杆、容纳,还有流动。 我觉得我们做量化,其实很多时候不仅仅是说把这些东西数字化,把这概念给它数字化,更重要的是说把这个投资要素给它逻辑化和清晰化,目标是要确保适当的收益和风险水平。 做量化的人,容易被自己的阅历、经验,还有知识结构所局限。 我们能做的是靠风险去换取收益,所以一定要想清楚这个风险在哪里,收益在哪里。 高频交易,它可以提高资金的周转率,这个资金周转率的提高本身就是一种杠杆。 天下没有免费的午餐,凡是你能拿到的或者是收益好的东西,它一定是要付出代价的。 专户产品的优先资金对劣后资金来讲,它就是劣后资金的杠杆。 容纳性是和收益挂钩的,它决定了绝对收益额的大小。 如果这个容纳性是一个低容纳的环境,那么你只能靠提高的资金周转率来提高这个收益。 流动性本身是什么含义?它是头寸和现金切换的成本和速度。 我们不能,也不应该用一个线性的思维去应对这个市场。 理性的、深入的和清晰的思考,有可能帮助我们跳出线性思维的框架。 从长期来看,20年、30年、50年的所有行情一定是上涨的。 既然是个量化,我们就要把它里面的那个特征挑出来,然后对这个特征进行量化。 股指期货每天的持仓量是这样的,开盘的时候涨,到了中盘的时候,11点或者下午1点钟的时候,它可能平了持仓量,最后收盘的时候又跌回去。 我们去分析这些资金的持仓量日度,还有以前累计的平均值的变化,再结合行情的涨跌,我们就可以分析这些日内资金它当天的盈亏状况,分析这个盈亏状况之后,我们可以设定在某些特定的时间和价格点预判它回头某一些价格线。 从博弈层面上来讲,它就是一个资金的争夺,然后产生均衡的一个特征。 价格背后有无数的动机,价格的每一跳它可能都是由不同的因素构成的。 用蒙特卡罗模拟模拟个几十万次、上百万次,那么对于未来模拟这么多次,我们可以预判一个策略在未来的表现到底会怎么样。 什么样的模型是一个优秀的模型呢?我觉得就是深刻的洞察力加上简洁的量化实践。 大家不要忘记我们是是在做投资,而不是在做量化,我们是量化这个工具在做投资,所以工具怎么快捷、怎么方便,怎么有效率,就怎么用这个工具。 不要忘记投资的目标是规避风险,获取收益,也不要迷失在量化的技术泥潭里。 优秀模型它一定是深刻的洞察力加简洁的量化实践,没有什么模型可以代替这个洞察力。 我自己一直也是做程序化交易的,现在和大家谈一谈关于我自己对程序化交易,对这个量化投资。因为我们以前都说是程序化交易,而程序化交易,我觉得它的概念相对来讲可能有点窄了,就表示我交易这个动作是程序化,是让这个程序帮我做的。其实我们在做一个更大范畴的事情应该是量化投资,这是我自己关于对量化投资的一些反思吧。通常来讲,一般情况就是亏钱了就比较爱总结,爱反思,赚钱的时候可能就不想那么多。 我今天讲的题目叫做《量化投资的逻辑、结构和传导特征》。先来讲一讲关于量化投资逻辑的问题。我在想我们做量化投资,本质上来讲是在做投资这件事情,量化是我们使用的工具,所以叫做投资为本,量化为器。那么投资这件事情它的核心是什么呢?其实它的核心很简单就是收益和风险。投资这个事情,我们大家都知道,如果是我们可以没有风险就去换取一个收益,其实这个世界上不存在这个事情,一定是用风险去换取这个收益。那么投资的要素包括这样几个方面,这个我们自己总结的,叫做价值、风险、杠杆、容纳,还有流动。那么量化,我们是在做什么呢?我们做的不仅仅是一个数字化的事情,它更重要的是把投资这几个要素,就是我投资要选择这个价值风险、杠杆、容纳和流动,把这个要素给它逻辑化和清晰化。很多时候我们没有太想得清楚所做的投资在二级市场也好,或者是在金融市场也好,来做这个投资交易,它背后的本质是在想什么事情,其实很多人是没有想清楚的,所以我觉得我们做量化,其实很多时候不仅仅是说把这些东西数字化,把这概念给它数字化,更重要的是说把这个投资要素给它逻辑化和清晰化,目标是要确保适当的收益和风险水平。因为投资的核心,我刚才讲了,是投资和风险。所以这句话是说,我们经常做的是投资,而只是用了量化这样的方式来做。而你不用量化的方式,只要把这个投资的核心问题想清楚,完全也是可以的。当然,那个量化通过自己来讲,我觉得更难一些。那么做量化的人,就比较容易被自己的阅历,其实不止做量化的人,很多人都是这样的,他容易被自己的阅历、经验,还有知识结构所局限,所以很多时候你可能就忘记了自己在做什么事情,而是只是说从事这项工作,迷失在这个工作本身里面。所以有一个“锤子理论”,是马斯洛(Abraham Maslow)说的,提出了一个人的需求分层次这样的理论,他说如果你是一把锤子的话,那么所有东西看起来都像是钉子。这个就是说我们在做量化投资的时候应该要注意到这样的问题,不要让自己变成一把锤子。 我刚才讲了投资的几个要素,有五个要素。首先是收益,我们要从哪里,从什么样的市场获取什么样的收益,这其实就是我提到的价值要素,投资的价值要素,就是说我们从哪里去获取收益?获取什么样的收益?这个是我们要思考一下的要素。为什么是在二级市场?为什么是在期货市场?为什么是股指?为什么今天我们要做买入这个动作?这都是关于价值问题的思考,也是我们必须要想清楚的问题。就是说,我们一定要认识清楚这个收益来源,我做这件事情,是在做投资这件事情,那么这个投资它的收益是从哪里来的呢? 第二条就是风险。收益总是和风险伴生在一起的,天下没有免费的午餐,如果这个风险很低,收益又很高,或者是没有风险,然后是有收益,如果是有这种机会,要么就是看错了,根本就不是这么回事,不过你看到了是以为这样回事,要么就是说获取这个收益需要其他的资源,比如说政府或者是黑帮,黑帮可以收税,其实政府和黑帮是一样的,和黑社会收保护费是一样的,但是你要想去收税,你要想去当黑社会收保护费,那你要有强大的暴力资源,那你有没有呢?可能没有。那个是无风险的,说白了就是我比你狠,然后手里面有枪。那个是无风险收益,但是我们做不到,因为那个需要别的资源。所以我们能做的是靠风险去换取收益,所以一定要想清楚这个风险在哪里,收益在哪里。 风险这件事情并不是收益的一个反面,不是说我亏钱了就是风险,其实风险和收益是一样的,收益是我们要想清楚,就是为什么我们在这个市场上有这个机会?有这样的机会给我能够赚到这个钱?风险其实也是一样,不是说我今天这笔交易做亏了,这是我的风险,风险它和收益一样,也是有不同的来源,我们也要认清楚这个风险是从哪里来的?它表现为哪些形式和有什么样的损害? 第三个要素就是杠杆。杠杆这个要素像丁博士讲的,我们要把资金做稳定,要去用别人的钱,你要加杠杆去赚钱,对吧?所以我们要考虑清楚杠杆这件事情,我们要不要用杠杆?假设有一个早上丁博士讲的策略,我是一个高收益的,然后低风险的,但是虽然我容量做不大,但是也许我高收益低风险的这件事情本身,像高频交易,它可以提高资金的周转率,这个资金周转率的提高本身就是一种杠杆,也许他就不需要借助外部的杠杆。所以杠杆这件事情我们需要考虑清楚,我需不需要用杠杆?有没有杠杆可以给我用?如果我可以拿到杠杆,谁在借给我杠杆?这个杠杆所要付出的代价是什么?因为这个天下没有免费的午餐,凡是你能拿到的或者是收益好的东西,它一定是要付出代价的。而且这个杠杆,我们不是说它是狭义的保证金的概念,比如现在大家都在发这个专户产品,那么专户产品的优先资金对劣后资金来讲,它就是劣后资金的杠杆,现在有大量的资金在准备进入期货市场,这个资金都从哪里来?都是银行理财资金池里的资金。上午严总在讲,我们要对接一些所谓的高净值客户这样子的。这个时候,他们为什么愿意在这个时间节点,为什么愿意在这个时候拿出这样的,有这样的预期收益要进入这个市场?要给你劣后资金提供?这是我们大家要思考清楚的问题。 第四个要素就是容纳性,说白了就是资金容量。这也是丁博士讲过的问题。容纳性是和收益挂钩的,它决定了绝对收益额的大小。上午丁博士讲到,我们讲赚了多少钱,不是看你占了多少收益率,而是关键是讲你绝对的数额赚了多少钱?比如说今年我翻了5倍,但是你100万翻的,赚到500万,这个没有什么意义,对吧?但是我有20个亿的资金,今年赚了50%,赚了10个亿,这个吨位摆在那里,当量摆在那里就不一样了。所以这个容纳性是我们要考虑的第四个要素。如果这个容纳性是一个低容纳的环境,那么你只能靠提高的资金周转率来提高这个收益。 最后一项就是流动性。流动性是风险挂钩的,流动性本身是什么含义?它是头寸和现金切换的成本和速度。如果你手里面本身,就是说我们的资产肯定表现在不同的头寸和现金,但是最安全的,或者是流动性最好的就是现金。如果你手里拿着大把的头寸,比如说有很多人有房地产,手里边有很多房子,但是你现在要想把房子给它卖出去,要把它转换成现金,那可能要付出成本和速度。其实对流动性,这个就是宏观层面的。在微观层面这个东西也有很多可以值得做的考虑,后面我会简单的提一下。 这是我们所面临的投资这件事情的要素,大家来看,这是一个非常复杂的一件事情。其实投资,我们做的是一件非常复杂的事情,我们面临的是一个非常复杂的世界。那么复杂是什么?复杂就意味着我们不能,也不应该用一个线性的思维去应对这个市场。复杂的一个市场,肯定不是一个简单的线性的。那么什么样的东西是线性的呢?比如说我们认为某一个因素因为A这个因素,所以B这个因素就产生了,然后因为产生了B这个因素,所以C这个因素就产生了。这是一种链条式的思维,这种思维就是一种线性的。还有就是我前面提到的所谓“锤子理论”,假设你自己是一把锤子,你看什么都是钉子,看这个是钉子,看这个是钉子,看这个也是钉子。也就是说让我自己做量化,有的时候我的这种感觉就比较强,因为我自己熟悉计算机,当然,我自己学计算机的,这是我吃饭的家把式。还有我们都是做数学出身的,做数学,做计算机出身的,看这个市场,看人家的盈利,首先去看他的盈亏比,关注的是这些指标。但是有一些做专业的人,也许他根本就不看这些乱七八糟的指标,他看到的是它的收益率,看它是为什么赚到这个钱?看他赚钱盈利的机会来自于哪里?所以说,我们就受到自己的经验所限制,你所看到的东西都是从你的经验角度出发去看待的,这种思维也是一种线性思维。 那么这个坏消息就是,因为人都是这样,人的直观的印象,第一印象,然后你依靠那种非理性的思考,那种情绪的因素所产生的这种思维通常都是线性的。说白了,人性给你带来的这种回应,要想在这个市场上,通常都是靠人的本能去做的那些事情或者是那些想法,通常都是要亏钱的,是不好使的。 那么什么样的思维是一种非线性的思维?不是像刚才那种链条式的,因为A所以B,因为B所以C,这样的思维。你把它改成说,因为有A1、A2、A3这样的因素,并且因为A1、A2、A3它们之间这种相互关系,最终可能出现B的概率是多少。这样一种思维相对来讲就不是那么线性的了,它有点绕弯子,凡是有点绕弯子,它通常有可能就是管用的,但也不一定完全是管用的。那么第二种就说,你不是说按照某一种固定的模式去看待这个世界,而是说按照一种完美的分类的角度去给这个事物进行分类,然后去看待这个世界。就是说你不要只把自己当成一个锤子,你要从这个锤子理论扩展开去,设想到我自己是一个五金的工具,那么五金工具也许就能够涵盖整个这个世界你所处理的事物,可以把它作为一个完整的分类。所以理性的、深入的和清晰的思考,有可能帮助我们跳出线性思维的框架。那这个结论就是,我们说白了就是要想赚钱,你就要很聪明,很傻的想法可能赚不了什么钱。 那么这样一个非线性的复杂的世界,我们怎么来考虑,怎么来应对这样一个世界呢?首先,我觉得一个非线性世界它肯定是分层级的,既然它不是线性的,它肯定是一个分层级的。分层级的,各个组成部分可能不是地位平等的,层与层之间也不是平等的,只有像类似于金字塔这样的一种。因为层与层之间也是不平等,所以层与层之间,它们也是一种利用层级关系,所以像金字塔这样的层级关系是稳定的。那么各个组成部分的相互关系体现在这个层级关系上面。 另外一个就是,复杂的东西通常都会发现出分形的特征,刚才冯总也讲到分形的一些概念。关于分形,我自己更多的理解是这样的,分形它是一种很多模式的重复,它最后就是一种分形的特征。那么这个模式是什么东西?模式它可能是一个以更小比例连续重复的一个具体形状,比如说我们经常看书上写的那些科赫曲线或者什么样的曲线,看一条线,然后把这条线平均的分成三个,然后每个线段再给它分成三个,那么它可以以一个更小的比例连续的重复它自己的形状。那么它也可能是一个抽象的统计模式,比如说是再一个格子里面,一个特殊的方形是黑色或者白色,这样一个概率,这个是模式,有了这个模式之后,这个模式可以呈比例的上升、下降、挤压或者扭曲,或者是这些列的东西同时都有。还有就是这些模式可以用统一的精确确定性的规则来进行定义,它也可以完全依从于一个概率的定义来进行。分形就是这样一些复杂的可能重复的模式的重复,这就是我对分形的理解。因为我们分析一个复杂的非线性的世界可以由这样的角度,所以可以从这些角度去做策略模式。 前面是我讲的关于投资逻辑的问题,下面就来简单提一下关于结构的问题。 目前,我们自己内部是用这样一个,就是我刚才讲的分层级的金字塔结构的这么一个层级结构来看待这个市场。这个市场,我们认为最上头的是价格,就是我们应该是在行情当中观察到的,它的横坐标是时间,纵坐标是价格。当然,在这个纵坐标里面可以是这个量,就是成交量,也可以把价格和这个量合在一起,把它变成一个资金的估算。总体来讲,它是一个二维的平面。这个东西具有最大的不确定性,因为它是最表层的东西,凡是最表层的东西,它可能不确定性,它的随机性,或者它受到的影响力是最多的。那么在这个层级下面,就是一个博弈的层级。博弈这个层级通常可能是从价格形态上来看,或者从资金博弈的角度来看,它是一个博弈周期的循环。比如说在很多,尤其是商品的行情里面,10-20%之间的这么一个波动幅度,它其实就意味着为什么10-20%这么一个幅度?它可能就意味着一波阶段性的终极行情的一个结束了,至少它不会说一路涨上去,它可能10%、15%左右就要出现回调了,因为10%、15%就意味着一波保证金的爆仓。就是说,有些人假如说它满仓做,那么10-15%的一个涨幅做反了,这个15%的涨幅就把它拉爆仓了,拉爆仓之后他就认输了,认输了之后这个行情可能就会下跌。当然,这是一个比较直观的理解,这种第二个层面是博弈层面的。 第三个层面就是价差层面。价差这个层面是一种什么样的概念呢?就是期货和现货之间的这个价差,还有就是远月和近月之间的这种价差。那么它是一种相对价格的一个概念,如果是期限价格,是商品的虚实比重,就是这个商品期货它的虚盘和实盘,它们的这个比重是多少。然后期限的远近的这种价差,它体现了一个利率结构。因为现在大家都知道,比如说铜,其实铜这件事情它本身已经不再是一个商品了,他是拿铜这件事情来做一个所谓的融资铜的,就是它用铜这样贸易的一个牌子,挂这样一个牌子,然后我用这个牌子到国外去融资,这个具体的事情,我也不是专家,所以我也是给大家讲这样一个概念,最终,铜现在变成一个国内和国外汇率利率套利的一个东西,所以它终点竞价可能是一个利率结构的体现。在这个层面上,它体现了这个世界结构上的特征。 第四个层面上是供需层面的。供需层面是一个商品也好,包括金融期货本身也好,股票的这个东西,它的这个供需层面决定了这个商品本身真实的价值。我们从小都学那个社会价值理论,都知道价格是由价值来真实决定的。所以在这个供需的层面上,才是真正决定了价值的概念。 最后其实还有一个,在这个图里面我们大家会看到,我画只画了四个层面,还有第五个层面,这个层面是一个隐含的层面,因为这几个层面是下一曾是要影响上一层的,上一层对下一层是一种反馈,就是它们之间,层与层之间的这种关系。那么最底层这个就是货币供应,货币供应这件事情,因为现在我们是处在一个金融货币的时代。自从金本位脱离以后,它这个货币其实是和信用挂钩的。但是信用是什么?说白了就是脸皮厚,我的脸皮够厚,我就找你借钱。反正这个信用,说白了就是你信任我。那你凭什么信任我?一种,比如说我有强权,像美国,我有强权,我可以有税收,你当然要信任我,因为我手里的暴力资源比较强大。另外一种信用,比如说有抵押,我手里面有房产,我抵押给你,这种是信用。那么在我们信用货币的这种时代,信用这件事它不是可以很好衡量的,它一定是一个比较虚的东西。既然是比较虚的,那就挡不住人类这种欲望的爆发,它一定会爆发货币的。所以通货膨胀是永远的,大家看,从长期来看,20年、30年、50年的所有行情一定是上涨的。就有很多做多的人,刚才冯总讲我们轻仓长线去做,可能就是能赚到钱的。它实际上是有央行控制的,代表了统治者的利益、意图,还有统治者内部之间和统治者和被统治者之间一种博弈的平衡。信用的供应其实是一介收益和成本的参照基准。 这是关于我们的定价层次,就是说我们认为这个世界是一个复杂的世界,非线性的世界,那么我们怎么来看待这个世界呢?因为我们要做的最终是价格,但是你光只看价格,其实是看不懂价格的,所以要往下去看,去看是什么影响价格?是这种资金博弈周期影响价格,这是对价格最直接的影响。那么什么又影响到博弈呢?是这种结构,就是利率的结构、期限的结构、价差的结构,结构产生了博弈的结果。那么这种结构又是由什么产生的?它是由供需层面真实的价值体现了。而真实的价值体系,很多时候它可能是由货币决定的。就是说真正的很多东西,我们并不是说需要用或者是需要消费什么东西,它其实有的时候是由货币所体现出的一种虚假的供需结构。 这种层级之间的关系,是说下层对上层的影响,我们把它这样定为充分性,它是一种决定性的。下层的这个条件,这个环境成立的时候,上层一定会出现某些特征。但是会不会出现这个特征?或者这个特征出现的强度怎么样?这是我下面要讲的所谓传导问题。但是从逻辑上来讲,它这种概念是一种推论性的,就是说下层的特征出现的时候会让上层产生一些特征,那么上层是对下层出现特征的一个一个反馈。当上层出现某些特征的时候,你要去看它下层是不是出现了对应的影响到这个特征?如果不是出现,那就说明它是一个噪音,是一个假的东西。层与层之间必须要保证传导的特性,就像我刚才讲的,这个世界不是说简单的因果关系,因为原因出现了,所以这个结果就会出现,这个世界一定不是这样一个确定东西,它一定会有一个表现的过程,传导的过程。 这样一个分层定价的体系,为什么我说我们是用一个复杂的观点来看待一个非线性的世界,所以提出一个分层定量的体系,因为这个价格受到的影响因素是最多的,而且是最容易变化的,所以表现出来它是一种随机性的,在学术上是甚至是用随机游动来对它进行建模。所以我们如何制定出时间价格中二维体现的这种观念来看待这个世界,就很难降低它的不确定性。所以大家在做策略的时候,如果是在TB、MC这样的软件平台上做这样的策略,根据历史数据,所有的历史数据都是时间、价格、量,根据这样的关系来做。大家都会发现,无论你怎样做,它总是会有阶段性的失效,那么就是因为它不确定性,在这个层面上本身是很难降低的,所以分层还有一个这种概念,就是有个问题的解决,你在自己这个层面上可能是解决不了这个问题,一定要向别的层面去前进,然后可能才会去解决这个问题。 那么按照这种层级的关系来看待这个世界,还可以比较清晰的分析这个收益和风险的来源。比如说我可以分析当前这一层级,比如说博弈这个层级或者是价差结构这个层次它是一种什么样的关系?它对上层、下层所体现出来的一个特征是不是传导到上层?或者是对下层是有反馈,可以通过层与层之间的关系来进行一些预判。然后根据每一层的分析,也可以找到对应这一层的风险对冲方式。这个风险对冲,我们抛开那些工序本身的含义来讲,其实期权大家知道它的英文单词是“options”,Options这个词本身的含义是“选择权”的意思。就是说我买一个期权或者是卖一个期权,其实你是买进一份选择权或者是卖出一份选择权,如果我是买进一个选择权,这是一个什么样的概念?我保留我在未来进行选择的权利。这其实是期权使用最直观、最本质的含义。当然,它背后有很多复杂的数学内容,那些东西其实是做生意的人,卖方为了做这生意,为了赚你的钱,包装了很多RV,忽悠人的,说白了就是忽悠人的。比如我自己,看我一晚上这样的书之后,你就会认为很多东西做出来很复杂、很吓人、很漂亮,其实目的是为了忽悠人,它的本质我们大家可以认清楚,它是为了保留我在未来的一个选择权。那么我们定义了这个层级之后,你就知道我在这一层上面,我的收益是什么,我的风险是什么,我可以给你定义什么样的选择权。 这里我再从这个层面上讲一下关于组合这个概念。当我用这样一个层级的体系来看待这个市场的时候,我这时候再来做组合,其实这个组合它就不再是一个多品种多周期、多策略,以前我们大家讲所谓的组合,都在讲我是多品种、多周期、多策略,目的是分散风险。那如果你这个多品种、多周期、多策略本身没有一个内在逻辑的支持,那么它很可能就是一个堆积的结果,而不是说一个组合的结果。那么我们有这样一个层次的概念,我们从不同的层次找,然后在这个不同层次里面,从不同的维度上,就是每一个层次上它有很多不同特征,从这个不同特征到这个维度上面。然后还有就是我发现这个维度里面的某一些思路和规律的时候,我们把这些行业组合在一起的时候,它这个组合才会体现出来一种内在的逻辑含义。记得以前我也贴过这样的图,这个最紧密的组合,比如像这个机器人,这个机器人是由很多小机器人组成的一个大机器人。如果它少了一条胳膊,少了一条腿,它就不叫一个大机器人了,所以这种组合它的耦合程度是非常紧密的。像这个是一个航母编队,航母编队的一个组合核心是航母,周围还有扫雷艇,还有潜艇,还有各种外部的预警这个。那么这种组合它是为了应对实战的,如果这种组合里面少了某一个潜艇,被敌人炸掉了,它这个组合仍然可以运行,所以这种组合的耦合程度相对来讲是比较中等的。那么这种组合它的耦合程度相对来讲是比较松散的,就是本来是一个跳舞的啦啦队,有这些美女在跳舞就可以了是吧?它再搞一个卡通人跳是让大家很happy,但是它不搞这个来跳,大家也很happy,因为这么多美女在跳,是吧?所以这种组合它的耦合程度相对来讲就比较松散。那么最后一种组合看上去很漂亮,每一个小熊都很可爱,但是你这个组合有什么意义?你只是把这个熊堆在一起而已,所以这种是一个堆积式的组合,你讲不出它内在的逻辑,它的道理是什么。组合的偶尔程度有紧密的,有中等耦合的,还有这种松散耦合的,最后是这种堆积型的耦合。 前面我介绍的是我们看待这个市场的逻辑,然后在这个逻辑的基础上搞了这么一个所谓的分层概念。最后落实下来,我们怎么来对这种东西做量化?做量化这件事情,按照我自己的经验,我觉得是这样的,我把这个层级结构里面的第一条是做什么?就是特征的提取。比如说像这个博弈,或者像这个价差,博弈和这个价差它其实是一个概念,那么这种概念我们要怎么办?既然是个量化,我们就要把它里面的那个特征挑出来,然后对这个特征进行量化。这里面所谓的特征就是一些数字,把一些数量化的东西表达出来,什么是价差,什么是供需,什么是博弈,把这样的一些特征给它提取出来。这个提取说白了是什么呢?一个是逻辑上的东西建模,我用哪些概念来表示,用哪些特征来表示这个层级;第二个就是数据,我用这个,比如说供需,我们可以去提取现货的数据、库存的数据、长短的数据、持仓的数据,就是那个主力持仓,还有价差的数据,我们用这个期限价差、远近价差,内盘和外盘,就是国内和国外外盘这种价差。然后这个博弈用计算现金流、计算均衡、计算成本,然后这个价格层面利用一些市场微观结构的和流程的一些理念,来对这个价格、量还有时间进行一些描述。 货币的供应层面,我们现在是用一些利率,整体最主要的就是利率,包括利率的周期。比如说像国家这方面做融资的,他们可能以一个季度为单位,在一个季度之内,它可能要先经历一个放开的过程,最后再经历一个收紧的过程,这就是一个利率周期。还有就是融资成本其实也是实际利率。 下面大家来看第三个层面,就是所谓的传导。我觉得传导是这个层面里面真正量化落地的一个点。传导实际上并不是一个简单的因果关系,前面我已经提到了。不是说因为,比如说美联储这样说今天降息了,然后股票就要上涨,这个表面上看上去是这样,比如说周三伯南克说,我们QE不搞了,它又拉上去了,看上去是这样一个简单的,但实际上这个事情并不是这样简单的,它的影响因素是复杂的,最重要的是它是随着时间发生变化的。我们是用传导这样的观点来观察条件A和结果B之间这样的关系,只有这种关系我们发现它是稳定的时候,我们才真正能够把这样的传导关系作为预判,就是落实到量化的层面上。简单的一个数学概念是这样的,我们可以通过逻辑分析去寻找影响B最直接的因素A,A对B这样的影响,我们认为它对B的影响是一个函数表达式,就是B是A的一个函数,同时还要加一个误差项,因为我们任何的逻辑分析,它背后,就是你是建模一定要舍弃掉一些细节的影响不大的东西,那么舍弃掉的它就是一个误差项,所以这个误差项是要表达进去的。那么F是什么呢?F如果从逻辑分析的角度来讲,你可以把它分析清楚,它可以就是一个解析表达式。如果是解析表达式表达不清楚,我们可以用一些回归预期,但是回归预期本身来讲它可能也是对解析表达式中的一些参数做一些估计。所以还是要寻找一个体系的表达式。当然,回归除了线性回归之外,还有一些复杂的,比如说倍数线性回归、逻辑回归,还可以用一些其他的回归方式。还有像我们在学术当中,比如所谓的随机微分方程,就是说我直接找它的表达式表达不出来,那么它的变化率,也许我们能找到它变化率的一些关系,这个就是微分方程,但是因为有随机项,所以它可能是一个随机微分方程。最后实在不行,我们还可以用机器学习的模型,你比如说神经网络,我也不知道它做出来是个什么样的东西,但是我可以用这样的一个分类器来表达这样的一个F,然后我们通过对这个F性质的研究,来定量分析A对B影响的特征,这样当A发生变化的时候,我们来观察B的变化,是不是满足这个F的特征,从而来确定这个传导是不是真的发生了。 这是关于量化的分析,前面讲得比较抽象,简单的举一个例子。比如说还是策略还是股指之内,前面说得很复杂,搞得很像样的,最后还是股指,为什么?还是股指最好做。拿这个东西做别的也可以,但是股指还是最好做的。那么我们基于对这个持仓,股指大家都知道,股指期货每天的持仓量是这样的,开盘的时候涨,到了中盘的时候,11点或者下午1点钟的时候,它可能平了持仓量,最后收盘的时候又跌回去。大家在这个启盘里面有一个所谓的“波动率微笑”,波动率每天是开始的时候打,后来落下来,尾盘的时候收上去。这种现象是大家每天都观察到的,那么我们观察到这样的现象之后,我们都可以认为这个现象是因为每天有相当高数量的资金只进行这类交易,因为它每天开盘的时候上去,到了收盘就平下来了,这些资金是只做日内的。我们去分析这些资金的持仓量日度,还有以前累计的平均值的变化,再结合行情的涨跌,我们就可以分析这些日内资金它当天的盈亏状况,分析这个盈亏状况之后,我们可以设定在某些特定的时间和价格点预判它回头某一些价格线。比如说开盘的时候,它就是要杀进去,它杀进去的时候,因为你现在要进盘,你是要选择一个方向,他可能是要做多或者做空的。或者说尾盘的时候他就是要平出来的,那尾盘平出来的时候,假设你今天赚了很多,他就不管那么多了。假设今天是一个单边行情,这个时候它为了出场,就是说它的量也增大了,它为了出场,它可能就不计划成本,大幅度平仓,结果导致尾盘那时候要大幅度的回调。这就是我们观察到这样的现象之后,可以去认为有这样的价格行为存在。那么从博弈层面上来讲,它就是一个资金的争夺,然后产生均衡的一个特征。 那么这个事情我们怎么做呢?我们有这样两个简单的公式。一个W,这个P就是说在某些特征的时间和价格点,它的价格会出现的一个变化,就是一个变化量。那么这个时间点和这个价格点是什么?这是我们根据逻辑分析自己来定的,比如说开盘的时间,比如说收盘的时间,比如说某些整点,整数点位,包括整点的时间,因为很多人做日内交易,他可能会用5分钟线或者用3分钟线。那么你在05分的时候,10分的时候,15分的时候,在15分那根K线收盘的前后几秒钟时间之内,他的这种价格预判的行为特征可能会比他在2分、1分、3分、4分的时候那种行为要更强。我们就可以对这些时间点进行比较。还有就是价格点,比如说当天的高点,当天的低点,或者是当天持仓达到的某个量,这个量是根据什么?是根据它历史上的平均值或者是根据它的盈亏值来算它的一个量,这个量还算到一个点,然后定义了这样的时间点和价格点,我们再去计算在这个点,当天的日内资金它的盈亏状况,然后来预判它到了这个点之后的累计盈亏,有了这样的盈亏之后,它的价格行为,它对价格的影响行为是什么?就是这个ΔP。根据这样的逻辑分析来定义W的计算方式之后,SF怎么办?这是最关键的。F,后来我们想了想,可能用分类器最合适。就是因为我们能用的数学工具,我简单提一下。比如说用回归也好,用什么也好,在这个时候可能都不是特别合适。可能用分类器,就是说我对这样的价格,在这样的时间点,在这样的价格点,它的价格行为我去做分类,看能分成多少个点,哪些类是我们有可能去进行盈利的这些类别。最终做下来的结果,它有高频交易的特征,但是它不是一个高频交易,它只是说持仓时间比较短,因为它每天能够产生这样机会的时间点和价格点不多,有的时候因为整体价格行情没有实现的条件,所以最终可能还没有这样的机会。这个是我提取出来的,我们程序做它的结果,总共可以分出十几个类,有交易价值的大概有四五个类,有其他一些类别,它可能就做不了交易。所谓的做不了交易,就是说它的ΔP的价格变化不足以覆盖交易成本,只有其中的一部分,四到五种可以覆盖交易成本,这四五种是可以做的。这个曲线是其中的几种叠加的一个结果,大家会看到,这个横坐标是日,就是每天。我这里没有画具体的每笔交易,只是把每日的资金画出来。大家看,它的资金曲线还是比较平稳的。大家说,你这么平稳的资金曲线是不是事后优化出来的呢?这不是事后优化出来的,因为我们对这样参数的训练,它不是一个是用样本以外数据来做出来的,这个曲线是一个样本外的数据。 那么这个理论存在的问题是什么?就是数据质量的问题。我以前也做量化,但是以前做量化,说白了是在TB上,在时间和月上来做的,现在真正开始深入Tick数据来做量化的时候,发现有很多人,很多公司号称我们有Tick数据,积累了很多,我也去找这些公司去要Tick数据拿过来,最后发现它的质量差。这个质量比较差,就是有的时候它会丢数据,有的时候数据会不准确,那么这个会给我评判一个模型带来的影响很大,我们现在是处于大数据时代,大家要得出这样的结论,尤其是我们做量化,用这样的模型,你要投资结论最关键的,数据要准确才能得出正确的结论,数据不准确得出来的可能都不好,所以Tick数据对我们来说是一个比较麻烦的问题。尤其是还有一个问题,Tick数据的时间,因为交易所发出来的Tick数据它没有时间戳。 这里只给出了这么一个简单的案例,有很多工作也还在完善的过程之中,希望以后再有机会给大家分享更多的案例。在做这个工作过程当中,有很多常用的数学工具,用到最多的就是统计推断和积极学习,其实积极学习它本身就是用了很多统计推断的内容。这里面用得最多的一个是分类,一个是回归。分类是这样的,如果我们做量化,通常我们都是根据逻辑分析也好,根据历史数据也好,其实你是有一个隐含的假设,假设是什么呢?假设我们这个市场是存在规律的,如果不存在规律,就是说如果是按照那种被动投资的概念,认为α=0,那么可能我们也不来做这件事情,所以我们是在这样的假设基础之上。但是这个世界又是如此的复杂,如此的不同,每一片树叶,每一个人和别人都是不一样的,每一个价格的行为它可能,就是这个价格背后有无数的动机,价格的每一跳它可能都是由不同的因素构成的。那么在这么复杂的情况下,然后我们又要假设它有规律,那这个时候怎么办?这个时候分类是一个很好的工具,这个工具就认为即使每个人,每个个体是如此的不同,但是他们终究会有一些共同的特征。比如说像人类,人类中每一个人和别人都不一样,你有不同的个性,长相各方面都不一样,但是我们终究会形成黄色人种、黑色人种,总之在这种外形特征上会相同,然后大家会发现杭州人和上海人,还有和北京人会有一些不同的特征。即使个体的特征差异很大,但他总体上还有些共同的特征,所以像之前提到分类这种工具,它一定可以作出一些东西。 还有是回归,就是我说的刚才假定用我们的公式找不到数据,回归公式里面的参数做一些估计。还有工具,比如说蒙特卡罗模拟。刚才冯总也提到了,我们是要面对未来去做数据,做策划,你如果重视对历史数据这一块的话,未来会表现什么?不知道。那么我们用蒙特卡罗模拟模拟个几十万次、上百万次,那么对于未来模拟这么多次,我们可以预判一个策略在未来的表现到底会怎么样。那么还有一些会用到一些流动性理论,但是这些理论有的会有点用处,但是有的因为学术界的很多朋友可能是是脱离现实的,我们只能说借鉴他的思想,然后看有没有什么值得借鉴的东西。 这里同样是这些工具,像上午丁博士也讲了,那个CAPM就是传统的资本资产定价,还有APT套利定价这种概念,它的出发点是认为这个市场α是等于零的,在这种情况下,他用到这些工具来做这些事情,那么这本书我相信大家可能都知道,叫做《积极型投资管理》,这是上午丁博士讲的巴克莱他们的人写的。另外来讲,我们在国外,如果是CAPM里面,它就是标准普尔500这样的基准,很多时候可能是我们自己定义的一个市场组合的一个基准,那么你对量的基准,它的预期就是EαP,就是αP的一个期望值,所有期望值是零。然后这个依次,因为它本身也是一个白噪音,所以它也是一个期望值为零的,最终的结果认为说只能去做这个βP。就是你要赚钱更多的钱,你只能去承担更多的风险。但是在这本书里面,就是积极投资组合管理里面,我们借用了这样的工具之后,它在这样的工具基础之上,相信这个αP有机会大于零,因为说这个αP它总是等于零的,如果是这样假设,那么我们这些人都不用干了。它认为这个αP有机会大于零,那么最终怎么办呢?怎么来衡量我们到底有没有这个α?就有这样的公式,一个信息系数IC乘以一个BI,BI根据数据推导得出来的是一个平方根的关系。这个IC是什么意思?IC是我的一个预测,我的事前的预测和我事后的实践结果之间的一个相关度。假设我事前预测,每次预测到了事后实践,比如说我事前预测这次能赚100块钱,事后实践的结果是赚了99块钱,这个相关度非常高,这就表现出来你的预判能力很强。第二就是这个BI的市场宽度,市场宽度的含义,就是说我的交易机会越多,凡是我有这样的预判能力的时候,我的交易机会越多,最终我的Information,我的信息这种概念就越强,α强度也就越强。说白了它的这个含义就是,我要是有预判能力,我就要把我的预判用得越来越好,用得越多,这样结果就越好。这个含义的意思是说同样是这样的一些数学工具,我们可以用这样的数学工具做出来α大于零的这种结果。 最后来讲一讲关于优秀模型的特征。什么样的模型是一个优秀的模型呢?我觉得就是深刻的洞察力加上简洁的量化实践。在《数学之美》这本书上,我相信很多人可能都看过这本书的,吴军写的这本书。他有一个例子来解释行星运动的一个轨迹,托勒密当时提出来“地心说”的时候,因为他是用一个标准的圆,因为在古代的时候,人们认为圆是一种最标准的运动,他用圆来解释这个行星的运动轨迹,但是实际上大家知道,行星的运动轨迹不是一个标准圆,所以他没办法,他只好用大圆套小圆,说白了,就是一个大圆里面套一个小圆这样来逐步的接近,来精确化一个行星的运动轨迹。这个模型其实是非常精确的,因为我们现在用的一个日历四年一个闰年,每个闰年的2月份要加一天,然后每100年,到了一个世纪的最后一年,他就把这个闰年给它砍掉,然后每400年又插回来一个闰年。这种行为是干什么?就是为了纠正像这样的模型,因为这个模型精确度相当的高,但是它不是百分之百的精确,它一定有误差,而这个误差项怎么来纠正?它是通过这样的一种,因为我们去计算行星的轨迹的时候,就可以来预判地球的日历周期,它其实是一个非常精巧的模型,但是它错了,大家都知道它错了,所以后来哥白尼提出来说“日心说”,但是他的日心说仍然使用的是这种圆的标准和圆这样的工具,没有脱离大圆套小圆的工具,所以他的日心说提出来以后,他得出来的结果并不比托勒密的地心说和他的结论更好、更清晰、更明确,然后再加上那个时代,他用这种日心说又违背了宗教的舆论,所以他最后被人搞死了。所以即使你的概念准确了,但是你的这种模型如果不是一种简洁的实现,最后开普勒来提出了一个椭圆模型。椭圆模型很简单,就是以太阳为核心,然后这个运动轨迹是椭圆的,行星的运动轨迹都是椭圆的,这样一下子就把这个精度问题彻底的解决掉了,那么这样一个模型,它其实就是一个深刻的洞察力加上简洁的量化实现的。哥白尼的日心说,他也算是有洞察力的,但是他的这个量化实现不是那么简洁的。当然,最后还有一条提出来,简洁其实并不等于粗糙,也许大家有的时候可能会认为简洁就是一种简单,好象是我只用了两句话可以把这个条件表达出来了,但其实也不是这么简单,所以简洁并不是粗糙的一个同义词。 最后再提一下使用的软件平台,这是我自己在做的过程当中所使用的软件平台,也许对大家会有点帮助。因为大家在做的过程中都会用到很多,一个刚才前面讲的数学工具,一个是软件。那么这个软件,大家都期望会有一第三方平台,其实第三方为了满足公众的需要,所以它很难实现个性化的满足。我自己使用的这个平台,比如基础数据库Mysql,然后行情数据像HDF5这样,大家可以用KTB+,KTB+可能效率更高,但是HDF5它是一个免费的,所以各方面的结果就比较简单。 对于策略本身的风险测算、策略的分析,策略的匹配,大家可以用Python、R、Excel这样的一些常用的工具。监控可以用C++来写,然后策略的进化本身也可以用TB来做。可是有些模型,假设我用Matlab做出来之后,,然后我要去做交易,我发现用TB就可以实现,那我就直接在TB上写出来去做就可以了,我没必要说为它再去写一个独立的平台。因为写一个平台,大家都知道这个成本、时间投入可能是得不偿失的,所以就是我刚才讲的,大家不要忘记我们是是在做投资,而不是在做量化,我们是量化这个工具在做投资,所以工具怎么快捷、怎么方便,怎么有效率,就怎么用这个工具。 最后几句结束语,其实也是提醒我自己,就是不要忘记投资的目标是规避风险,获取收益,也不要迷失在量化的技术泥潭里。因为量化这件事情深入做下去,大家就会发现没完没了,永远都没完没了,就好象要把整个世界都研究清楚,就像好多做期货的人做到最后,就变成科学家了,或者就变成民科了,你又不是那种正经的科学家,你就变成什么都懂一下,但是什么都深入不下去,变成那种情况了。所以大家不要迷失在量化的泥潭里面。也不要忘记这个世界的复杂,是极其复杂的,我们简单的想法,你看到一个铜,这个铜就能赚钱,一定是错的。然后,优秀模型它一定是深刻的洞察力加简洁的量化实践,没有什么模型可以代替这个洞察力。所以大家不要以为,我做量化,搞一个模型极其复杂,我从那里学来一个什么东西,这个工具极其复杂,你要拿这个东西来做,搞不好可能就不赚钱,他也不会搞。任何模型都要有个噪音分担,因为我们模型都是对世界的精简,你一定忽略掉了一些和你这个想法不相关的因素,那些因素就是噪音的来源,所以你一定要和噪音去抗争,要和噪音抗争,它适度的复杂化和精细化是不可避免的。大家可以提高模型,说这里面也很难受,就是我到底要把它做复杂,还是到底不把它做复杂?把它做复杂,好象是它又好象赚不到钱,但是不把它做复杂,它好象又对付不了噪音的影响,这是一个矛盾。 今天就讲这么多,谢谢大家! 期货中国刘健伟编辑整理 七禾网期货中国注:成绩代表过去,未来充满挑战 责任编辑:刘健伟 |
【免责声明】本文仅代表作者本人观点,与本网站无关。本网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
本网站凡是注明“来源:七禾网”的文章均为七禾网 www.7hcn.com版权所有,相关网站或媒体若要转载须经七禾网同意0571-88212938,并注明出处。若本网站相关内容涉及到其他媒体或公司的版权,请联系0571-88212938,我们将及时调整或删除。
七禾研究中心负责人:刘健伟/翁建平
电话:0571-88212938
Email:57124514@qq.com
七禾科技中心负责人:李贺/相升澳
电话:15068166275
Email:1573338006@qq.com
七禾产业中心负责人:果圆/王婷
电话:18258198313
七禾研究员:唐正璐/李烨
电话:0571-88212938
Email:7hcn@163.com
七禾财富管理中心
电话:13732204374(微信同号)
电话:18657157586(微信同号)
七禾网 | 沈良宏观 | 七禾调研 | 价值投资君 | 七禾网APP安卓&鸿蒙 | 七禾网APP苹果 | 七禾网投顾平台 | 傅海棠自媒体 | 沈良自媒体 |
© 七禾网 浙ICP备09012462号-1 浙公网安备 33010802010119号 增值电信业务经营许可证[浙B2-20110481] 广播电视节目制作经营许可证[浙字第05637号]