前言
多因子模型是量化的一个核心概念,
基本概念
因子、因子收益率、因子暴露
这些概念,讲的最好的还是石川老师的那本《因子投资方法与实践》,夸他,不是因为他写的好,而是,写的比别人好。他写的其实也一样,比较晦涩,但是,至少静下来心来看,是可以捋清楚,至于别人的,呵呵了就。
这里我抛开各种基础引子,直奔主题,不是给新手看的,谅解。建议对着石川老师的书对照看和理解。
P34页的
解释一圈:
- ,是说第i只股票的收益,是可以被上式解释的
- 是股票i的K维引子暴露向量,讲人话,你别K维减少1维度(也就是1个因子),那这玩意就是一个数,但是,你注意,它有个下标i,对,他指的就是这只股票的因子暴露,就是咱们天天挂嘴边的因子,比如市值因子,就是招商银行的因子暴露(当然是某一天的)。’是转置。
- ,这个,就是因子收益了,他说是K维,你也简化为1维(1个因子)就好理解了
所以,上式,就是你最常用的那个回归,就是你知道了这只股票的收益,然后,你还知道了他的因子暴露,然后你可以通过回归去求出未知的和因子当期收益率。
这个是描述了1个股票的1个时间点(),但是,你肯定没法做回归啊,你至少需要一堆的点,才能做回归,做最小二乘法。
那一堆点,就是把,从1个,变成50个,从1只股票,变成50只,100只,甚至3000只,这样,就可以回归出来了,对吧?
这里,再强行插入解释,你用50只的因子和股票收益,回归出来了因子收益率和,你只是回归出来了1个时间点的。你还可以再往下一期,又可以回归出来下一个时间点的,所以这些回归出来的,就组成了一个跟股票们同步的时间序列,即,因子收益率的时间序列,这个时候,你最好管他们叫。
时间序列回归
好,下面我们接着上面的,说回归,说最小二乘,那么,就需要应用P36的式子
我这里必须要自我检讨一下,
我开始以为,用因子值,去,截面回归,股票收益率,比如我有50只股票,他们的市值大小就是他们的市值因子,我管这个市值因子叫因子暴露, 有了因子暴露,我就用他按照上式,去回归,,,我回归,就可以得到因子的收益率,即。 听上去很完美,但是,我有一点说服不了自己,就是,石川的给出的上式中,即p37页上半部分,说
在时间序列回归中,回归方程右侧的自变量是因子收益率,左侧的因变量是,回归得到了资产在因子上的暴露向量。
纳尼?!不对啊!市值就是这个变量的因子暴露,它就是已知值,而因子收益率是我要回归求的啊,是未知的啊?!我理解错了么?
事实是,我确实理解错了,彻彻底底的错了,非常之惭愧,学业不精啊。
我又回到了P27页,再次回顾,什么是因子收益率,27页的例子,以价值因子为例,描绘了什么是因子收益率。
我们一起读读这段:
通过做多BM最高的一组(即High组)、做空BM最低的一组(即Low组)构建兼职因子投资组合,给出了对价值因子预期收益率的检验结果。
我们在读一段P25页的这段:
由构建方式克制,价差组合中多、空两头的收益率分别为变量取值最高的1/L股票的收益率和变量取最低的1/L股票的收益,他们的差异就反映了围绕该变量构建的因子的收益率。因子,价差组合正是使用排序法构建的因子模拟投资组合,而价差组合的收益率正是该因子的收益率。
我的天哪?!原来,这才是因子收益率的完全体和真身啊,我之前一直自以为是的理解错了。鄙视一下自己吧,55555555
这里,再插入一下这里提到的“模拟投资组合”,定义在P22也的2.1.1节,因子模拟投资组合就是这个组合在其他因子上的暴露为0,且,这个投资组合的特异性风险最小。啥意思?讲人话吧,就是,这个组合最能代表这个因子。啥叫最能?就是:每个股票的风险暴露,在别的因子上,求和都为0,那,K个因子,就只剩这个了;特异性风险,说的就是残差,也就是因子解释不了的部分,这个残差也要尽量的小。
上述之后,我想,我自己是明白了,为何,有这样一个多减空,就可以代表这个因子了,原因是,他用投资组合,模拟了这个因子。
IC、RankIC、IR
前面谈过,咋看一个因子有效,最直白的办法,就是用股票的当期因子可以线性回归出下一期的收益来。 比如我用3只股票的当期因子,居然可以线性回归出来,下一期的收益率来,那就牛逼了。 我就能预测未来了呀。可惜,没这种好事。 你要是能做到,大致了解他们只有有线性相关性,就已经很牛逼了。 那怎么判断他们之间的线性相关性呢?相关系数呀。所以就引出了IC、RankIC和IR。
IC:
IC其实就是因子值,和,下一期的收益之间的相关性(相关性其实就是看是不是线性相关,1是完全正线性相关,0完全不线性相关)。 IC每一个调仓期,就会有一个IC值。 比如你有3只股票,就有3个当期因子值,然后你还会有下一期的收益值。3个当期因子值vs3个下期收益值。 然后你就可以算一个相关系数了吧,对,这个就是IC。 一般IC均值能大于0.02就靠点谱了,如果IC均值大于0.05就很牛逼了。
RankIC:
有时候,你更想定性,看看因子是否和收益相关,想更鲁棒性,所以他们就想到,咱别看具体的因子值和收益值了, 咱们看他们的排名,比如3只股票的当期因子值排序是1、3、2,下期的收益排序是3、2、1, 那么我们算算这两个序列的相关性呗。这个值就是RankIC。
IR:
所以IC是一个值,你一期一期的算,就得到了一个IC的序列,对吧:IC1、IC2、...ICN。 然后你求个 ,对,均值除以标准差,这玩意就是IR。 其实就是看看IC们是不是稳定。
参考:https://bbs.quantclass.cn/thread/23991
因子挖掘流程
因子开发平台
在线平台
开源项目
参考
参考书
- 《因子投资:方法与实践 - 石川》,石川大神的书,非常全面详细,值得一啃。
- 《实证资产定价:股票横截面收益 - 图兰·G.巴利(Turan G.Bali)》,经典的多因子教材,很严谨的学术书。
参考视频
- 量化金融网课 - 多因子模型,孙见老师的讲解视频,很清晰。
- Alpha策略-因子选股,有用学院的培训视频,讲的很不错,可惜整套课太贵了,2480,有用的就多因子这2节。
- 国信证券邀请复旦大学的陈学彬教授讲的7节量化交易课,深入浅出,挺好的。
- 多因子模型 量化套利定价理论APT详解,赛科思学做的讲座,简短适合入门。
- WQFA量化投资线上沙龙系列
收费视频
- 收费视频:网易2019年最新微专业 - 成为AI量化交易精英视频教程
- 收费视频:腾讯课堂 - 30天名师带你玩转AI量化算法, 助你成为金融IT复合人才
- 收费视频:腾讯课堂 - 量化投资 - 单因子分析精讲
好文章
- 石川大神的知乎专栏:川流不息 ~ 分享量化投资技术与实证心得
- 量化系列文章目录,非常棒的一个索引文章,涉及到很多内容。
- QUANTAXIS,一个非常棒的完整的量化策略开源框架
- 多因子模型的步骤梳理(以打分法为例)
- 因子的评价体系和IC、IR
- 追寻因子的足迹:分类、构造与检验
- CSDN小白的量化实战讲解
- 知乎 '文兄':【多因子模型】Barra模型讲解(1)
- 知乎 量化交易与机器学习(四):如何研究alpha因子
- 知乎 Python与量化多因子——基于回归的归因
- 知乎 mathquant 量化投资
- 经管之家 - 交易策略 - 单因子测试框架分享
- Quantopian公司开源的量化因子分析框架Alphalens
- 聚宽的单因子分析和多因子策略入门
- [知乎专栏:量化日记]https://www.zhihu.com/column/c_1250496736792838144): 多因子选股(一):试试多因子模型吧, 多因子选股(二):如何构建多因子模型呢?,多因子选股(三):用市值规模来选股可行吗?
- 量化多因子投资在海内外的发展历史漫谈,很八卦
- 多因子模型建立方法
- 马来西亚小伙写的一个关于金融量化的电子书
- 【量化投资入门 2】量化投资是什么?
- 关于投资组合的一些想法:这个文章很棒,给我了一个大体的思路
- 基金能跑赢大盘么?基于中国市场的量化检验
- 为什么说数理金融学是伪科学,这个完全否定了西方的投资学,有时间一定再回来研究一下;还有这篇,差点令金融世界崩塌的数学公式
- 【国君策略】收益、风险、因子:大类资产配置框架与变迁
- (万字干货转载)量化投资的方法论
- 万矿2018年末巨献——全球量化嘉年华(线上)
- 因子评估全流程详解
- 交易策略 单因子测试框架分享
- 多因子基础及流程学习
- 多因子模型建立方法
- 【因子投资笔记01】多因子模型体系总结
- 多因子模型的步骤梳理(以打分法为例)
- 追寻因子的足迹:分类、构造与检验