1. 研究目的与意义
金融范畴中受到关注的一个重要问题是投资组合管理。由于金融市场上股票收益率具有很强的共线性,传统的 Markowitz 均值方差模型构建的组合并不稳定,且在构建股票组合时没有考虑交易成本的影响,同时在使用实际数据时很容易使得出的股票组合中含有很大的空头头寸。针对上述问题,一种有效的解决方法是应用高维变量选择方法选择股票构建组合进行投资。传统的子集选择法是较为经典的高维变量选择方法,但该方法受实际数据的局限。较子集选择法更稳定的方法是岭回归,但岭回归只能压缩系数,不能将变量系数收缩到零,达到完全剔除变量的目的。高维变量选择的流行方法为Lasso 算法,它不仅克服了上述子集选择和岭回归的各种缺点,而且运算简单、可以同时完成投资组合中成分股的选取与权重系数的估计问题,所以被优先使用在指数跟踪领域的变量选择中。
2. 研究内容和预期目标
研究内容: lasso、adaptive lasso、relaxed lasso 三种方法的相关理论,比较他们的优缺点, 及lasso类方法的算法在matlab中的实现。
关键问题:lasso类方法的跟踪效果及matlab的具体操作。
写作提纲:前言
3. 国内外研究现状
我国指数化投资的发展历史较短,这方面的研究比较少。严武[1]等人(2000)对指数跟踪方法进行了详细的介绍,将其系统的划分为三类:完全复制法、抽样复制法、优化复制法;倪苏云[2]等人(2001)年提出了四种基于跟踪误差最小化的线性函数,并给出了相应的求解办法;陈辰[3]等人(2001)将聚类分析和多元时间序列模型应用于指数跟踪问题,取得了较好的跟踪效果;李俭富[4]等人(2006)提出了基于证券价格时间序列的协整优化指数跟踪方法;杨国梁[5](2009)将支持向量机方法运用于金融市场的指数追踪中,也是一次较好的尝试;刘磊[6](2010)提出了基于遗传神经网络的指数跟踪优化方法。
股票指数跟踪技术主要需要解决两方面问题,一方面需要选取组合中的成分股,一方面需要确定成分股在组合中的权重。Tibshirani[7](1996)提出了 Lasso 方法,其思想是在最小二乘的基础上,增加了L1 惩罚项,这样就同时实现了变量筛选和参数估计,Efron[8](2004)提出了最小角回归算法,将 Lasso 方法的计算问题解决了,因此 Lasso 方法得以广泛传播,许多基于 Lasso 的改进方法也不断被提出。然而 Lasso 方法本身就存在一些缺陷,首先若股票收益率数据存在严重共线性时,Lasso 的选择效果被削弱;其次 Lasso 方法并不具有 Oracle[9]性质,而具备 Oracle 性质可以使得系数向量更接近真实值,且估计具有渐近相合性。Zou(2006)[10]提出的 AdaptiveLasso 与 Meinshausen[11](2006)提出的 Relaxed Lasso,二者都可以看成一个“两步法”Lasso,不但沿袭了 Lasso 方法的诸多优点,而且能有效减少模型参数估计的有偏性,具有 Oracle 性质。
4. 计划与进度安排
2022年12月9日前:撰写开题报告
2022年12月9日—2022年2月15日:阅读有关指数跟踪和lasso类方法的文献,翻译相关的外文文献,理解lasso类方法的各种详细内容和应用
2022年2月16日—2022年2月29日:对前期所有阅读资料书籍进行分类整理,提取最终论文所需的信息和资料
5. 参考文献
[1]严武,洪道麟.我国指数基金运作与绩效研究[j],统计研究,12,2000.
[2] 倪苏云,吴冲锋.跟踪误差最小化的线性规划模型[j],系统工程理论方法应用,2001,10(3):198-201.
[3] 陈辰.指数证券组合模拟市场指数的聚类和 mtv 方法[j],管理工程学报,2001,15(4):23-27.
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。