期刊及作者简介
文章摘要用聚类分析方法进行选股时,降维是必然的。考虑到降维方法、噪音交易和市场行情之间的关系,我们实证研究了降维方法:主成分分析、叠层自动编码器和叠层受限玻尔兹曼机制。在不同市场行情下对股票选择的影响。根据指数的波动,市场分为横盘走势和趋势走势。对于沪深和日经成份股,实验结果表明:
(1)在横盘的情况下,降维并不能提高聚类分析的选股效果;
(2)降维的优势主要体现在趋势情况上,但是处于上升还是下降的趋势取决于分析的市场情况。
更重要的是,根据以上研究结果,假设降维效果会持续,我们提出了有降维和没有降维的轮换策略。实验结果表明,所提出的轮换策略优于股票市场指数和基于降维和聚类分析的选股策略。这些发现为如何有效地利用降维方法选择股票提供了实用的见解。
1引言当前已有各种各样的选股策略,包括多因素模型、动量和反向策略、风格轮换策略、波动率策略、行为偏差策略。在这些策略中,研究最多的是多因素模型,主要包括Fama-French三因素模型、Fama-French四因素模型、基于投资者注意力的因素模型以及基于基础分析和技术分析的因子模型。投资者可以利用这些模型从不同的角度分析股票特征。如果股票特征持续一段时间,投资者与随机选择相比,分析股票特征会获得更高的收益。
用聚类分析选择股票吸引了投资者和研究人员的注意。一项针对泰国股市的股票聚类分析发现,使用聚类分析的股票选择收益高于不使用聚类分析的股票。投资者可以根据不同的特征使用聚类分析。有的文章采用基础因素和技术因素的聚类分析对股票进行分类,并分析每个聚类的收益率-风险比。重要的是,投资者可以通过聚类分析发现股票之间的关系。通过关联发现,投资者可以选择多种股票。研究发现,用聚类分析选择股票可以提高投资组合的表现。
聚类分析选股具有以下优点:
(1)投资者或研究者可以利用许多有效的特征来分析股票,进而构建投资组合;
(2)结合股票特征,投资者可以很好地发现股票之间的关系;
(3)投资者可以从不同的集群中选择不同的股票,这有利于降低投资组合的系统性风险;
(4)投资者可以快速计算出对选定股票的配置,而不是市场上所有股票的配置。
在实践中,在高维数据的聚类分析中,维数诅咒是不可避免的。Fulga等人在用聚类分析选择股票之前,提出了主成分分析(PCA)来降低维度的影响,并发现这种策略可以对投资组合优化产生有用的结果。遗憾的是,传统的方法,包括主成分分析、线性局部嵌入LLE和Sammon映射,都存在明显的线性或局部流形关系假设缺陷。基于神经网络的降维方法,如stackedautoencoder(SAE)和stackedrestrictedBoltzmannmachineSRBM,已被广泛应用于图像、语音和金融。这些非参数方法能够学习非线性关系,具有较强的自学习和容错能力,因此利用聚类分析研究非参数方法对选股的影响具有重要和迫切的意义。
然而,在降维、噪声交易、市场波动和市场状况之间存在着复杂的关系。Kirkpatrick和Dahlquist认为,投资者可以通过波动来判断市场状况,波动是由基本面交易和噪声交易的相互作用产生的。我们都知道,降维相当于信号压缩,可以保留主要信息,同时降低数据集里面的噪声。所以我们