您好,欢迎来到保捱科技网。
搜索
您的当前位置:首页因子分析和聚类分析在金融业股票投资中的应用

因子分析和聚类分析在金融业股票投资中的应用

来源:保捱科技网
因子分析和聚类分析在金融业股票投资中的应用

谢桂标;许姣丽

【摘 要】文章以金融业的50家上市公司为研究对象,选取10个重要的财务指标进行投资分析.首先利用因子分析进行降维处理,然后利用聚类分析把50家上市公司分成4类,在此基础上得出各类的主因子得分情况和平均综合得分情况,最后根据所得数据客观评价每类上市公司的综合情况,为投资者提供选股建议. 【期刊名称】《沿海企业与科技》 【年(卷),期】2016(000)004 【总页数】6页(P11-16)

【关键词】因子分析;聚类分析;股票投资 【作 者】谢桂标;许姣丽

【作者单位】五邑大学经济管理学院,广东江门,529020;五邑大学经济管理学院,广东江门,529020 【正文语种】中 文 【中图分类】F832

现在中国的股票市场已经成为人们投资理财的重要场所,但股市有风险,入市须谨慎。刚过去的2015年的中国股票市场注定令众多投资者难忘。年初开始放量上涨,继而出现千股涨停,万亿交易额的汹涌景象,转而年中闪电熊杀至,千股跌停千股停牌,人们用惊心动魄来形容仅仅几个月就经历了一次大起大落的中国股票市场。股市的起伏不定告诫投资者要谨慎选股,理性投资对于规避股票市场的风险很有必

要。然而面对股票市场的上千只股票如何选股对投资者来说却是个难题。每只股票都有很多指标与之相关,人们在研究股票时也希望尽可能多地收集相关变量以期望对股票有比较完整的把握和认识,但数据过多会导致分析工作量庞大,且数据之间可能存在相关性导致数据分析的结果出现偏差,变量数量减少又担心导致信息丢失。在多元统计学中有一种方法可以很好地解决数据过多影响研究效率数据过少导致信息不完整的问题,这种方法就是因子分析。

因子分析是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为少数几个因子的方法。这几个因子可以高度概括大量数据中的信息,这样既减少了变量个数,又能再现变量之间的内在联系。所以,应用因子分析投资者可以很好地综合多个指标来比较完整地了解股票的信息。再应用统计分析中的聚类分析,投资者可以在众多股票中根据自身的投资特性减少选股范围以提高投资的效率。聚类分析是基于研究的样本之间存在不同程度的相异性或相似性来研究事物分类的一种方法,它采用数学方法根据样本指标的数值特征来辨别样本之间的亲疏关系,从而将样本进行分类。

已有不少专家学者做过这方面的相关研究。马安丽,吴天瑶,马京丽(2013)把因子分析和聚类分析应用到我国文化传媒板块上市公司业绩综合评价上。通过因子分析把选取的18个财务指标降维为6个公因子,然后利用这6个公因子把35家公司通过聚类分析分成5类,其分类结果能为企业债权人,公司管理层以及投资者提供投资和决策的参考依据。张文琦(2014)选取8个主要财务指标对50只房地产行业股票进行聚类分析和因子分析。其先应用聚类分析把50个房地产公司的股票分为4类,然后再应用因子分析将变量分为4类,通过各个公司在不同因子上的得分与相应的综合实力函数将公司进行排名,所得结果再次证明聚类分析的结论。其研究结果为投资者区分了蓝筹股,普通股和劣质股,对投资者进行房地产股票投资具有很大的参考价值。郝瑞,张悦(2014)选择沪深300指数成分股作

为样本,运用SPSS软件用因子分析和聚类分析方法将样本股票排名、分组,并对各个分组的股票进行特征分析。其研究结果表明:应用这两种方法可以在较低维度综合考虑若干股票分析指标并把股票进行分类,能满足不同偏好的投资者的投资需求。杨林,王天翊,赵桂海(2014)以金融业股票为研究对象,利用因子分析得出体现股票投资价值的四项指标:盈利能力,偿债能力,运营能力和成长能力。运用系统聚类法把45家上市公司分为七类,其研究结果表明银行类股票值得关注、较为安全,为投资者投资决策提供参考。

以上研究结果都表明,把多元统计方法因子分析和聚类分析应用到股票市场中,对不同投资者分析股票以及构建投资组合都有很大的参考价值和指导意义。当前,中国的股票市场低迷,投资者也很希望有科学的方法选出有投资价值的股票来进行投资。本文采用最新的股票市场的财务数据,对投资热门的行业金融业进行因子分析和聚类分析,希望为投资者在现在的市场环境下提供有价值的选股参考信息。 (一)数据预处理

本文的数据来源于金融行业各上市公司2015 年9月30日的财务报告,选取了50家上市公司的10个财务指标进行分析,10个指标分别是:每股资本公积、每股未分配利润、每股净资产、每股收益、加权净资产收益率、摊薄净资产收益率、营业收入同比增长率、净利润同比增长率、资产负债率、总资产周转率。(选取部分数据如附表1)。

这10个指标除了资产负债率是适度指标,其它都是正向化指标。为了提高不同类型的指标之间的可比性,需要将不同类型的指标方向一致化。因此,本文需要将适度指标资产负债率正向化。其公式如下:

公式中b为样本公司适度指标的原始数据值,p是该指标的适度值,b'是转化后的数值。本文的样本选择涉及不同的行业,包括银行、保险、券商等行业,考虑各行业的资产负债率的适度值不同,p值取不同行业资产负债率的平均值。

数据方向一致化后还需要进行数据的标准化处理,以消除变量间在数量级和量纲上的不同。本文采用stata12.0对数据进行标准化处理和因子分析,标准化后数据的描述性统计如表1:

v1-v10分别对应每股资本公积-总资产周转率十个财务指标标准化后的数据。Obs代表样本数量,mean代表平均值,Std.Dev代表标准差,Min和Max分别代表最小值和最大值。

标准化后的数据进行KMO值检验以观察数据是否适合进行因子分析,本文数据总体的KMO取值是0.6229,表明可以进行因子分析。 (二)确定主因子并进行因子旋转

本文采用主成分因子分析法对数据进行因子分析,采用相关系数特征值大于1的标准,从原来的十个指标中提取了四个主因子来表达原数据的信息量。这四个主因子解释的累计总方差达到85.95%,表明提取的主因子涵盖了原变量的大部分信息。因子旋转有助于进一步简化因子结构,为此本文采用最大方差正交旋转变换,得到结果如表2和表3:

表2是因子旋转结果的第一部分,从图中可以看出共有50个样本参与了分析,提取保留的因子共4个,模型LR检验的卡方值为0.0000,模型非常显著。Proportion表示提取因子的方差贡献率,Cumulative表示提取因子的累计方差贡献率。经过正交旋转后的四个主因子累计方差仍然为85.95%保持不变,只是分配在主因子的方差贡献率有所改变,丢失的信息量较少。采用这四个主因子可以代替原来的十个指标对金融行业的上市公司进行评价。

表3是因子旋转结果的第二部分,是模型的因子载荷矩阵,Factor1-4各列分别说明的是旋转提取的主因子对各个变量的解释程度。从中可以看出主因子Factor1主要解释v1、v2、v3、v4这4个变量的信息,因为它在这四个变量上都有较大的正载荷。v1-v4分别对应的指标是每股资本公积、每股未分配利润、每股净资产、

每股收益,这四个指标主要考察上市公司的股本扩张能力,所以Factor1可以命名为股本扩张因子。Factor2在v5、v6两个变量上有较大的正载荷,所以Factor2主要解释v5和v6两个变量。v5、v6对应的指标是加权净资产收益率,摊薄净资产收益率,这两个指标主要考察上市公司的盈利能力,因此,Factor2可以命名为盈利能力因子。Factor3在v7,v8变量有较大的正载荷,v7、v8对应的指标是营业收入同比增长率、净利润同比增长率,这两个指标主要考察上市公司的成长能力,因此,Factor3可以命名为成长能力因子。Factor4在v10变量上有较大的正载荷,v10对应的指标是总资产周转率,该指标主要考察上市公司运营能力,所以Factor4可以命名为运营能力因子。 (三)因子得分

当因子确定后,便可计算各因子在每个样本上的具体数值,这些数值称为因子得分。利用Stata可以求得因子得分系数矩阵,我们可以根据系数矩阵将各主因子用得分系数表示为10个评价指标的线性组合,再代入10个指标的实际数据,就可以计算出每个样本公司的各个主因子的得分。表4是因子得分系数矩阵,据此我们可以写出各主因子的表达式。

Factor1=0.24298*v1+0.211*v2+0.28773*v3+0.279*v4-0.01363*v5+0.01282*v6+0.01217*v7+0.00330*v8+0.00034*v9-0.03720*v10 Factor2=-0.23757*v1+0.09827*v2-0.03853*v

3+0.09915*v4+0.49469*v5+0.457*v6-0.07937*v7-0.00325*v8-0.16014*v9-0.07187*v10

Factor3=0.24085*v1-0.13804*v2+0.00382*v3-0.00346*v4-0.10046*v5-0.01702*v6+0.49002*v7+0.45376*v8+0.234*v9+0.03216*v10 Factor4=0.20033*v1-0.12105*v2-0.04424*v3-0.05669*v4-0.00726*v5-0.07786*v6-0.02957*v7+0.00833*v8-0.46090*v9+0.79819*v10

其中v1-v10分别对应每股资本公积-总资产周转率债率10个财务指标标准化后的数据。

根据各因子的方差贡献率占总方差贡献率的比重作为权重进行加权汇总,可以得到各样本的综合得分F。由图2可知,Factor1的方差贡献率为0.347,Factor2的方差贡献率为0.2036,Factor3的方差贡献率为 0.1967,Factor4的方差贡献率为0.1121,累计总的方差贡献率为0.8595,所以F的计算公式为: F=(0.347*Factor1+0.2036*Factor2+0.1967*Factor3+01121*Factor4)/0.8595

通过以上的因子分析我们得到四个公因子的得分情况,利用这四个主因子的得分情况运用Stata12.0进行Ward联结法聚类分析。根据数据得到聚类分析树状图如图1:

根据图1,把50家上市公司分为四类比较合理,最终的分类结果如表5: 由表5可以看出16家上市银行都集中在第一类,还有一家中航资本也被划分到第一类;第二类的9家上市公司主要是证券行业的上市公司和一家信托业的安信信托公司;第三类的主要是保险业,四家上市的保险公司都集中在第三类,此外还有从事信托,租赁行业的其他四家金融企业也在第三类;第四类的16企业是都是证券行业的公司。

根据聚类分析分类结果,结合各样本的主因子得分情况,得到附表2。

根据附表2,我们可以计算各类上市公司在四个主因子上的平均得分和每类上市公司的评价综合得分情况,见图2:

根据图2各类上市公司各主因子的平均得分情况,得分大于0的为该类的优势能力,得分小于0的为该类的劣势能力,得到结果如下表6:

第一类的上市公司是16家上市的银行和中航资本。虽然此类上市公司在股本扩张能力和盈利能力两方面具有优势,但优势不明显,其在股本扩张因子和盈利能力因

子处得分不高。而在成长能力因子和运营能力因子两方面的得分为四类中最低。企业的成长能力是指企业未来生产经营活动的发展趋势和发展潜能,近两年互联网金融对传统银行业的冲击可谓不小,对银行的发展造成一定的压力,投资者对银行未来的成长发展需要谨慎对待。运营能力的财务指标是总资产周转率,是评价企业运用资产效率的重要指标。银行资金的运转对贷款的回收依赖度很高,2015年银行业坏账增加不时引发社会关注,本文分析所得银行业运营能力偏低也值得引起投资者的重视。第一类公司的平均综合得分最低,建议投资者慎重投资此类股票。 第二类上市公司优势能力是盈利能力、成长能力和运营能力。其中盈利能力因子得分是四类中最高的,表明此类企业盈利能力处于行业领先地位。成长能力和运营能力因子得分都处于四类中的第二位,表明该类企业具有发展前景和稳健的财务结构。虽然此类股票在股本扩张能力因子得分低于0,但总体看来该类企业竞争能力强、发展潜力大、获利能力强、平均综合得分为第一位,所以投资者可以考虑投资此类上市公司。

第三类上市公司的股本扩张能力因子得分居四类的首位,表明该类上市公司对公司业绩增长抱有信心,长远来看此类公司有可能通过股本扩张提高融资能力,改变企业基本面使企业做大做强。此外,该类公司的运营能力因子得分也是四类中最高的,表明该类上市公司运用资本的效率较高。但该公司的劣势能力也比较明显,盈利能力因子得分是四类中最低的,成长能力因子得分也低于平均值,表明该类企业有利润增长和经营发展的压力,所以该类企业在平均综合得分中排第三位,建议投资者短期内谨慎进入,可留意该类公司的长远发展情况。

第四类上市公司的股本扩张能力,运营能力和盈利能力虽然是该类企业的劣势能力,但从因子得分情况看这三个因子的得分略低于平均值,并没有对此类企业造成较大的压力。而且该类企业的成长能力是四类中最高的,表明该类企业未来发展潜力较好,有进一步开拓升级为投资者带来收益的可能,所以其平均综合得分位于第二位,

建议投资者可以关注风险,适当投资。

本文利用因子分析和聚类分析对金融行业的50家上市公司进行投资分析。通过因子分析把10个财务指标降为四个主因子,分别为股本扩张因子、盈利能力因子、成长能力因子和运营能力因子。这四个主因子包含了原数据的85.95%的信息,所以采用这四个主因子可以代替原来的十个指标对金融行业的上市公司进行评价。在通过因子分析得到四个主因子得分的基础上利用Ward链接法进行层次聚类分析,根据聚类分析树状图把50家上市公司分成四类。第一类企业是16家上市银行和中航资本,此类企业在股本扩张能力和盈利能力两方面有优势,但优势不明显,而在成长能力因子和运营能力因子两方面的得分处于行业的低端,平均综合得分最低,建议投资者慎重投资;第二类的9家上市公司主要是证券行业的上市公司和一家信托业的安信信托公司,该类公司盈利能力处于行业领先地位,成长能力和运营能力因子得分处于行业优势地位,总体看该类企业发展潜力大、综合能力强,值得投资者投资;第三类的上市公司包括四家保险公司和几家处于信托、租赁行业的公司,该类公司有较大的发展空间来保证公司为例业绩的持续增长,运用资本的效率较高,但该类企业亦面临利润增长和经营发展的压力,建议投资者短期内谨慎进入,可留意该类公司的长远发展情况;第四类的16企业是都是证券行业的公司,该类企业的股本扩张能力,运营能力和盈利能力接近行业平均水平,而成长能力处于行业首位,表明该类企业未来发展潜力较好,有进一步开拓升级为投资者带来收益的可能,建议投资者可以关注风险,适当投资。

【相关文献】

[1]马安丽,吴天瑶,马京丽.我国文化传媒板块上市公司业绩综合评价——基于因子分析和聚类分析[J].西安工业大学学报,2013,(9).

[2]张文琦.聚类分析和因子分析在房地产股票市场中的应用实证分析报告[J].时代金融,2014,

(8).

[3]郝瑞,张悦.基于因子分析和聚类分析的股票分析方法——以沪深300指数成分股为例[J].时代金融,2014,(9).

[4]杨林,王天翊,赵桂海.金融业股票投资价值分析——以基于因子分析和聚类分析方法[J].中国市场,2014,(10).

[5]周延,郭建林.基于因子分析和聚类分析的寿险公司财务评价[J].华东师范大学学报,2010,(2).

[6]汪海凤,赵英.我国国家高新区发展的因子聚类分析[J].数理统计与管理,2012,(2).

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baoaiwan.cn 版权所有 赣ICP备2024042794号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务