如有帮助欢迎下载支持
第九章 典型相关分析
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设X(1)(1)(X1(1),X2,(1)(2),Xp)、X(2)(X1(2),X2,(2),Xq)是两组相互关联的随机变量,
分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使是原变量的线性组合。
(i)(1)(i)(1)(i)(1)(i)(1)UaXaXaXaX i1122PP (i)(2)(i)(2)(i)(2)(i)(2)VbXbXbXbX 1122qq i在D(a(1)X(1))D(b(1)X(2))1的条件下,使得(a(1)X(1),b(1)X(2))达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
9.2 什么是典型变量?它具有哪些性质?
答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。具体来说,
X(1)(X(1),X(1),,X(1))、X(2)(X(2),X(2),,X(2)) 12p12q(i)(1)Uia1(i)X1(1)a2X2(i)(1)aPXPa(i)X(1)
(i)(2)Vib1(i)X1(2)b2X2(i)(2)bqXqb(i)X(2)
在D(a(1)X(1))D(b(1)X(2))1的条件下,使得(a(1)X(1),b(1)X(2))达到最大,则称
a(1)X(1)、b(1)X(2)是X(1)、X(2)的第一对典型相关变量。
典型变量性质:
典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。 1. D(Uk)1,D(Vk)1(k1,2,,r)
Cov(Ui,Uj)0,Cov(Vi,Vj)0(ij)
i02. Cov(Ui,Vj)00(ij,i1,2,(ij)(jr),r)
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
1
如有帮助欢迎下载支持
9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的p对典型变量。分析原始变量与典型变量之间相关性。
内容:
U1V1a(1)b(1)UV(2)(2)ab2 B* U V2 令 A*(p)(p)UabpVpUA*X(1)VB*X(2)
其中A*,B*为p对典型变量系数向量组成的矩阵,U和V为p对典型变量组成的向
(1)*(1)(1)*量。则Cov(U,X)Cov(AX,X)AΣ11
Corr(Ui,X)(1)kCov(Ui,Xk(1))D(Ui)D(Xk(1))Cov(Ui,X)D(Xk(1))(1)(1)k1/2Cov(Ui,kkXk(1))
这里D(Ui)1,D(Xk)kk。记V111/21/2为对角元素是kk
1/2的对角阵,所以有
1/2(1)RU,X(1)Corr(U,X(1))Cov(U,V11X)1/2(1)1/2Cov(A*X(1),V11X)A*Σ11V11类似可得:
1/2 RU,X(2)A*Σ12RV,X(2)B*Σ22V22V212/ 2 RV,X(1)B*Σ21V111/ 2对于经过标准化处理后得到的典型变量有:
***RU,Z(1)A*ZR11; RV,Z(2)BZR22 RU,Z(2)AZR12;RV,Z(1)BZR21
对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。 答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为tr(R11)p,第二组变量样本的总方差为tr(R22)q。
ˆ*和Bˆ*Z(1),ˆ*是样本典型相关系数矩阵,典型系数向量是矩阵的行向量,UˆAAzzzˆBˆ*Z(2)。 Vz前r对典型变量对样本总方差的贡献为
2
如有帮助欢迎下载支持
ˆaˆaˆaˆtr(a(1)(1)zz(2)(2)zzˆaˆ)rz2(1),Uˆ a(r)(r)zzrpˆ(1)bˆ(1)bˆ(2)bˆ(2)tr(bzzzzˆ(r)bˆ(r))r2(2) bˆzzz,Vi1k1Kii1k1qrki则第一组样本方差由前r个典型变量解释的比例为Rdz(1)|Uˆrri1k1rp2(1)ˆzk,Uipq2(2)ˆzk,Vi
第二组样本方差由前r个典型变量解释的比例为Rdz(2)|Vˆri1k1q
9.6 设X和Y分别是p维和q维随机向量,且存在二阶距,设p≤q。它们的第i对典型变
(i)b(i)Y,量分别为aX、典型相关系数为i,(i1,*令XCXl,Y*DYm,,p)。
其中C、D分别为pp,qq阶非奇异阵,l、m分别为p维、q维随机向量,试证明
1(i)*1(i)***⑴ X、Y的第i对典型变量为CaX、DbY。 1(i)*1(i)*⑵ CaX与DbY的典型相关系数为i。
9.7 对140名学生进行了阅读速度x1、阅读能力x2、运算速度y1和运算能力y2的四种测验,所得成绩的相关系数阵为
0.030.240.5910.0310.060.07 R=0.240.0610.2410.590.070.24试对阅读本领与运算本领之间进行典型相关分析。
解:根据已知可得
==计算得
= =的特征值为
3
提取第一典型变量为
如有帮助欢迎下载支持
其中
,
分别为原始变量
标准化后的结果。
按照常识,不应该有负数系数啊?不知道怎么回事。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。44名学生的成绩如下表:
闭卷 力学 物理 77 75 63 51 62 52 50 31 44 62 44 12 54 44 46 30 40 36 46 42 23 41 代数 开卷 分析 统计 闭卷 力学 物理 63 55 53 59 55 65 60 42 31 49 49 54 18 32 46 31 56 45 40 48 46 代数 开卷 分析 统计 X1 X2 82 73 63 67 60 50 55 69 46 61 58 49 56 52 69 27 59 56 60 55 63 X3 67 71 65 65 58 60 60 53 61 52 61 56 55 65 50 54 51 57 54 59 49 X4 67 66 70 65 62 63 55 57 53 57 62 63 47 61 50 52 61 45 49 49 53 46 X5 81 81 63 68 70 54 63 76 53 45 45 67 53 36 35 45 61 51 32 33 44 34 X1 X2 78 72 61 70 72 67 63 69 49 41 53 53 44 45 49 42 40 42 63 48 52 X3 80 63 72 68 60 59 58 56 61 62 61 49 46 50 49 53 48 56 55 53 49 53 X4 70 70 62 62 62 56 54 55 63 49 62 59 57 57 59 54 54 56 54 51 41 X5 81 68 73 56 45 44 37 40 45 62 47 44 81 37 68 5 40 25 37 40 试对闭卷(X1,X2)和开卷(X3,X4,X5)两组变量进行典型相关分析。
9.9 邓讷姆(Dunham)在研究职业满意度与职业特性的相关程度时,对从一大型零售公司各分公司挑出的784位行政人员测量了5个职业特性变量:用户反馈、任务重要性、任务多样性、任务特性及自主性,7个职业满意度变量:主管满意度、事业前景满意度、财政满意度、工作强度满意度、公司地位满意度、工种满意度及总体满意度。两组变量的样本相关矩阵为:
1.000.49ˆR110.530.490.511.000.430.27ˆ0.24R220.340.370.401.001.00 0.571.000.460.481.000.530.570.571.00 1.000.351.000.590.311.000.331.000.260.251.000.540.460.280.320.290.580.450.300.274
如有帮助欢迎下载支持
0.330.30ˆˆR12R210.310.240.380.320.200.190.300.370.210.210.160.080.270.350.200.230.140.070.240.370.18
0.220.120.190.210.290.160.320.170.230.320.360.27试对职业满意度与职业特性进行典型相关分析。
9.10 试对一实际问题进行典型相关分析。
5