您好,欢迎来到保捱科技网。
搜索
您的当前位置:首页统计学专业学生成绩的相关性分析

统计学专业学生成绩的相关性分析

来源:保捱科技网
安徽建筑大学数理系毕业设计

1

安徽建筑大学 业 设 计 (论 文)

统计学专业学生成绩的

题 目 相关性分析

专 业 统计学 姓 名 王志海 班 级 1班 学 号 *********** 指导教师 宫珊珊 提交时间

2016.6.6

1

毕 安徽建筑大学数理系毕业设计

2

统计学专业学生成绩的相关性分析

摘要:当代大学教育逐渐普及,在某种程度上已经失去了精英教育的定位.且随着时代的不同,大学生活变得丰富起来.由此引起的一个问题就是当代许多的大学生对学习失去了兴趣.在这样的背景之下,我们有必要探讨究竟有哪些因素会影响学生的学习成绩.因此本文在已有的大学生成绩的基础上,通过SPSS软件,采用统计学里的方差分析、相关分析与回归分析理论,对影响学生学习成绩的因素进行研究.由于收集的数据所限,本文只对影响学生成绩的课程种类、选课数目、挂科数量、班级四个因素进行相关的分析.首先,整合数据,采用以上提到的统计方法,对相关的因素进行显著性检验,其次,对于SPSS所生成的结果去进行统计分析,判断哪些因素对学生学习成绩产生了显著的影响,影响的程度又如何.研究结果表明:上面的四个因素中,课程种类、挂科数量对2015级统计学专业学生学习成绩的影响是显著的.而对于选课数目、班级这两个因素,通过检验我们发现它们对成绩有极弱的影响,在统计学上,我们可以认为它们与学生成绩之间没有显著的关系.该研究结果可以给教师们一些参考,以便于及时的调整授课方法,也便于教材的筛选.对于学生而言则可以了解自身的不足并加以改正,利于成绩的提高.

关键词:成绩影响因素、相关分析、回归分析、方差分析

2

安徽建筑大学数理系毕业设计

Abstract: the increasing popularity of contemporary university education, in a certain extent has lost the positioning of the elite education. And as the different times, the university life becomes enriched. Caused by a problem is the contemporary many college students to learn lost interest. Under such a background, it is necessary for us to explore how factors which will affect the students' learning achievement. The in based on the existing student achievement, through the SPSS software by statistical variance analysis, correlation analysis and regression analysis theory, the impact on the students learning results were studied. Due to the limitation of the collected data. In this paper, to learn Types of courses grades, the number of course, hanging branches number and class four factors for analysis. First of all, data integration, using the above mentioned statistical methods, on related factors were significant test. Secondly, for the results generated by the SPSS to carry out statistical analysis, judge what factors on students' academic performance had a significant impact, influence and how. The results of the study show that: the above four factors, the types of courses, hanging branches number for the class of 2015 statistics majors learning achievement effect is significant. And for enrollment number, class of this two factors by inspection, we found them on the results Very weak influence, in statistics, we can think their relationship between student achievement and no significant. The research results can give some reference to the teachers, in order to facilitate the timely adjustment of teaching methods, textbook for screening. For students can understand self defects and corrected, conducive to performance improved.

Key words: achievement influence factor, correlation analysis, regression analysis, variance analysis

3

3

安徽建筑大学数理系毕业设计

目录

摘要................................................................ 2 Abstract............................................................ 3 目录................................................................ 4 第一章 绪论......................................................... 6

1.1研究综述..................................................... 6 1.2 主要研究内容 ................................................ 7 第二章 方差分析、相关分析与回归分析理论............................. 8

2.1相关关系的描述与测度......................................... 8

2.1.1相关系数 ............................................... 8 2.1.2相关关系的显著性检验 ................................... 8 2.2线性回归..................................................... 8

2.2.1 多元回归模型........................................... 8 2.2.4 参数的最小二乘估计..................................... 9 2.2.5 回归方程的拟合优度..................................... 9 2.2.6 显著性检验............................................ 10 2.2.7回归系数检验 .......................................... 10 2.2.8多重共线性 ............................................ 11 2.3 方差分析 ................................................... 11

2.3.1 方差分析中的基本假定.................................. 11 2.3.2 单因素方差分析........................................ 11

第三章 数据分析.................................................... 14

3.1 实例基础数据 ............................................... 14 3.2 基于SPSS的方差分析 ........................................ 14

3.2.1学生考试成绩与课程种类的单因素方差分析 ................ 14 3.2.1为待分析数据的部分例举.................................... 15

3.2.2 学生考试成绩加权平均数与挂科数目的单因素方差分析...... 16 该分析包括如下的过程........................................ 16 3.2.3 学生考试成绩加权平均数与班级的单因素方差分析.......... 18 该分析包括如下的过程........................................ 18 3.2.4 学生考试成绩加权平均数与学生选课数量的单因素方差分析.. 19 该分析包括如下的过程........................................ 19 3.3 基于SPSS的相关性分析 ...................................... 21

3.3.1 学生考试分数与课程种类的相关性分析.................... 21 3.3.2 学生考试成绩加权平均数与挂科数目的相关性分析.......... 22 3.3.3学生考试成绩加权平均数与班级的相关性分析 .............. 23 3.3.4 学生考试成绩加权平均数与学生选课数目的相关性分析...... 24 3.4 基于SPSS的线性回归分析 .................................... 25

3.4.1 学生成绩与课程种类的一元线性回归分析.................. 25 3.4.2 学生考试成绩加权平均数与选课数量、挂科数目、班级的多元线 性回归模型…………………………………………………………29

4

4

安徽建筑大学数理系毕业设计

第四章总结与展望................................................... 31 参考文献........................................................... 32 致谢............................................................... 33

5

5

安徽建筑大学数理系毕业设计

第一章 绪论

6

1.1研究综述

大学教育不仅对大学生个人前途具有重大影响而且也关系到祖国未来的繁荣发展,所以对于大学生的教育我们必须给予极大的重视.然而经过多年的扩招,且本科院校的教学质量水平参差不齐,现在的大学相比于以往教学质量有所下降.而且随着科学的进步,越来越多的高科技产品受到了大学生的青睐,就智能手机来说,我们大学课堂的学生都变成了低头党,这严重的影响了课堂的纪律和氛围.另外,五花八门的电脑游戏,深深的毒害着学生的身心健康,打游戏、逃课打游戏等等已经成了大学生的“大学生活”.所以现在的一部分大学生在某种程度上可以说早已对学习失去了激情.那么最直接的影响就是导致高的失业率.大学成绩的优秀与否对一个学生的影响是非常重要的.因此,对学生学习成绩影响因素的研究不仅对大学生的发展与成才具有重要的指引作用,而且有助于提高高校的教学质量和培养高素质人才.学术界对影响大学生的学习因素也是非常关注:

张志红,耿兴芳对学习态度对大学生学习成绩的影响进行了实证分析.该文以问卷调查的形式,将学习态度分为平时的学习表现、对自己专业的偏好程度、考试态度以及对课堂交流或讨论的学习方式的看法等4 个子系统,进一步建立带有虚拟变量的4 个模型,逐一分析子系统内部因素对学习成绩的影响.结果表明,科学的学习态度能够有效提高学习成绩,采用课堂交流或讨论的学习方式是最有效的提高学习成绩的途径,通过积极、主动、认真学习也能较大程度上促进学习成绩的飞跃.

文献[2]指出:大学生的学习与成长过程, 是一个智力与非智力因素交互作用的过程, 在这一过程中, 非智力因素起着重要的作用.培养大学生非智力因素的途径是: 加强对入学新生的始业教育; 大力加强校园文化建设, 发挥校园文化在非智力建设中的载体作用; 为大学生非智力因素的培养构筑一个全体教育者共同参与的平台.

河北农业大学与河北师范大学对大学生学习成绩规律进行了研究,通过对各学期间成绩的相关性得出结论:相邻学期间在高年级中表现出强相关性;大学第一学期对各个学期的影响显著,非相邻学期间的影响随时间间隔的加大在减弱;不同类别相同学期间的相关性存在差异.

哈尔滨理工大学理学院和哈尔滨师范大学经管学院对大学生成绩影响因素进行了分析,该文运用主成分分析方法,对学生的基础课成绩进行分析,最终得

[2]

[2]

[1]

6

安徽建筑大学数理系毕业设计

出第一主成分是学生的学习兴趣和态度,第二主成分是家庭文化背景,第三主成分是学习动机和学习焦虑.

中北大学数学系孔慧华和潘晋孝对大学生的学习成绩进行了研究.该文对中北大学毕业生的32门必修课成绩进行分析,通过主成分分析找出第一二三主成分并排序,通过聚类分析将按中北大学毕业生学习成绩,将学生分为四类即综合成绩优秀,综合成绩,计算机成绩不太好但体育成绩良好,和综合成绩良好. 1.2 主要研究内容

(1)对现有的数据经过加之后,本文首先对影响学生成绩的四个因素进行单因素方差分析,以此来判断哪些因素对学生成绩是否产生了显著的影响. (2)其次,本文对以上所列出的四个因素进行相关性分析,来推断哪些因素与学生成绩之间具有线性关系,且会具有怎样的线性性态.

(3)最后,本文所进行的是回归分析,通过回归分析我们可以进一步的判断出与因变量具有线性关系的自变量,且可以给出回归方程.

(4)通过对影响学生成绩因素所进行的以上三种分析,我们将可以综合来判断哪些因素对学生成绩产生了影响,从而达到研究目的.

[2]

7

7

安徽建筑大学数理系毕业设计

8

第二章 方差分析、相关分析与回归分析理论

2.1相关关系的描述与测度 2.1.1相关系数

相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量.若相关系数是根据总体全部数据计算的,称为总体相关系数;若是根据样本数据计算的,则称为样本相关系数.样本相关系数的计算公式为: r=

nxyxynx(x)•ny(y)2222

为解释相关系数各数值的含义,首先对相关系数的性质总结如下.

(1)r的取值范围是[-1,1].若0(3)R虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系.当r≥0.8时,可视为高度相关;0.5≤r<0.8时,可视为中度相关;0.3≦r<0.5时,视为低度相关. 2.1.2相关关系的显著性检验 费希尔提出的t检验: 第一步:提出假设.

第二步:计算检验的统计量. t=r

n2~t(n2) 21r 第三步:进行决策.根据显著性水平α和自由度dfn2查t分布表,得出t2(n2)的临界值.若tt2,则拒绝原假设H0,表明总体的两个变量之间存在显著的线性关系. 2.2线性回归

2.2.1 多元回归模型:设因变量y,k个自变量为x1,x2,x3,…xk,描述因变量如何依赖于自变量x1,x2,x3,…xk和误差项的方程称为多元回归模

8

安徽建筑大学数理系毕业设计

型.其一般形式可表示为:

y01x12x2kxk 式中,0,1,2,,k是模型的参数;为误差项. 2.2.2 多元回归方程:根据回归模型的假定有

y01x12x2kxk,该式称为多元回归方程,它描述了因变量y的期望值与自变量x1,x2,,xk之间的关系.

2.2.3 估计的回归方程:回归方程中的参数是未知的,需要利用样本数据取估计它们.当用样本统计量0,1,2,,k去估计回归方程中的未知参数

9

0,1,2,,k时,就得到了估计的多元回归方程,其一般形式为:

y01x12x2xk

2.2.4 参数的最小二乘估计 和

回归方程中的0,1,2,,k是根据最小二乘法求得,也就是使残差平方

Qyyyxxi ii011kk

22 最小.由此可以得到求解

0,1,2,,k的标准方程组为:

QiQ0结果.

0ii0 i1,2,k 求解上述方程组,可得到回归

002.2.5 回归方程的拟合优度

多重判定系数:多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合优度的一个统计量,它反映了在因变量y的变差中被估计的回归方程所解释的比例.多从判定系数如下:

SSRSSR21 R SSTSST调整的多重判定系数为:

9

安徽建筑大学数理系毕业设计

n122 Ra1(1R)

nk110

在多元回归分析中,通常用调整的多重判定系数.(SSTSSESSR;

SST(yiy)为总平方和;SSR(yiy)2为回归平方和;

2SSE(yiyi)2为残差平方和.) 2.2.6 显著性检验

线性关系检验:线性关系检验是检验因变量y与k个自变量之间的关系是否显著,也成为总体显著性检验.检验的具体步骤如下.

第一步:提出假设.

 H0:12k0

H1:1,2,,k至少有一个不等于0 第二步:计算检验的统计量F FSSRk~F(k,nk1)

SSE(nk1) 第三步:作出统计决策.给定显著性水平,根据分子自由度=k,分母自由度=nk1查F分布表得F.若FF,则拒绝原假设;若FF,则不拒绝原假设.根据计算机输出的结果,克直接利用P值作出决策:P,则拒绝原假设;若P,则不拒绝原假设. 2.2.7回归系数检验

在回归方程通过线性关系检验后,就可以对各个回归系数i有选择的进行

一次货多次的检验.但究竟要对那几个回归系数进行检验,通常在建立模型之前作出决策,此外,还应对回归系数的个数进行,一面犯过多的第类错误.

回归系数检验的具体步骤如下:

第一步:提出假设.对于任意参数i(i=1,2,…k),有 H0:i0 H1:i0 第二步:计算检验的统计量t. tiis~t(nk1)

 式中,s是回归系数i的抽样分布的标准差,即

 10

安徽建筑大学数理系毕业设计

s11

s12xin(xi)2

第三步:做出统计决策.给定显著性水平,根据自由度nk1查t分布表,得t2的值,若tt2,则拒绝原假设;若tt2,则不拒绝原假设. 2.2.8多重共线性

(1)多重共线性及其所产生的问题:当回归模型中两个货两个以上的自变量彼此相关时,则称回归模型中存在多重共线性.而回归模型中使用两个或两个以上的自变量时,这些自变量往往会提供多余的信息.在实际问题中,所使用的自变量之间存在相关是比较常见的,但是在回归分析中存在多重共线性时将会产生某些问题.首先,变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途;其次多重共线性可能对参数估计值的正负号产生影响,特别是i的正负号有可能同预期的正负号相反.

(2)多重共线性的判别:具体来说,如果出现以下情况,表示可能存在多重共线性:

①模型中各对自变量之间显著相关

②当模型的线性关系检验(F检验)显著时,几乎所有回归系数i的t检验却不显著.

③回归系数的正负号与预期的相反.

④容忍度与发叉扩大因子.容忍度越小,多重共线性月严重;方差扩大因子越大,

(3)多重共线性问题的处理

下面给出多重共线性问题的解决办法:

①将一个或多个相关的自变量从模型中剔除,使保留的自变量尽量不相关. ②如果要在模型中保留所有的自变量,那就应该: ·避免根据t统计量对单个参数β进行检验

·对因变量y值的推断(估计或预测)限定在自变量样本值的范围内. 2.3 方差分析

2.3.1 方差分析中的基本假定 方差分析中有三个基本假定: (1)每个总体都应服从正态分布. (2) 各个总体的方差2必须相同. (3) 观测值是的 2.3.2 单因素方差分析

11

安徽建筑大学数理系毕业设计

(1)提出假设

在方差分析中,原假设所描述的是在按照自变量的取值分成的类中,因变量的均值相等 .因此检验因素的k个水平(总体)上午均值是否相等,需要提出如下形式的假设:

H0:12ik 自变量对因变量没有影响 H1:i(i1,2,,k) 自变量对因变量有显著影响 式中,i为第i个总体的均值.

如果拒绝原假设H0,则意味着自变量对因变量有显著影响;如果不拒绝原假设H0,则没有证据表明自变量对因变量有显著影响,也就是说,不能认为自变量与因变量之间有显著关系. (2)构造检验的统计量 总平方和:SST2(xx)SSAn(xx);组间平方和:ijii

i1j1k12

kni2ki1 组内平方和:SSE(xijxi);组间方差:MSAi1j1ni2SSA; k1 组内方差:MSESSE; nk 将上述MSE和MSA进行对比,即得到所需要的检验统计量F: FMSA~F(k1,nk) MSE (3)统计决策

根据给定的显著性水平α,在F分布表中查找与分子自由度df1k1、分母自由度df2nk相应的临界值F(k1,nk).

若FF,则拒绝原假设H0:12k, 表明i(i1,2,k)之间有显著差异;

若FF,则不拒绝原假设H0,没有证据表明i(i1,2,,k)之间有显著差异;

基于上述理论基础,结合我们自己的分析,在对学生成绩相关性进行分析主要有如下几点考虑:

首先,通过大量的文献比较后了解到,大部分的学者所应用的方法为因子分析、聚类分析、主成分分析,对于应用方差分析、相关分析及回归分析的研究方法并不很广泛,本文希望在这方面进行一些尝试.

其次,如何把该方法运用于成绩分析呢?一是要做好数据的修改,使得所修改的数据满足该方法,例如应用方差分析,数据必须满足因变量是数值型,自变

12

安徽建筑大学数理系毕业设计

量是分类型这个条件.二是要严格按照所选方法的要求在SPSS中组织数据,正确的组织数据,才能够得到准确的结果.

最后,该方法的不足之处是不能够把因变量统一化.

如在研究学生考试成绩与课程种类的单因素方差分析中,因变量是学生的各科考试成绩,研究学生考试成绩加权平均数与挂科数目的单因素方差分析中,因变量是成绩的加权平均数.但是这也是改进之处,虽然因变量不能够统一化,但都能够客观的反应学生考试成绩.

13

13

安徽建筑大学数理系毕业设计

14

第三章数据分析

3.1 实例基础数据

15统计学最终成绩排名.xls附件 :

3.2 基于SPSS的方差分析

本文所采用的方差分析主要为单因素方差分析.首先,方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,而本文所研究的目的就是去判别课程种类、挂科数目、班级、选课数目着四个因素对学生成绩是否有显著影响,所以方差分析适用于本文的研究.其次,由于研究的侧重点不同,单因素方差分析相较于多因素方差分析更易于操作,目的性更加的明确,且相较于多因素方差分析,不用考虑有各个因素有无交互作用.在单因素方差分析中我们关键的一步为方差齐性检验,只有通过该检验,单因素的方差分析才具有意义.

3.2.1学生考试成绩与课程种类的单因素方差分析 该分析包括如下的过程

(1)插入数据,如下图所示

图3.1 不同课程分数在SPSS中的组织形式

14

安徽建筑大学数理系毕业设计

表3.2.1 不同课程部分成绩举例

组别 1 2 3 4 学生考试分成绩 88 95 90 83

90 94 85 79 97 90 86 77 95 88 79 86 94 93 76 78 15

学生考试成绩与课程种类的单因素方差分析的数据在SPSS中的组织形式如图3.1;表3.2.1为待分析数据的部分例举.

(2)进行分析,实验结果如下

表3.2.2 不同课程下学生考试分数的基本描述统计量及95%置信区间

描述 学生考试分数 土木工程概论B 数学分析1 统计学 大学英语读写译1 总数 均值的 95% 置信区间 N 均值 标准差 5.09045 标准误 .92938 下限 88.5659 上限 92.3675 极小值 极大值 78.00 98.00 30 90.4667 30 88.4333 30 81.8333 30 77.6000 4.675 5.55278 5.75715 .402 1.01379 1.05111 86.6049 79.7599 75.4502 90.2618 83.9068 79.7498 78.00 72.00 63.00 95.00 93.00 86.00 120 84.5833 7.37653 .67338 83.2500 85.9167 63.00 98.00

表3.2.3 不同课程的方差齐性检验结果

方差齐性检验 学生考试分数 Levene 统计量 .257 df1 3 df2 116 显著性 .856 15

安徽建筑大学数理系毕业设计

表3.2.4 课程种类对学生考试分数的单因素方差分析结果

ANOVA

学生考试分数

16

组间 组内 总数

平方和 3172.967 3302.200 75.167 df

3 116 119 均方 1057.656 28.467 F 37.153 显著性

.000

表3.2.3为方差齐性检验,该检验主要的目的在于验证所选的数据是否满足2.3.2中所提到的基本假定.如果检验通过,该单因素方差分析才有实际意义. 表3.2.4是课程种类与学生考试成绩的单因素方差分析结果,依据该表所给出的信息,可以得出相应的结论. (3)对以上的结果进行分析

由表3.2.3可知,不同课程下的学生成绩的方差齐性检验值为0.257,概率值P-值为0.856,在显著性水平为0.05下,由于概率P-值大于显著性水平,因此不应拒绝原假设,认为不同课程下的学生成绩总体方差无显著差异,满足方差分析的前提要求.

由表3.2.4知,因变量学生考试分数的离差总平方和为75.167;如果仅考虑课程种类单个因素的影响,则学生考试分数总变差中,课程种类的不同可解释的变差为3172.967,抽样误差引起的变差为3302.200,它们的方差分别为1057.656和28.467,相除所得的F统计量的观测值为37.153,对应的概率P-值近似为0.因此在显著性水平为0.05下,由于概率P-值小于显著性水平的值,因此应拒绝原假设,认为课程种类的不同对学生考试分数产生了显著的影响. 3.2.2 学生考试成绩加权平均数与挂科数目的单因素方差分析 该分析包括如下的过程 (1)插入数据,如下图所示

表3.2.5 不同挂科数下学生考试成绩加权平均数的部分举例 挂科数 0 1

学生考试成绩加权平均数 .85 88.30 88.84 79.26 88. 76.98 87.96 74.80 87. 74.36 16

安徽建筑大学数理系毕业设计

表3.2.5为样本数据的部分例举.

(2)进行分析,实验结果如下

表3.2.6 不同挂科数下学生考试成绩加权平均数的基本描述统计量及95%置信区 间

描述

学生考试成绩加权平均数

17

.00 1.00 2.00 总数

均值的 95% 置信区间

N

71 8 1 80 均值 82.4211 75.5100 70.7300 81.5839 标准差 3.59243 3.05085 . 4.252 标准误 .42634 1.078 . .47588 下限 81.5708 72.9594 . 80.6367 上限 83.2714 78.0606 . 82.5311 极小值 72.38 71.91 70.73 70.73 极大值 .85 80.33 70.73 .85

表3.2.7不同挂科数的方差齐性检验结果

Levene 统计量 .1 a方差齐性检验 学生考试成绩加权平均数 df1 1 df2 77 显著性 .665 a. 在计算 学生考试成绩加权平均数 的方差齐性检验时,忽略仅有一个案例的组. 表3.2.8 挂科数对学生考试成绩加权平均数的 单因素方差分析结果

数据分析操作过程如3.2.1节所述,以下的单因素方差分析在此不再进行赘述. (3)对以上的结果进行分析

如同3.2.1节的分析一样,我们通过表3.2.7可知不同的挂科数目下,学生考试成绩加权平均数的方差齐性检验值为0.1,概率P-值为0.665.在显著性水平为

17

ANOVA

学生考试成绩加权平均数

组间 组内 总数

平方和 462.713 968.541 1431.253 df

2 77 79 均方 231.356 12.578 F 18.393 显著性

.000

安徽建筑大学数理系毕业设计

0.05下,由于概率P-值大于显著性水平,因此不应拒绝原假设,认为不同挂科数目下的学生考试成绩的加权平均数的总体方差无显著差异,满足方差分析的前提条件.

根据表3.2.8可知,因变量学生考试成绩加权平均数的离差平方总和为1431.253;如果仅考虑挂科数目单个因素的影响,则考试成绩的加权平均数的总变差中,不同的挂科数目可解释的变差为462.713;抽样误差引起的变差为968.541,它们的方差分别为231.356和12.578,相除所得的F统计量的观测值为18.393,对应的P-值近似为0,在显著性水平为0.05下,由于概率P-值小于显著性水平,因此拒绝原假设,认为挂科数目的不同对学生考试成绩产生了显著的影响. 3.2.3 学生考试成绩加权平均数与班级的单因素方差分析 该分析包括如下的过程

(1)插入数据,如下图所示

18

表3.2.9 不同班级下学生考试成绩加权平均数的部分举例 班级 1 2

表3.2.9为样本数据的部分例举

(2)进行分析,实验结果如下

表3.2.10 不同班级下学生考试成绩加权平均数的基本描述统计量及95%置信间 间 描述 学生考试成绩加权平均数 学生考试成绩加权平均数 86.00 86.71 85.98 86.21 85.32 84.87 84.98 84.78 84.96 84.66 一班 二班 总数 均值的 95% 置信区间 N 40 40 80 均值 81.20 81.8788 81.5839 标准差 3.90692 4.61046 4.252 标准误 .61774 .728 .47588 下限 80.0395 80.4043 80.6367 上限 82.5385 83.3532 82.5311 极小值 72.76 70.73 70.73 极大值 87.96 .85 .85

18

安徽建筑大学数理系毕业设计

表3.2.11 不同班级的方差齐性检验结果

方差齐性检验

学生考试成绩加权平均数 Levene 统计量

.455 df1

1 df2

78 显著性

.502 19

表3.2.12 班级对学生考试成绩加权平均数的 单因素方差分析结果

ANOVA

学生考试成绩加权平均数

组间 组内 总数

平方和

6.956 1424.297 1431.253 df

1 78 79 均方 6.956 18.260 F .381 显著性

.539

(3)对以上的结果进行分析

如同3.2.1、中的分析,我们通过表3.2.111可知不同的班级下,学生考试成绩加权平均数的方差齐性检验值为0.455,概率P-值为0.502.在显著性水平为0.05下,由于概率P-值大于显著性水平,因此不应拒绝原假设,认为不同的班级下的学生考试成绩的加权平均数的总体方差无显著差异,满足方差分析的前提要求.

根据表3.2.12的结果我们可知,因变量学生考试成绩加权平均数的离差平方总和为1431.253;如果仅考虑班级单个因素的影响,则考试成绩的加权平均数的总变差中,班级的不同可解释的变差为6.956;抽样误差引起的变差为1424.297,它们的方差分别为6.956和18.260,相除所得的F统计量的观测值为0.381,对应的P-值近似为0.539,在显著性水平为0.05下,由于概率P-值大于显著性水平,因此不应拒绝原假设,认为班级的不同对学生考试成绩没有产生显著的影响.

3.2.4 学生考试成绩加权平均数与学生选课数量的单因素方差分析 该分析包括如下的过程 (1)插入数据,如下图所示

19

安徽建筑大学数理系毕业设计

表3.2.13 不同选课数量数下学生考试成绩加权平均数的部分举例 选课数量 10 11

表3.2.13为样本数据的部分例举. (2)进行分析,实验结果如下

表3.2.14 不同选课数量下学生考试成绩加权平均数的基本描述统计量及95%置 信区间 描述 学生考试成绩分数加权平均数 20

学生考试成绩加权平均数 88.84 84.66 87.96 84.40 87. 84.32 87.84 84.30 87.07 84.06 N 10.00 11.00 总数 51 29 80 均值 81.2031 82.2534 81.5839 标准差 4.46518 3.84507 4.252 标准误 .62525 .71401 .47588 均值的 95% 置信区间 下限 79.9473 80.7909 80.6367 上限 82.4590 83.7160 82.5311 极小值 70.73 73.68 70.73 极大值 88.84 .85 .85

表3.2.15不同选课数量的方差齐性检验结果

表3.2.16 选课数量对学生考试成绩加权平均数的 单因素方差分析结果

学生考试成绩分数加权平均数 ANOVA Levene 统计量 .362 方差齐性检验 学生考试成绩分数加权平均数 df1 1 df2 78 显著性 .549 组间 组内 总数 平方和 20.395 1410.859 1431.253 df 1 78 79 均方 20.395 18.088 F 1.128 显著性 .292 20

安徽建筑大学数理系毕业设计

(3)对以上的结果进行分析

如同以上的分析,由表3.2.19可知选课数不同的情况下的学生考试成绩的加权平均数的方差检验值为0.362,概率P-值为0.549.在显著性水平为0.05时,由于概率P-值大于显著性水平,因此不应拒绝原假设,认为不同的选课数下的学生考试成绩的加权平均数的总体方差无显著差异,满足方差分析的前提要求. 由表3.2.20可知,因变量学生考试成绩分数的加权平均数的离差平方总和为1431.253;如果仅考虑选课数单个因素的影响,则因变量总变差中,不同选课数可解释的变差为20.395,抽样误差引起的变差为1410.859,它们的方差分别为20.395和18.088,相除所得的F统计量的观测值为1.128,对应的概率P-值为0.292.在显著性水平为0.05时,由于概率P-值大于显著性水平,因此不能拒绝原假设,认为不同的选课数目对学生考试成绩没有产生显著地影响. 3.3 基于SPSS的相关性分析

相关性分析是对两个变量之间线性关系的描述与度量.通过单因素方差分析我们可以初步的确定哪些因素对学生成绩产生了影响.为了排除偶然性,我们进行相关分析,目的在于进一步的确定哪些因素对学生成绩产生了显著地影响并判断它们之间呈现怎样的性态.所以在以下的分析中,本文用到了相关性分析.在该方法运用之前,我们首先进行的是在SPSS中组织数据.经过研究发现,相关性分析与以上进行的单因素方差分析的数据组织形式完全相同,所以在以下的相关性分析中,插入数据这一步中本文没有再进一步的给出数据. 3.3.1 学生考试分数与课程种类的相关性分析 该分析包括如下的过程 (1)插入数据

如图3.1 不同课程分数在SPSS中的组织形式,表3.2.1 不同课程部分成 绩举例

(2)进行分析,实验结果如下

21

21

安徽建筑大学数理系毕业设计

表3.3.1 学生考试分数与课程种类的相关系数计算 结果

通过对样本数据分析得出如上表3.3.1,依据该表可以判断哪些因素对学习成绩产生了显著的影响且可判断自变量与因变量具有怎么的线性关系. (3)对以上的结果进行分析

由表3.3.1可知学生考试成绩与课程种类的相关性系数为—0.688,由第二章的理论可知学生考试分数与课程种类呈现负相关,且可视为中度相关,其相关系数检验的概率P-值近似为0.因此,当显著性水平为0.05或0.01时,应拒绝相关系数检验的原假设,认为两总体不是零相关.

3.3.2 学生考试成绩加权平均数与挂科数目的相关性分析 该分析包括如下的过程 (1)插入数据

如表3.2.5不同挂科数下学生考试成绩加权平均数的部分举例. (2)进行分析,实验结果如下

22

学生考试分数

相关性

22

课程种类

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

课程种类

1 学生考试分数

-.688 .000 -678.000 -5.697 120 1 **

150.000 1.261 120 -.688 .000 -678.000 -5.697 120 **

75.167 54.413 120 安徽建筑大学数理系毕业设计

表3.3.2 学生考试成绩加权平均数与课程种类的相关系数计 算结果

挂科数

23

表3.3.4相关性

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差

学生考试成绩加

挂科数

1 权平均数

-.567 .000 -70.299 -.0 80 1 **

学生考试成绩加权平均数

10.750 .136 80 -.567 .000 -70.299 -.0 80 **

N

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

**. 在 .01 水平(双侧)上显著相关.

1431.253 18.117 80 表3.3.2呈现的研究内容与表3.3.1相同,在以下的相关性分析中将不再进行赘述.

(3)对以上的结果进行分析

由表3.3.2可知,学生考试成绩加权平均数与挂科数目的相关性系数为—0.567,由理论可知这两个变量呈现的是负相关性,且是中度相关,其相关系数检验的概率P-值近似为0,因此,当显著性水平为0.05或0.01时,应拒绝相关系数检验的原假设,认为两个总体不是零相关. 3.3.3学生考试成绩加权平均数与班级的相关性分析 该分析包括如下的过程 (1)插入数据

如表3.2.9 不同班级下学生考试成绩加权平均数的部分举例 (2)进行分析,实验结果如下

23

安徽建筑大学数理系毕业设计

表3.3.3 学生考试成绩加权平均数与班级的相关系数计

24

算结果

相关性

学生考试成绩加权平均数

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

班级

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

学生考试成绩加

权平均数

1 班级 .070 .539 11.795 .149 80 1

1431.253 18.117 80 .070 .539 11.795 .149 80

20.000 .253 80

(3)对以上的结果进行分析

由表3.3.3可知,学生考试成绩加权平均数与班级的相关系数为0.07,说明两者之间存在很弱的相关性,其相关系数检验的概率P-值为0.539.因此在显著性水平为0.05或0.01时,不应该拒绝相关系数的原假设,可以认为两个总体是零相关的.

3.3.4 学生考试成绩加权平均数与学生选课数目的相关性分析 该分析包括如下的过程 (1) 插入数据

表3.2.5 不同挂科数下学生考试成绩加权平均数的部分举例 (2)进行分析,实验结果如下

24

安徽建筑大学数理系毕业设计

表3.3.4 学生考试成绩加权平均数与选课数目的相关系数计算结果

(3)对以上的结果进行分析

由表3.3.4可知,学生考试成绩分数加权平均数与学生选课数量的简单相关系数为0.119,说明两者之间存在正的弱相关性,其相关系数检验的概率p值为0.292.因此,当显著性水平为0.01或0.05时,不应拒绝相关系数检验的原假设,认为两总体是零相关的.

综上所述,我们应该剔除班级、选课数目这两个自变量,保留课程种类和挂科数.

3.4 基于SPSS的线性回归分析

回归分析相比较于相关性分析侧重于考察变量之间的数量关系,并通过一定的数学表达式将这种关系描述出来,进而确定一个或多个变量的变化对另一个特定变量的影响程度.通过单因素方差分析与相关性分析,我们可以确定具体哪些因素对学生成绩产生了显著地影响.而通过回归分析的研究可以具体的描述变量之间的数量关系,得到更加又说服力的结果.回归分析中样本数据的选择和组织形式与单因素方差分析和相关性分析一样,所以在以下的研究中,本文没有再给出数据.

3.4.1 学生成绩与课程种类的一元线性回归分析

学生选课数量

相关性

25

学生考试成绩分数加权平均Pearson 相关性 数

显著性(双侧) 平方与叉积的和 协方差 N

Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N

学生考试成绩分数加权平均数

1

学生选课数量

.119 .292 19.418 .246 80 1

1431.253 18.117

80 .119 .292 19.418 .246 80

18.488 .234 80

25

安徽建筑大学数理系毕业设计

该分析包括如下的过程

(1) 插入数据

26

如图3.1 不同课程分数在SPSS中的组织形式,表3.2.1 不同课程部分成 绩举例

(2)进行分析,实验结果如下

表3.4.1 学生成绩一元线性回归方程拟合优度检验

模型汇总

标准 估计的误

模型 R R 方 调整 R 方

差 1

.688a

.473 .469 5.37619 a. 预测变量: (常量), 课程种类.

表3.4.2 学生成绩一元线性回归方程的显著性检验

Anovab 模型 平方和 df 均方 F Sig. 1 回归 30.560 1 30.560 106.027 .000a 残差 3410.607 118 28.903 总计 75.167 119 a. 预测变量: (常量), 课程种类. b. 因变量: 学生考试分数

表3.4.3 一元线性回归方程的回归系数显著性检验

系数a 非标准化系数 标准系数 模型 B 标准 误差 试用版 t Sig. 1 (常量) 95.883 1.202 79.760 .000 课程种类 -4.520 .439 -.688 -10.297 .000 a. 因变量: 学生考试分数

26

安徽建筑大学数理系毕业设计

表3.4.1所进行的是回归方程的拟合优度检验,听过该检验可以衡量回归直线与各观测点的接近程度.表3.4.2、表3.4.3所进行的是显著性检验,分别为线性关系的检验与回归系数的检验.通过以上的三个检验我们可以确定哪些因素对学生成绩的影响是显著的,且可以给出数学表达式. (3)对以上的结果进行分析

由表3.4.1可知,我们可以进行拟合优度的检验.由表可知,判定系数为0.473,那么该判定系数的实际意义为:在学生考试分数取值的变差中,有47.3%可以由学生考试分数与课程种类之间的线性关系来解释,或者说,在学生考试分数取值的变动中,有47.3%是由课程种类决定的.

由表3.4.2可知被解释变量的离差平方总和为75.167,回归平方和以及方差都为30.560剩余平方和以及方差分别为3410.607和28.903,F检验统计量的观测值为106.127,对应的概率P-值近似为0.依据该表可进行回归方程的显著性检验.如果显著性检验为0.05,由于概率P-值小雨显著性检验水平a,应拒绝回归方程显著性检验的原假设,认为各回归系数不为0,被解释变量与解释变量的线性关系是显著的,可建立线性模型.

有表3.4.3可知,如果显著性水平为0.05,变量的回归系数显著性t检验的概率P-值近似为0,都小于显著性水平,因此拒绝原假设,认为这些系数与0有显著差异,它们与被解释变量的线性关系是显著的,认为该模型是可用的.

令因变量学生考试分数以及自变量分别为Y和X,那么该模型为:

Y=95.883-4.520X

3.4.2 学生考试成绩加权平均数与选课数量、挂科数目、班级的多元线性回归分析

考虑到选课数目、挂科数目、班级具有同一个因变量,本文不再进行一元回 归分析,进而选用多元回归分析,综合来考虑各个变量与学生成绩的数量关系. 该分析包括如下的过程 (1)插入数据,如下图所示

27

27

安徽建筑大学数理系毕业设计

表3.4.4 学生考试成绩加权平均数与选课数量、挂科数目、班级的部分数据 学生考试成绩加权平均数 选课数目 挂科数目 班级 表3.4.4为样本数据部分例举. (2)进行分析,实验结果如下

表3.4.5 多元线性回归方程的拟合优度检验

模型汇总

标准 估计的误

模型 1

R .818 a

28

10 11 0 1 1 2 88.84 .85 .85 80.33 87.96 .85 87.96 88. 88.84 79.26 87.84 88.84 87. 87.28 88. 76.98 87.07 87. 87.84 86.21 87.96 74.80 86.00 87.28 87.07 86.00 87. 74.36 85.98 86.71 R 方 .669 调整 R 方

.655 差 2.49830 a. 预测变量: (常量), 班级, 挂科数目, 选课数量.

表3.4.6 多元线性回归方程的显著性检验 Anova 模型 1 回归 残差 总计 平方和 956.7 474.356 1431.253 df 3 76 79 均方 318.966 6.242 F 51.104 Sig. .000 ab a. 预测变量: (常量), 班级, 挂科数目, 选课数量. b. 因变量: 学生考试成绩加权平均数

28

安徽建筑大学数理系毕业设计

表3.4.7 多元回归方程的系数显著性检验 系数 非标准化系数 模型 1 (常量) 选课数量 挂科数目 班级 B -6.766 9.851 -5.808 -8.667 标准 误差 8.763 .932 .854 .851 标准系数 试用版 t -.772 10.5 -6.798 -10.190 Sig. .442 .000 .000 .000 共线性统计量 容差 VIF a29

1.120 -.503 -1.025 .388 .796 .431 2.575 1.257 2.318 a. 因变量: 学生考试成绩加权平均数

表3.4.8 多重共线性检测 共线性诊断 方差比例 模型 1 维数 1 2 3 4 特征值 3.119 .825 .056 .000 条件索引 1.000 1.945 7.451 82.619 (常量) .00 .00 .00 1.00 选课数量 .00 .00 .00 1.00 挂科数目 .02 .79 .09 .11 班级 .00 .00 .52 .47 aa. 因变量: 学生考试成绩加权平均数

表3.4.5进行的是拟合优度检验,表3.4.6进行的是回归方程的显著性检验,表3.4.7进行的是回归系数的显著性检验,表3.4.8进行的是多重共线性检验.依据各表我们可以给出各个变量与学生考试成绩的数量关系. (3)对以上的结果进行分析

在表3.4.5中我们可知,由于该回归方程有多个多解释变量,因此,应参考调整的判定系数.由于调整的判定系数为0.655,它的实际意义为:在用样本量和模型中自变量的个数进行调整后,在学生考试成绩加权平均数的取值变差中,能被学生考试成绩加权平均数与选课数量、挂科数量、班级的多元回归方程所解释的比例为65.5%.

29

安徽建筑大学数理系毕业设计

在表3.4.6中,我们可以进行回归方程的显著性检验.可以看到,被解释变量的总离差平方和为1431.253,回归平方和以及方差分别为956.7和318.966,剩余平方和以及方差分别为474.356和6.242,F检验统计量的观测值为51.104,对应的概率P-值近似为0.如果显著性水平为0.05,由于概率P-值小于显著性水平,应拒绝回归方程显著性检验的原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可以建立线性模型.

在表3.4.7中,我们依据该表可以进行回归系数的显著性检验、写出回归方程和检测多重共线性.当显著性水平为0.05时,各个解释变量的回归系数显著性t检验的概率P-值都近似为0且小于显著性水平,因此拒绝原假设,认为这些偏回归系数与0是有差异的,它们与被解释变量的线性关系是显著的,应该保留在方程中.

由表3.4.6以表3.4.7中的共线性统计量可知,容忍度都是大于0.01以及由条件指数的性质可知,回归方程中不存在多重共线性.所以不用重新对变量进行筛选. 令学生考试成绩加权平均数为Y;选棵数目、挂科数量、班级分别为x1、x2、

30

x3,那么该多元回归方程为:

Y=—6.766+9.851x1—5.808x2—8.677x3

30

安徽建筑大学数理系毕业设计

第四章总结与展望

通过对研究背景、理论依据、实例分析的讨论,最终我们通过统计学知识:方差分析、相关性分析、回归分析,对本课题所选的影响学生成绩的因素:课程种类、挂科数目、班级、选课数目做了详尽的统计分析,发现课程种类与挂科数目对学生成绩的影响是显著地,而班级以及选课数目的不同对学生成绩的影响不是显著地因素,但当建立起关于因变量学生考试成绩加权平均数与自变量挂科数目、班级、选课数目的多元回归模型是,我们发现该模型通过了有关的统计检验,并且不存在多重共线性.所以实际上这几个因素对学生成绩都会有影响,课程种类与挂科数目的影响最为显著,而班级以及选课数目的不同对学生成绩的影响相较前者不是那么的显著.

目前为止对于该课题已取得初步研究结果,所讨论的有关变量,即影响因素涉及到生活的许多方面,对该课题研究的展望如下:

(1)因为社会不断的进步,人们的生活与时俱进、日异月新,对于大学生来说他们的生活中会不断涌现出新奇的事物,那么这些新奇的事物在一定程度上就会对他们的学业成绩产生影响,所以对该课题的研究会随着时代的变迁而不断地发展,研究空间十分广阔.

(2)本文主要的研究方法为方差分析、相关性分析和回归分析,而对于该课题的研究不仅仅局限在以上的方法,比如还有因子分析,聚类分析等.那么随着科技的不断进步,理论知识的不断完善,可能会产生更多的研究方法,相信在以后的研究中各种方法的相互结合将会促进该课题的发展,且研究结果更加的精确. (3)由于数据所限,本文所筛选的变量只是在一定程度上反应了影响学生成绩的因素,所研究的变量十分的有限,这也是本文的不足之处.在以后的研究中,随着数据的不断丰富,会筛选出更多的因素,从而更充分反应影响学生成绩的因素.

31

31

安徽建筑大学数理系毕业设计

参考文献

[1] 张志红,耿兰芳.学习态度对大学生学习成绩影响实证分析 [EB/OL].http://wenku.baidu.com/view/f6d359166edb6f1aff001fe0.html,2016-4-20

[2] 徐婷婷,杨桂君,崔路云.大学生学习成绩影响因素的实证分析 [EB/OL]. www.doc88.com/p-732494931600.html,2016-4-25

[3] 左国新,黄超,詹英.数据分析实验教程 [M].武汉:华中师范大学出版社, 2015.8

[4] 叶向,李亚平.统计数据分析基础教程习题与实验指导(第二版) [M].北京: 中国人民大学出版社,2015.5

[5] 薛薇.统计分析与SPSS的应用(第三版) [M].北京:中国人民大学出版社, 2012.6

[6] 贾俊平,何晓群,金勇进.统计学(第五版) [M].北京:中国人民大学出版 社,2012.6

[7] 张芮.普通本科院校公选课教学效果相关分析 [J].高教论坛,Feb.2014.No2 [8] 赵成京.石河子内初班学生学业成绩影响因素及对策研究 [D].石河子:石河子 大学师范学院,2012.6

[9] 邱女.影响大学生成绩的因素分析 [J].中国市场,2011.No26

[10] 李瑾.影响大学生成绩的因素分析 [J].天津成人高等学校联合学报,2005. No03

[11] 谢龙汉.SPSS统计分析与数据挖掘(第2版)[M].北京:电子工业出版社,2014.4 [12] 郑少华,姜凤华.实验设计与数据处理 [M].北京:中国建材工业出版社,2004.3 [13] 辛涛.回归分析与实验设计 [M].北京:北京师范大学出版社,2010.9 [14] Christian FG Schendera.SPSS回归分析 [M]. 北京:电子工业出版社,2015.3 [15] 冯力.回归分析方法原理及SPSS实际操作 [M].北京:中国金融出版社, 2004.1 [16] 张文彤.统计分析基础教程 (第二版)[M].北京:高等教育出版社,2004.9

[17] 夏丽华,谢金玲.SPSS数据统计与分析标准教程 [M].北京:清华大学出版社,2004.9 [18] 白厚义.回归设计及多元统计分析 [M].南宁:广西科学技术出版社,2003.11 [19] 朱建平.应用多元统计分析(第三版)[M].北京:科学出版社,2016.1 [20] 高惠璇.应用多元统计分析 [M].北京:北京大学出版社,2005.1

32

32

安徽建筑大学数理系毕业设计

33

致谢

经过几个月的时间,论文终于完成了,在这段时间里有很多苦恼,经常遇到一些难题,往往一个难题需要很长的时间才可以克服掉,辛亏有指导老师和同学的帮助,使自己少走了很多的弯路.在后期我把论文的初稿交由宫老师修改,她对我们的不足悉心教导、不厌其烦.在此十分的感谢老师.

本文引用了一些学者的研究文献,这些文献往往起到一个开阔思路的作用,如果没有这些文献的指导,自己一个人摸索将会花费大量的时间,所以感谢这篇论文所涉及到的所有学者.

作为本科生的我,限于自己的水平,所以论文将会有不足之处,在此希望老师门批评指正.

33

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baoaiwan.cn 版权所有 赣ICP备2024042794号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务