主成分分析法在大学英语写作评价中的应用
王秋菊
[摘 要]主成分分析法从若干指标中选取主要的具有代表性的指标,淡化主要指标的作用,大大简化数据结构;可以客观地确定权重,避免了主观随意性,因而使得评价结果具有科学性、客观性和公正性。利用这种评价方法,可以让学生了解自己在班级中所处的位置,找出自己的不足,从而更有针对性地加强相应的训练,最终提高写作综合素质。
[关键词]综合评价;主成分分析;英语写作
[中图分类号] H315 [文献标识码] A [文章编号] 2095-3437(2016)11-0171-03
一、引言
近年来,随着统计分析活动的广泛开展,通过对实践活动的总结,逐步形成了一系列运用多个指标对多个单位进行评价的方法,简称综合评价方法。其基本思想是将多个指标转化为一个能够反映综合情况的指标来进行评价。主成分分析法是综合评价方法中一种较新的评价方法。它与现有的专家评分法、模糊综合评价法、灰色聚类法等有着不同的原理和特性,充分考虑了各指标之间的信息重叠,能够在保留原有信息的基础上,最大限度地对高维变量进行最佳的综合降维,且更客观地确定各个指标的权重,避免了主观随意性,提高了综合评价的科学性、客观性及合理性。[1]
在目前的英语教学实践中,分项式评分标准仍然是多数教师经常采用的用来诊断学生的写作水平的方法。研究发现,分项式评分标准适合大学英语写作教学的诊断性评估。[2] [3]这种评分方法能够对学生的英语写作能力作出更加细致和准确的区分,提高英语作文评分信度。[4]也就是说,分项评分法有助于甄别学生作文的弱点是语言表达能力不足的问题,还是思维缺乏条理性,篇章布局和逻辑性差等细节问题。但是,由于各分项的指标受重视程度会有差别,所以各项得分的简单相加并不能全面地反映学生的英语写作水平及写作中存在的主要问题。主成分分析法通过对学生英语作文评分指标进行标准化处理,突出显示学生的强项与弱项,从而给教师和学生本身提供一个有针对性的参考,了解每个学生在哪些方面需要加强,从而达到学生英语写作水平的综合提高。这对教师有针对性地改进教学有着重要的作用。
二、主成分分析数学模型及过程
假设我们研究n个学生的英语作文综合水平,考查英语作文的p项指标。记第i个学生的p项指标值分别为xi1,xi2,…,xip,其中xij为第i个学生的第j项数据值,则这n个学生的p项指标值可以表示成n×p矩阵。利用公式,将原始数据标准化处理,其中xj=xij为第j个指标的样本均值,Sj=为样本标准差。经标准化处理后的相关系数为,其中i,j=1,2,…,p,则得到相关系数矩阵为R=(rij)p×p。然后,求出相关矩阵R的p个特征值λ1,λ2,…,λp以及对应的特征向量。设λi对应的特征向量为Ci=(c1i,…,cpi),其中i=1,2,…,p。则我们得到p个主分量,其中第i个主分量表示为Fi=c1iX1+c2iX2+…+cpiXp。
第i个主成分Fi的特征值μi即主成分的方差。方差越大,对总方差的贡献越大,对总变量的贡献也越大,其贡献率为ηi=μi ?/ μk,其中ηi反映了第i个主成分综合原始变量信息比。
选取m个主成分,如果前面m个主成分贡献率之和接近于1,一般来说,只要达到85%就可以,我们就取前m个主成分F1,…,Fm,也就是说,这m个主成分基本保留了原来指标变量的信息。这样,指标或者变量就减少到m个,从而起到了筛选指标或者变量的作用。对于以上的计算,我们采用MATLAB数学软件进行。
三、英语写作评价实例分析
现以江苏师范大学数学系二年级某班随意抽取15名学生在一次英语写作的成绩为例。这次写作评分分为四个部分,包括内容(5分)、语言文字(5分)、组织结构(3分)、写作技术(包括拼写、标点符号、大小写及字数等,2分)四个部分,共15分的评分。这四项指标标记分别记为内容(X1)、语言文字(X2)、组织结构(X3)、写作技术(X4),学生的各项指标分数见表1。
对15位学生四项指标进行标准化处理,结果见表2。
根据表2中的数据,算出四项指标的相关系数矩阵R,即
■
从R出发,计算出特征值、方差贡献率、累计贡献率和特征向量,结果如下表。
于是,主分量与标准变量的关系为
F1=0.5857213X1+0.0529997X2+0.6843405X3+0.4310448X4,
F2=-0.413745X1+0.7703048X2-0.011086X3+0.4851006X4,
F3=-0.302631X1-0.614473X2-0.143337X3+0.7143474X4,
F4=-0.627822X1-0.162002X2+0.7148493X3-0.261888X4.
由表3可知,前三个主成分F1~F3的累计贡献率为85.73%,满足≥85%的条件,因此可以用前3个主成分进行综合评价。其中,相应的Xi的系数反映了偏差程度,正系数反映出较好的水平,而负系数反映低于平均水平,系数的绝对值反映了偏差程度的大小。
在第一个主成分F1的表达式中,X1和X3指标上有较高的载荷系数,可以较好地反映学生的写作内容和组织结构;在第二主成分F2的表达式中,X2指标上有较高的载荷系数,可以较好地反映学生的语言文字水平;在第三个主成分F3的表达式中,X4指标上有较高的载荷系数,可以较好地反映学生的写作技术。因此,选取前三个主成分即可对学生的英语写作综合水平给予综合评价。比如,若F2的值较高,则说明这个学生在写作中语言文字方面水平较高,则这个学生需要加强在其他方面的提高,故其综合评价函数如下:
F=0.3690401F1+0.2819632F2+0.2063451F3
下面计算出学生的综合评价水平分值,即F的值,若学生的F值越高,说明学生的英语写作综合水平越高。下表给出学生按F值的排序:
表4 ? 各主成分及综合得分
■
在表4中,各主成分及综合得分为负时,表明该生的写作成绩居班级平均水平之下。按综合得分大小排序,就可得到每个学生的写作综合水平在班级中的名次,综合评价学生和原始排序有所不同,可以反映出学生的英语写作的综合素质、强项和弱项。如总分相加排名第1的9号学生,其分数经过综合处理后降到第2名,这名学生在内容写作、组织结构方面成绩突出(F=2.702006),但语言运用能力较弱(F=-0.64305),今后在学习中要关注如何正确使用英语语言。后一种排名次序改变较大,除了6号学生外,其他学生的得分名次均有所改变。名次顺序浮动较大的是2号、3号和13号学生。笔者就以这三个学生作为代表,对他们的写作情况进行分析。2号学生由原始总分相加排名第13上升到第7名,写作成绩在15名学生中居于中间水平(F=0.044278),从F2(0.424306)和F3(0.805763)的值可以看出,该学生写作的语言文字和写作技术方面水平尚可,但在写作内容、组织结构方面(F1=-0.65474)较弱,低于标准水平,需要加强这方面的训练;3号学生由第11名上升到第4名,这名学生在写作中语言运用能力强 (F2=1.50462),和2号学生一样,需加强写作内容、组织结构方面的训练(F1=-0.56928);13号学生由原始总分相加排名第9下降到第15名,写作成绩在15名学生中最差(F=-0.95434),必须加强对内容结构和写作技术的训练(F1=-1.41493,F3=-1.32725)。
四、结论
主成分分析法从若干指标中选取主要的具有代表性的指标,淡化主要指标的作用,大大简化数据结构;可以客观地确定权重,避免了主观随意性,因而使得评价结果具有科学性、客观性和公正性。利用这种评价方法,可以让学生了解自己在班级中所处的位置,找出自己的不足,从而更有针对性地加强相应的训练,最终提高写作综合素质,还可以有效地区分学生的差异,给教师提供有效的参考数据,帮助学生有针对性地提高英语写作水平。
[ 参 考 文 献 ]
[1] 董琇.基于降维法的译者风格研究[J].外语教学与研究,2014(2):282-293.
[2] Knoch U.The assessment of academic style in EAP writing:The case of the rating scale[J].Melbourne Papers in Langu?鄄
age Testing,2008(1):34-67.
[3] 左映娟,冯蕾.大学英语写作的评分标准维度研究——基于Writingroadmap和批改网的评分对比[J].现代教育技术,2015(8):60-66.
[4] 李航.整体与分项量表的使用对EFL作文评分信度的影响[J].外语与外语教学,2015(2):45-51.
[责任编辑:钟伟芳]
[摘 要]主成分分析法从若干指标中选取主要的具有代表性的指标,淡化主要指标的作用,大大简化数据结构;可以客观地确定权重,避免了主观随意性,因而使得评价结果具有科学性、客观性和公正性。利用这种评价方法,可以让学生了解自己在班级中所处的位置,找出自己的不足,从而更有针对性地加强相应的训练,最终提高写作综合素质。
[关键词]综合评价;主成分分析;英语写作
[中图分类号] H315 [文献标识码] A [文章编号] 2095-3437(2016)11-0171-03
一、引言
近年来,随着统计分析活动的广泛开展,通过对实践活动的总结,逐步形成了一系列运用多个指标对多个单位进行评价的方法,简称综合评价方法。其基本思想是将多个指标转化为一个能够反映综合情况的指标来进行评价。主成分分析法是综合评价方法中一种较新的评价方法。它与现有的专家评分法、模糊综合评价法、灰色聚类法等有着不同的原理和特性,充分考虑了各指标之间的信息重叠,能够在保留原有信息的基础上,最大限度地对高维变量进行最佳的综合降维,且更客观地确定各个指标的权重,避免了主观随意性,提高了综合评价的科学性、客观性及合理性。[1]
在目前的英语教学实践中,分项式评分标准仍然是多数教师经常采用的用来诊断学生的写作水平的方法。研究发现,分项式评分标准适合大学英语写作教学的诊断性评估。[2] [3]这种评分方法能够对学生的英语写作能力作出更加细致和准确的区分,提高英语作文评分信度。[4]也就是说,分项评分法有助于甄别学生作文的弱点是语言表达能力不足的问题,还是思维缺乏条理性,篇章布局和逻辑性差等细节问题。但是,由于各分项的指标受重视程度会有差别,所以各项得分的简单相加并不能全面地反映学生的英语写作水平及写作中存在的主要问题。主成分分析法通过对学生英语作文评分指标进行标准化处理,突出显示学生的强项与弱项,从而给教师和学生本身提供一个有针对性的参考,了解每个学生在哪些方面需要加强,从而达到学生英语写作水平的综合提高。这对教师有针对性地改进教学有着重要的作用。
二、主成分分析数学模型及过程
假设我们研究n个学生的英语作文综合水平,考查英语作文的p项指标。记第i个学生的p项指标值分别为xi1,xi2,…,xip,其中xij为第i个学生的第j项数据值,则这n个学生的p项指标值可以表示成n×p矩阵。利用公式,将原始数据标准化处理,其中xj=xij为第j个指标的样本均值,Sj=为样本标准差。经标准化处理后的相关系数为,其中i,j=1,2,…,p,则得到相关系数矩阵为R=(rij)p×p。然后,求出相关矩阵R的p个特征值λ1,λ2,…,λp以及对应的特征向量。设λi对应的特征向量为Ci=(c1i,…,cpi),其中i=1,2,…,p。则我们得到p个主分量,其中第i个主分量表示为Fi=c1iX1+c2iX2+…+cpiXp。
第i个主成分Fi的特征值μi即主成分的方差。方差越大,对总方差的贡献越大,对总变量的贡献也越大,其贡献率为ηi=μi ?/ μk,其中ηi反映了第i个主成分综合原始变量信息比。
选取m个主成分,如果前面m个主成分贡献率之和接近于1,一般来说,只要达到85%就可以,我们就取前m个主成分F1,…,Fm,也就是说,这m个主成分基本保留了原来指标变量的信息。这样,指标或者变量就减少到m个,从而起到了筛选指标或者变量的作用。对于以上的计算,我们采用MATLAB数学软件进行。
三、英语写作评价实例分析
现以江苏师范大学数学系二年级某班随意抽取15名学生在一次英语写作的成绩为例。这次写作评分分为四个部分,包括内容(5分)、语言文字(5分)、组织结构(3分)、写作技术(包括拼写、标点符号、大小写及字数等,2分)四个部分,共15分的评分。这四项指标标记分别记为内容(X1)、语言文字(X2)、组织结构(X3)、写作技术(X4),学生的各项指标分数见表1。
对15位学生四项指标进行标准化处理,结果见表2。
根据表2中的数据,算出四项指标的相关系数矩阵R,即
■
从R出发,计算出特征值、方差贡献率、累计贡献率和特征向量,结果如下表。
于是,主分量与标准变量的关系为
F1=0.5857213X1+0.0529997X2+0.6843405X3+0.4310448X4,
F2=-0.413745X1+0.7703048X2-0.011086X3+0.4851006X4,
F3=-0.302631X1-0.614473X2-0.143337X3+0.7143474X4,
F4=-0.627822X1-0.162002X2+0.7148493X3-0.261888X4.
由表3可知,前三个主成分F1~F3的累计贡献率为85.73%,满足≥85%的条件,因此可以用前3个主成分进行综合评价。其中,相应的Xi的系数反映了偏差程度,正系数反映出较好的水平,而负系数反映低于平均水平,系数的绝对值反映了偏差程度的大小。
在第一个主成分F1的表达式中,X1和X3指标上有较高的载荷系数,可以较好地反映学生的写作内容和组织结构;在第二主成分F2的表达式中,X2指标上有较高的载荷系数,可以较好地反映学生的语言文字水平;在第三个主成分F3的表达式中,X4指标上有较高的载荷系数,可以较好地反映学生的写作技术。因此,选取前三个主成分即可对学生的英语写作综合水平给予综合评价。比如,若F2的值较高,则说明这个学生在写作中语言文字方面水平较高,则这个学生需要加强在其他方面的提高,故其综合评价函数如下:
F=0.3690401F1+0.2819632F2+0.2063451F3
下面计算出学生的综合评价水平分值,即F的值,若学生的F值越高,说明学生的英语写作综合水平越高。下表给出学生按F值的排序:
表4 ? 各主成分及综合得分
■
在表4中,各主成分及综合得分为负时,表明该生的写作成绩居班级平均水平之下。按综合得分大小排序,就可得到每个学生的写作综合水平在班级中的名次,综合评价学生和原始排序有所不同,可以反映出学生的英语写作的综合素质、强项和弱项。如总分相加排名第1的9号学生,其分数经过综合处理后降到第2名,这名学生在内容写作、组织结构方面成绩突出(F=2.702006),但语言运用能力较弱(F=-0.64305),今后在学习中要关注如何正确使用英语语言。后一种排名次序改变较大,除了6号学生外,其他学生的得分名次均有所改变。名次顺序浮动较大的是2号、3号和13号学生。笔者就以这三个学生作为代表,对他们的写作情况进行分析。2号学生由原始总分相加排名第13上升到第7名,写作成绩在15名学生中居于中间水平(F=0.044278),从F2(0.424306)和F3(0.805763)的值可以看出,该学生写作的语言文字和写作技术方面水平尚可,但在写作内容、组织结构方面(F1=-0.65474)较弱,低于标准水平,需要加强这方面的训练;3号学生由第11名上升到第4名,这名学生在写作中语言运用能力强 (F2=1.50462),和2号学生一样,需加强写作内容、组织结构方面的训练(F1=-0.56928);13号学生由原始总分相加排名第9下降到第15名,写作成绩在15名学生中最差(F=-0.95434),必须加强对内容结构和写作技术的训练(F1=-1.41493,F3=-1.32725)。
四、结论
主成分分析法从若干指标中选取主要的具有代表性的指标,淡化主要指标的作用,大大简化数据结构;可以客观地确定权重,避免了主观随意性,因而使得评价结果具有科学性、客观性和公正性。利用这种评价方法,可以让学生了解自己在班级中所处的位置,找出自己的不足,从而更有针对性地加强相应的训练,最终提高写作综合素质,还可以有效地区分学生的差异,给教师提供有效的参考数据,帮助学生有针对性地提高英语写作水平。
[ 参 考 文 献 ]
[1] 董琇.基于降维法的译者风格研究[J].外语教学与研究,2014(2):282-293.
[2] Knoch U.The assessment of academic style in EAP writing:The case of the rating scale[J].Melbourne Papers in Langu?鄄
age Testing,2008(1):34-67.
[3] 左映娟,冯蕾.大学英语写作的评分标准维度研究——基于Writingroadmap和批改网的评分对比[J].现代教育技术,2015(8):60-66.
[4] 李航.整体与分项量表的使用对EFL作文评分信度的影响[J].外语与外语教学,2015(2):45-51.
[责任编辑:钟伟芳]