在医学统计学教学及教材中取消有关界值表的改革建议
李湘鸣+王劲松
[摘 要]医学统计学教学离不开概率的计算。而在传统的医学统计学教学中,概率是通过查相应的密度函数分布表(如t值、u值(或Z值)、F值及χ2值表等)获得的,无法满足医学科学发展的需求。随着人民生活水平的提高、计算机和有关应用软件的普及,大学医学统计学教学应与时俱进,可用计算机的密度函数取代现行的密度函数分布表。
[关键词]计算机密度函数;界值表;医学统计学
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2016)04-0091-02在医学研究中,人们要对医学数据进行整理、分析、判断,最后得出结论,而这一切都离不开医学统计学,所以医学统计学是一门应用性很强的学科。由于课程原理主要涉及高等数学的概率分布,且概念抽象、具有逻辑推理性,特别涉及密度函数的分布时,所计算出来的统计量,如t值、u值(或Z值)、F值及χ2值等,需通过查相应的密度函数分布表(多数医学统计学书称之为界值表),获得相应的P值(即概率),然后进行判断。由于密度函数分布表的有限性,它所得到的P值多数为一范围值,如0.1>P>0.05或0.01一、取消界值表的现实性与可行性
在60~70年代,学生上数学课或做课外数学作业时,经常会用到平方表、算术平方根表、三角函数表、反三角函数表、对数表、反对数表以及随机数字表等。随着科学技术的发展、计算机的普及,这些表陆续退出了历史的舞台。
同样,随着我国人民生活水平的提高,笔记本电脑在大学生中已经普及,在我校,平均一个大学生(包括贫困生)有一台笔记本电脑。由此可以推断:笔记本电脑如同手机一样,已成为大学生的必备。同时,相应的计算机软件,如Office、WPS等办公软件,已经得到普遍的应用。这为医学统计学取消有关界值表创造了良好的条件,也为理论教学与实践(练习)的结合打下了良好的基础,消除了以往的教学与实践相脱节的弊端。
二、界值表与计算机函数
(一)标准正态分布面积表与标准正态分布函数
标准正态曲线呈对称分布,多数医学统计学教材在设计面积分布表时,均给出1 / 2的概率分布,另一半则需要根据对称性的原理进行推算。而且由于表的有限性,所给出的面积和u(或Z)的界值也十分有限。
众所周知,标准正态曲线下面积是从-∞向+∞积分所得,面积为1。在EXCEL或WPS表格的统计函数(Statistical)中,提供了NORMSDIST,格式为NORMSDIST(z)。参数Z为从-∞积分到当前Z(或u)值的面积或概率。例如,公式“=NORMSDIST(-1.23)”的计算结果为0.109348552,即从-∞到-1.23的曲线下面积(或概率)为0.109348552。同时,NORMSDIST函数具有返回标准正态累积分布函数(反函数),格式为NORMSINV(probability),返回从-∞到任意曲线下累积面积的u(或Z)的界值。例如,公式“=NORMSINV(0.109348552)”返回-1.23。
(二)t值表与t分布函数
t分布曲线形态是与自由度(Degree of freedom)大小有关的对称分布曲线,与标准正态分布曲线相比,曲线下面积仍为1,但是,自由度愈大,t分布曲线愈接近标准正态分布。多数医学统计学的t值表(或t界值表)分别有限地给出了在一定的自由度下,t分布曲线下双尾侧或单尾侧的概率,实际上是任意一侧的积分面积,或者两侧的积分面积之和。
在EXCEL或WPS表格的统计函数中,有TDIST函数,返回t分布双侧或单侧的概率,格式为TDIST(x,degrees_freedom,tails)。X为计算的t值;Degrees_freedom为自由度;Tails指明返回的分布函数是双侧或单侧分布的概率。如果tails=2,函数TDIST返回双侧概率;如果tails=1,函数TDIST返回单侧分布概率。使用此函数可以代替t分布的临界值表。例如,t=2.343,degrees_freedom=10,公式“=TDIST(2.343,10,2)”返回0.041128661,即从-∞到-2.343与+∞到+2.343的两侧概率之和;如果Tails=1,自动返回左侧或右侧曲线下面积或概率(如为0.020564331,即0.041128661/2)。由此可见,t值必须为绝对值。同样,TDIST函数具有TINV反函数,TINV函数可返回某一概率和自由度t分布曲线下的t值,格式为TINV(probability,degrees_freedom)。参数Probability为对应于双侧t分布的概率,Degrees_freedom为分布的自由度。例如,公式“=TINV(0.041128661,10)”返回2.343,即当前曲线下,两侧的t值分别为-2.343和+2.343。
(三)F值表与F分布函数
F值表来自F分布,由于与两个数据集的自由度变化有关以及表的有限性,仅有右侧的0.05和0.01两个概率值,无法满足医学科研的实际需要。而在EXCEL或WPS表格的FDIST函数中,可提供两个数据集任意自由度变化的右侧任何概率积分,格式为FDIST(x,deg_freedom1,deg_freedom2)。X为所计算的F值;Deg_freedom1为分子自由度;Deg_freedom2为分母自由度。例如,经方差分析、计算,得F=5.343,分子自由度(组间)=3,分母自由度(组内)=28,公式“=FDIST(5.343,3,28)”返回0.004883957,即在F分布曲线下,从+∞到5.343右侧的面积(概率)为0.004883957。同样,FDIST有FINV反函数。FINV函数返回F分布右侧概率的F界值,格式为FINV(probability,deg_freedom1,deg_freedom2)。Probability为F分布右侧的概率,即P值;Deg_freedom1为分子自由度;Deg_freedom2为分母自由度。例如,已知F分布曲线下右侧的概率(P)=0.005,分子自由度(组间)=3,分母自由度(组内)=28,那么其相应的F界值是多少?可用公式“=FINV(0.005,3,28)”,返回5.317,即当前的F分布曲线下,当P=0.005时,其F界值为5.317。
(四)χ2值表与χ2分布函数
卡方(χ2)值表同t值表类似,与自由度有关,所给出的概率和χ2值也是有限的。而EXCEL或WPS表格的CHIDIST函数可取代χ2值表,格式为CHIDIST(x,degrees_freedom),可返回χ2分布曲线下右侧的概率。X为计算的χ2数值;Degrees_freedom为自由度。例如,经卡方分析、计算,得χ2=8.643,自由度=3,公式“=CHIDIST (8.643,3)”返回0.034434,即在当前的χ2分布曲线下,从+∞到8.643右侧的面积(概率)为0.034434。同样,CHIINV为CHIDIST的反函数,计算χ2分布曲线下右侧概率的反函数值,即χ2界值,格式为CHIINV(probability,degrees_freedom)。例如,已知当前的χ2分布曲线下右侧P=0.005,自由度=3,求其相应的χ2界值。可用公式“=CHIINV (0.005,3)”返回12.838,即在当前的χ2分布曲线下,当右侧面积(概率)为0.005时,其相应的χ2界值为12.838。
至于在直线相关分析、秩和检验中所用到r界值表和T界值表,实际上来自t分布、χ2或u(Z)分布,可用其相应的计算机函数代替。而在方差分析中,所用到的Q界值表等,在我国比较普及的SPSS或SAS等统计软件提供了相应的分布概率值。特别是SPSS软件,因其为菜单式界面和对话框的特点,教师易于操作,只需点击鼠标就可完成,比较适合于在课堂教学中运用,也可为学生今后的学术发展打下一定的基础。该软件是在医学界非专业人员应用最多的统计分析软件,也是国际医学期刊引用最多的统计软件。[4]
三、意义
(一)统计界值表的取消可促进教学效率的提高
在传统的医学统计学教学中,教师多侧重于某一章节理论知识的讲授,然后安排学生到计算机房进行相应的统计实习。由于实习课与理论课有一定的时间间隔,多数学生遗忘了理论知识,故容易出现理论与实际相脱节的现象。
在医学统计学教学中,取消有关统计界值表的教学内容可促使教师将教学与计算机结合起来,将统计学理论与实践结合起来,加深学生对统计学理论的理解,提高学生综合运用理论和方法的能力。
例如,对于标准正态分布,为何其标准差为1,均数为0?以往的教学中,教师往往通过数学证明,或者让学生死记,学生只知其然,不知其所以然。但是,如果教师课前将大样本资料通过QQ群传给学生,上课首先简单地讲解一下数学公式证明,然后让学生用计算机求出样本资料均数和标准差,再通过均数和标准差求出各观察值u(Z),用计算机绘u(Z)直方分布图,并求其均数和标准差。不难发现u(Z)呈正态分布,其均数和标准差为0。
(二)统计界值表的取消可提高学生的学习能力和教师的教学水平
将计算机直接引入课堂后,可以让学生通过自身的电脑产生一个合理的随机数,并与课堂作业练习相结合。这样将复杂统计资料的处理、运算与具体的实践相融合,可大大激发学生的学习兴趣,提高学生综合分析、解决问题的能力,避免作业互相抄袭的现象。
统计界值表的取消必然要求学生“带电脑进课堂”。由于学生所带电脑的“档次”不同,会出现不同版本的操作系统和应用软件。这迫使教师要在课前熟悉不同版本的操作系统和应用软件。课中主导与从属地位的相互转换,促进了教师与学生的互动,既可获得良好的教学效果,又可极大地提高教师的教学水平。
[ 参 考 文 献 ]
[1] 陈启光,陈炳为.医学统计学(第三版)[M].南京:东南大学出版社,2013:222-236.
[2] 高祖新.医药数理统计学方法(第五版)[M].北京:人民卫生出版社,2013:268.
[3] 方积乾,徐勇勇.卫生统计学(第七版)[M].北京:人民卫生出版社,2012:458.
[4] 李英.浅谈统计学基础的教学改革[J].高校讲坛,2011(2):265-266.
[责任编辑:钟伟芳]
[摘 要]医学统计学教学离不开概率的计算。而在传统的医学统计学教学中,概率是通过查相应的密度函数分布表(如t值、u值(或Z值)、F值及χ2值表等)获得的,无法满足医学科学发展的需求。随着人民生活水平的提高、计算机和有关应用软件的普及,大学医学统计学教学应与时俱进,可用计算机的密度函数取代现行的密度函数分布表。
[关键词]计算机密度函数;界值表;医学统计学
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2016)04-0091-02在医学研究中,人们要对医学数据进行整理、分析、判断,最后得出结论,而这一切都离不开医学统计学,所以医学统计学是一门应用性很强的学科。由于课程原理主要涉及高等数学的概率分布,且概念抽象、具有逻辑推理性,特别涉及密度函数的分布时,所计算出来的统计量,如t值、u值(或Z值)、F值及χ2值等,需通过查相应的密度函数分布表(多数医学统计学书称之为界值表),获得相应的P值(即概率),然后进行判断。由于密度函数分布表的有限性,它所得到的P值多数为一范围值,如0.1>P>0.05或0.01一、取消界值表的现实性与可行性
在60~70年代,学生上数学课或做课外数学作业时,经常会用到平方表、算术平方根表、三角函数表、反三角函数表、对数表、反对数表以及随机数字表等。随着科学技术的发展、计算机的普及,这些表陆续退出了历史的舞台。
同样,随着我国人民生活水平的提高,笔记本电脑在大学生中已经普及,在我校,平均一个大学生(包括贫困生)有一台笔记本电脑。由此可以推断:笔记本电脑如同手机一样,已成为大学生的必备。同时,相应的计算机软件,如Office、WPS等办公软件,已经得到普遍的应用。这为医学统计学取消有关界值表创造了良好的条件,也为理论教学与实践(练习)的结合打下了良好的基础,消除了以往的教学与实践相脱节的弊端。
二、界值表与计算机函数
(一)标准正态分布面积表与标准正态分布函数
标准正态曲线呈对称分布,多数医学统计学教材在设计面积分布表时,均给出1 / 2的概率分布,另一半则需要根据对称性的原理进行推算。而且由于表的有限性,所给出的面积和u(或Z)的界值也十分有限。
众所周知,标准正态曲线下面积是从-∞向+∞积分所得,面积为1。在EXCEL或WPS表格的统计函数(Statistical)中,提供了NORMSDIST,格式为NORMSDIST(z)。参数Z为从-∞积分到当前Z(或u)值的面积或概率。例如,公式“=NORMSDIST(-1.23)”的计算结果为0.109348552,即从-∞到-1.23的曲线下面积(或概率)为0.109348552。同时,NORMSDIST函数具有返回标准正态累积分布函数(反函数),格式为NORMSINV(probability),返回从-∞到任意曲线下累积面积的u(或Z)的界值。例如,公式“=NORMSINV(0.109348552)”返回-1.23。
(二)t值表与t分布函数
t分布曲线形态是与自由度(Degree of freedom)大小有关的对称分布曲线,与标准正态分布曲线相比,曲线下面积仍为1,但是,自由度愈大,t分布曲线愈接近标准正态分布。多数医学统计学的t值表(或t界值表)分别有限地给出了在一定的自由度下,t分布曲线下双尾侧或单尾侧的概率,实际上是任意一侧的积分面积,或者两侧的积分面积之和。
在EXCEL或WPS表格的统计函数中,有TDIST函数,返回t分布双侧或单侧的概率,格式为TDIST(x,degrees_freedom,tails)。X为计算的t值;Degrees_freedom为自由度;Tails指明返回的分布函数是双侧或单侧分布的概率。如果tails=2,函数TDIST返回双侧概率;如果tails=1,函数TDIST返回单侧分布概率。使用此函数可以代替t分布的临界值表。例如,t=2.343,degrees_freedom=10,公式“=TDIST(2.343,10,2)”返回0.041128661,即从-∞到-2.343与+∞到+2.343的两侧概率之和;如果Tails=1,自动返回左侧或右侧曲线下面积或概率(如为0.020564331,即0.041128661/2)。由此可见,t值必须为绝对值。同样,TDIST函数具有TINV反函数,TINV函数可返回某一概率和自由度t分布曲线下的t值,格式为TINV(probability,degrees_freedom)。参数Probability为对应于双侧t分布的概率,Degrees_freedom为分布的自由度。例如,公式“=TINV(0.041128661,10)”返回2.343,即当前曲线下,两侧的t值分别为-2.343和+2.343。
(三)F值表与F分布函数
F值表来自F分布,由于与两个数据集的自由度变化有关以及表的有限性,仅有右侧的0.05和0.01两个概率值,无法满足医学科研的实际需要。而在EXCEL或WPS表格的FDIST函数中,可提供两个数据集任意自由度变化的右侧任何概率积分,格式为FDIST(x,deg_freedom1,deg_freedom2)。X为所计算的F值;Deg_freedom1为分子自由度;Deg_freedom2为分母自由度。例如,经方差分析、计算,得F=5.343,分子自由度(组间)=3,分母自由度(组内)=28,公式“=FDIST(5.343,3,28)”返回0.004883957,即在F分布曲线下,从+∞到5.343右侧的面积(概率)为0.004883957。同样,FDIST有FINV反函数。FINV函数返回F分布右侧概率的F界值,格式为FINV(probability,deg_freedom1,deg_freedom2)。Probability为F分布右侧的概率,即P值;Deg_freedom1为分子自由度;Deg_freedom2为分母自由度。例如,已知F分布曲线下右侧的概率(P)=0.005,分子自由度(组间)=3,分母自由度(组内)=28,那么其相应的F界值是多少?可用公式“=FINV(0.005,3,28)”,返回5.317,即当前的F分布曲线下,当P=0.005时,其F界值为5.317。
(四)χ2值表与χ2分布函数
卡方(χ2)值表同t值表类似,与自由度有关,所给出的概率和χ2值也是有限的。而EXCEL或WPS表格的CHIDIST函数可取代χ2值表,格式为CHIDIST(x,degrees_freedom),可返回χ2分布曲线下右侧的概率。X为计算的χ2数值;Degrees_freedom为自由度。例如,经卡方分析、计算,得χ2=8.643,自由度=3,公式“=CHIDIST (8.643,3)”返回0.034434,即在当前的χ2分布曲线下,从+∞到8.643右侧的面积(概率)为0.034434。同样,CHIINV为CHIDIST的反函数,计算χ2分布曲线下右侧概率的反函数值,即χ2界值,格式为CHIINV(probability,degrees_freedom)。例如,已知当前的χ2分布曲线下右侧P=0.005,自由度=3,求其相应的χ2界值。可用公式“=CHIINV (0.005,3)”返回12.838,即在当前的χ2分布曲线下,当右侧面积(概率)为0.005时,其相应的χ2界值为12.838。
至于在直线相关分析、秩和检验中所用到r界值表和T界值表,实际上来自t分布、χ2或u(Z)分布,可用其相应的计算机函数代替。而在方差分析中,所用到的Q界值表等,在我国比较普及的SPSS或SAS等统计软件提供了相应的分布概率值。特别是SPSS软件,因其为菜单式界面和对话框的特点,教师易于操作,只需点击鼠标就可完成,比较适合于在课堂教学中运用,也可为学生今后的学术发展打下一定的基础。该软件是在医学界非专业人员应用最多的统计分析软件,也是国际医学期刊引用最多的统计软件。[4]
三、意义
(一)统计界值表的取消可促进教学效率的提高
在传统的医学统计学教学中,教师多侧重于某一章节理论知识的讲授,然后安排学生到计算机房进行相应的统计实习。由于实习课与理论课有一定的时间间隔,多数学生遗忘了理论知识,故容易出现理论与实际相脱节的现象。
在医学统计学教学中,取消有关统计界值表的教学内容可促使教师将教学与计算机结合起来,将统计学理论与实践结合起来,加深学生对统计学理论的理解,提高学生综合运用理论和方法的能力。
例如,对于标准正态分布,为何其标准差为1,均数为0?以往的教学中,教师往往通过数学证明,或者让学生死记,学生只知其然,不知其所以然。但是,如果教师课前将大样本资料通过QQ群传给学生,上课首先简单地讲解一下数学公式证明,然后让学生用计算机求出样本资料均数和标准差,再通过均数和标准差求出各观察值u(Z),用计算机绘u(Z)直方分布图,并求其均数和标准差。不难发现u(Z)呈正态分布,其均数和标准差为0。
(二)统计界值表的取消可提高学生的学习能力和教师的教学水平
将计算机直接引入课堂后,可以让学生通过自身的电脑产生一个合理的随机数,并与课堂作业练习相结合。这样将复杂统计资料的处理、运算与具体的实践相融合,可大大激发学生的学习兴趣,提高学生综合分析、解决问题的能力,避免作业互相抄袭的现象。
统计界值表的取消必然要求学生“带电脑进课堂”。由于学生所带电脑的“档次”不同,会出现不同版本的操作系统和应用软件。这迫使教师要在课前熟悉不同版本的操作系统和应用软件。课中主导与从属地位的相互转换,促进了教师与学生的互动,既可获得良好的教学效果,又可极大地提高教师的教学水平。
[ 参 考 文 献 ]
[1] 陈启光,陈炳为.医学统计学(第三版)[M].南京:东南大学出版社,2013:222-236.
[2] 高祖新.医药数理统计学方法(第五版)[M].北京:人民卫生出版社,2013:268.
[3] 方积乾,徐勇勇.卫生统计学(第七版)[M].北京:人民卫生出版社,2012:458.
[4] 李英.浅谈统计学基础的教学改革[J].高校讲坛,2011(2):265-266.
[责任编辑:钟伟芳]