大数据时代下统计学科建设与教学改革的几点思考
王婷婷
[摘 要]大数据时代的来临给统计学科建设与教学带来了不小的挑战。传统的统计学科在认知水平、技术手段、内容框架等方面均需要进行革新。在回顾统计学科发展历史沿革以及大数据时代数据特征的基础上,对新时代下统计学科面临的传统统计手段的不适应性、传统统计学科框架不能满足时代要求、统计学专业设置与社会需求脱节和统计学师资队伍建设不够完善等问题进行阐述,可以得出相应的对策。
[关键词]统计学;大数据时代;学科建设;教学改革
[中图分类号] G642.0 [文献标识码] A [文章编号] 2095-3437(2017)06-0009-04
21世纪是一个信息化的时代,尤其在2012年之后,大数据逐渐进入寻常百姓的生活,并深刻影响着这个时代的变革。大数据时代下海量数据所隐藏着的巨大价值不可小觑。因此,如何应用、分析、挖掘数据背后的隐含知识、潜在规律成为各个领域所关注的热点话题,统计学科的重要性不断彰显。早在2011年2月,国务院学位委员会就将统计学科设为一级学科[1],改变了统计学科被分别安放在经济学门类和理学门类下的历史局面,从此终结了统计学究竟是应用经济学范畴还是概率论与数理统计学范畴的各种争论。如今的统计学,就是关于数据科学的学科,在理学门类之下理学学位和经济学学位均可授予。站在大数据时代的风口浪尖,在统计学科成为一级学科的历史背景下,统计学在全国各个院校的发展如火如荼。但如何让统计学科适应大数据的时代要求,如何培养胜任各种数据挖掘能力的人才,是奋斗在统计学教育一线同仁们所必须面对的问题。
一、传统统计学的发展历史
统计学源于实践与应用,当人类开始从事生产劳动以来,统计学就慢慢建立和发展起来。在西方,一般认为统计学始于古希腊时期的亚里士多德时代,并在此后开枝散叶。而中国也是世界上最早进行统计活动的国家,具有国际公认的最早的统计史料,但先秦之后发展缓慢,未成气候。1930年,中国统计学会成立,这是中国最早的统计学研究群体。
此后统计学的发展大致分为以下几个阶段:1.苏联模式模仿期。新中国成立后,我国在经济模式上采用了计划经济体制,同时也引入了苏联的马克思统计理论与模式。在这种模式之下,统计学仅仅是计划经济制度的专属工具,其抑制了数理统计学派的发展。因此,这个阶段下的中国统计学发展逐渐丧失活力,未能与西方统计学的主流研究方向接轨。2.改革开放时期的再认识。随着我国改革开放的不断深入,不断涌现的新事物导致传统模式下的苏联统计理论与我国实践工作形成不可避免的矛盾,依附于计划经济的统计学逐渐丧失生命力,这一现象引起了我国学者的反思。在这种背景下,欧美体系下的统计学逐步进入中国市场,并引发了一场关于统计学科建设的学术争鸣。3.20世纪90年代的“大统计”思想。随着我国改革开放的不断深化,统计学在社会经济统计学和数理统计学两个方面蓬勃发展起来。于是“大统计”的提法日渐增多,20世纪90年代尤其是20世紀90年代中后期有关统计学发展的文献,都在讨论统计学的融合与构建问题。“大统计”思想是对传统认识局限的一次突破,它为中国统计学在下一个世纪的发展提供了理论前提。4.大数据时代下统计学的新机遇。从上述3个阶段可以看出,统计学的发展与其时代背景息息相关。进入21世纪以来,在大数据的时代背景下,统计学在学科建设与教学改革方面该有怎样的侧重和突破,这正是身处这个时代的统计学人应该思考的问题。要对这个问题进行剖析,必须了解这个时代的数据特点。
二、大数据时代的数据特征
在20世纪90年代,信息化开疆拓土给数据的产生带来了指数级的增长模式,这一现象就曾引起美国社会的广泛讨论和研究。进入21世纪以来,社会高速发展、信息飞速流通、科技不断进步,这使得“大数据时代”呼之欲出。2012年,由维克托·迈尔-舍恩伯格 (Viktor Mayer?鄄Sch?觟nberger)和肯尼思·库克耶 (Kenneth Cukier)联合编著的《大数据时代:生活、工作与思维的大变革》给社会带来了不小的反响,学术界也逐渐摩拳擦掌地迎接大数据时代的来临。[2]
著名的4V理论有效揭示了大数据的主要特征。[3]1.Volume:海量的数据规模。在当下社会,每一分每一秒都伴随着大量数据的产生,由于数据的驱动性,现在的数据量已经不再是传统的TB、PB级别,其早已经扩展到EB、ZB乃至更高的级别。2.Velocity:快速的数据流转和动态的数据体系。在一个瞬息万变的社会中,数据是一种流动的状态,大量数据可以随时随地产生并改变,这种动态性给统计分析带来了巨大的挑战。3.Vari?鄄ety:多样的数据类型。大数据不但具有动态性,还具有多样性。数据形式包括:文本数据、网页数据、行为数据、图片数据、声音数据、多媒体数据等各种各样的数据形态。4.Value:巨大的数据价值。曾经有人把Data mining称为数据采矿,倘若在传统的数据模式下数据都蕴含着丰富的“矿藏”,那么大数据时代下的数据价值则是我们难以想象的。正因为数据拥有巨大的价值,这才使我们有了进一步分析处理的动力。
大数据时代下的数据特征给传统统计学带来了不小的冲击。作为一门处理、分析数据的学科,在新时代下必须认清统计学科所面临的问题,这样才能有的放矢地进行革新,采用新的技术手段驾驭新时代的数据,为社会进步做出应有的贡献。
三、新时代下统计学科面临的问题
(一)传统统计手段的不适应性
传统的统计思维模式基本是以问题为导向,确立要研究的问题之后,再着手获取数据。国家统计局所开展的数据普查和抽样调查都是基于这种模式。对于数据索取能力较弱的科研院所或个人而言,其没有能力进行大规模抽样调查的能力,一般是通过各种官方数据库获取数据用以科学研究。但用传统抽样调查手段所获取的数据,是用样本估计总体的思路进行,倘若调查方案设计合理、操作得当,误差可以控制在允许范围之内,这不失为一种良好的统计手段。但在大数据时代下,不仅难以有效地抽取数据,而且没有简洁有效的技术手段对数据进行分析,这给抽样调查带来了不小的麻烦,其省时省力的优势也不复存在。类似的问题在传统统计方法的发展中依然存在。因此,需要紧贴时代背景,建立一套适用于当下的统计分析模式,以便更加科学高效地开展统计分析工作。
(二)传统统计学科框架不能满足时代要求
统计学是从大量实践经验中所逐渐发展形成的一门对数据进行搜集、处理、分析的学科。统计学的产生与数据有着不解之缘,因此,有关大数据的处理必然离不开统计理论和技术的支撑。但是,传统的统计思想、分析手段以及分析设备等都无法满足大数据时代的发展要求。在人类迈入新纪元以来,互联网技术日臻成熟,社会信息化程度出现质的飞跃,大量半结构化、非结构化数据源源不断地产生,人们对各种类型数据资源的潜在规律以及数据回报价值都有迫切的需求。[4]这要求统计学有一套完整的学科框架体系去驾驭大数据,具备对海量非结构化、半结构化、实时性数据等的有效分析能力。而大数据时代下的数据分析工作,已经从根本上打破了传统统计学科的框架。
(三)统计学专业设置与社会需求脱节
当前统计学学生的培养方式虽然逐渐向应用层面倾斜,但形式与内容相对老套。在这种模式下,理论模型的建立、参数估计的方法、一些统计量的检验等都得到了足够的重视,但学生对这些问题的认识很可能还停留在表面。虽然部分课程安排有上机实践操作,但由于数据局限性等原因,其所带来的案例相对老旧、与时代脱节的情况时有发生。这导致学生不能很好地学以致用。另外,大数据时代下的统计分析工作,由于数据的海量性、动态性等特点,工作量相对较大,需要团队的分工协作才能很好地完成。而在我们日常的教学中,由于面向传统的统计手段较多,学生基本都是个人完成案例,这种教学方式难以培养学生在数量搜集、处理、分析中的团队协作精神,而这种精神在学生今后的工作岗位中是应该必备的。
(四)统计学师资队伍建设不够完善
由于统计学的蓬勃发展以及社会对统计学人才的迫切需求,各个院校纷纷成立(或筹备成立)统计学院,导致统计学教师相对紧缺。在教资力量相对不够充足的情况下,统计学科依然面临一个严峻的问题。这个问题就是在现有的教师队伍中,大部分教师接受的均是传统统计理论方法的训练,专业和研究成果也都偏向于经济统计、数理统计的传统模型、实证分析等方面。在传统领域,大部分教师具备教学与科研的经验,具有相当深厚的功底及心得。但是在大数据领域、有关大数据的清洗、降维、处理、可视化;云计算、云平台、分布式计算、并行计算的hadoop、Spark、MapReduce等有关大数据的挖掘理论和技能方面,则出现断层。对于绝大多数教师而言,这也是一个相对陌生的领域。因此,这引发了统计学师资队伍知识结构不完善的问题。
四、解决新时代下统计学面临问题的对策
(一)针对新问题,寻找新的统计技术手段
大数据时代下,数据量巨大、数据信息瞬息万变、数据类型多种多样,数据结构也由原来单一的结构化数据变为非结构化、半结构化数据模式。面对新的问题,对于海量数据的存储、清洗、数据挖掘、知识呈现、数据传输、管理等各个方面都需要有新的技术手段加入。[5]因此,我们需要从各个细小的环节入手,从而形成一个完备统一的处理大数据问题的新模式和新框架。这个过程需要其他领域专业人员的支持和协作,其中包括计算机、数学、经济学、信息学、管理学等。1.数据获取阶段。数据获取的途径有很多,不应再拘泥于过去翻阅式的查找和抽样调查。由于大部分数据均产生于互联网,因此我们不得不通过爬虫技术对所需数据进行爬取,从而获得海量的一手数据。2.数据清洗、降噪、降维等预处理阶段。这一阶段是大数据分析的开始,任何一种分析都不能离开有效的数据而进行,对原始数据的整理、清洗等工作直接影响到后续统计分析的有效性和科学性。3.数据挖掘、知识发现。这是整个数据分析中最为关键的环节,是整个分析的核心所在。在此需要强调的是,并非在大数据时代所有的传统统计方法都不可使用。当经过数据预处理、把数据转出化成传统数据模式之后,传统统计分析方法依然有其用武之地,且传统统计分析方法当中宝贵的统计思维模式和统计视野也是我们解决大数据问题的智库。因此,对于传统统计分析方法要给予足够的重视,其在大数据时代也有广阔的舞台。我们要在继承的基础上,进行改进、创新和发扬。
(二)系统性调整统计学科框架,以适应时代发展
在大数据时代下,统计学同样需要加入信息化的过程。虽然大数据与统计学有着千丝万缕的联系,但是由于面对的数据类型、对象等的不同,传统统计学的研究范式已经不能适应新时代的要求。这主要表现在以下几方面:1.统计对象的改变。新时代下的统计数据从数量、结构和类型上早已打破传统统计学的数据概念。2.统计技术的改变。新时代下关于数据的搜集、整理、知识发现等数据处理手段相较于传统的统计学科,已经发生了巨大的变化。3.数据仓库的建设和使用。关于海量数据的存储、调取、传输、管理是在传统统计学当中较容易被忽视的环节。传统统计学下的数据量较小,对其的存储、传输和管理并不存在问题,但海量数据出现之后,这个话题则成为统计学需要重点研究的问题之一。因此,我们需要从更高的视野重新构建统计学的学科框架,使其达到能驾驭大数据时代的目的,从而为人们的生产、生活提供科學有效地指导和帮助。首先,要从思想上打破对传统统计学的认识,将视野投放到更加广阔的数据天地。客观对待传统统计学在社会发展中所出现的滞后性问题。其次,应寻求多学科协作,信息资源共享。没有任何一种单一的技术分析手段可以贯穿大数据分析的始终,它需要多种学科的交叉与融合。因此,统计学的学科框架不能故步自封,一定要兼容并蓄,这样才有新活力。最后,统计学科框架的建设要体现出大数据时代的信息化。对信息的收集与爬取、清洗与降维、分析与挖掘、结果与展示等各个方面,都需要在传承经典的基础上,进行大胆地突破性改革。从而建设一个能够在新历史背景下解决新数据问题的学科,从而培养出适应这个时代发展的统计分析人才。
(三)改良统计学科内容设置,满足新时代下的社会需求
关于统计学科的专业培养方案。目前,基于传统统计学的模式,可以采取两种统计方式进行培养。这就是我们熟知的数理类和经济类,这两类具有不同的侧重点和学科背景。“大统计”思想的提出以及统计学一级学科的成立,终于可以让统计学汇到统计学院或者统计系的框架下统一培养。由于西方主流统计学甚至经济学,均注重数理思维和能力,任何一个统计分析手段和经济模型都离不开数学推导、演算,因此,打好数理基础成为我国统计学科建设的普遍共识。在本科生的培养方案中,就包含数学分析、高等代数等一系列数学思维培养的课程。但无论是本科生还是硕士生的教学,都缺乏对大数据分析技能的培养,未能迅速地紧跟时代,与社会需求相脱节。这一现象不利于学生就业。因此,亟须在教学内容、方法和技术方面进行改进。1.在教学内容方面,传统的统计学科从概率论与数理统计、多元统计分析到统计学原理等都是基于结构化的小量数据展开,关于非结构化大数据的教学内容缺失。因此,要注重培养学生对非结构化、半结构化数据的处理分析能力;教师应对原有课程进行调整,减少重复内容与重复教学,加入与大数据相关的数学理论与软件学习方面的新内容。2.在教学方法方面,应注重培养学生的动手能力和团队协作精神。传统统计学的数据处理分析工作量相对较轻,个人可以独立完成工作,但是在大数据模式下,分工与协作是必不可少的环节。因此,在培养学生实战能力的同时,不能忽视团队协作能力的培养。3.在教学技术方面,要善于通过经典案例寓教于乐,通过对实际问题的思考,培养学生对数据处理的热情及其思维能力和实战能力。有必要打破传统的相对固化的授课模式,采用具有时代感的新鲜问题来激发学生的创新性思维,让学生在解决实际问题的过程中对理论有更加深刻的认识。
(四)加强统计学师资队伍建,填补知识结构的不均衡性
在統计学成为一级学科之前,我国高校的普遍做法是将数理统计专业放在数学学院,授予理学学士学位,把经济统计放在经济学院,授予经济学学位。这种模式对我国统计学教师队伍的知识结构产生了重要影响。统计学专业教师基本也都来源于这两个领域:一个分支来自擅长数学模型、推导等数量关系的数理统计方面;另一个分支则是擅长经济理论、实证的经济统计方面。但互联网技术之下应运而生的各种新信息和新问题,需要用新技术去解决,遗憾的是这方面的人才相对缺乏,这导致在大数据时代下教师队伍知识结构不完整。要解决这个问题,可以从两个方面入手。首先,针对一些数学功底见长,对大数据分析感兴趣的教师进行内部培训。鼓励他们在全国乃至全球范围内参加有关大数据学科的培训、研讨等学术交流活动,力求在短期内培养一批在大数据方面有所专长的教师团队,以弥补整个教师队伍知识结构的失衡问题。同时加强教师队伍的自主学习和创新能力,保持他们对新事物、新方法的敏锐嗅觉。其次,在全国范围内着重关注相关培养单位的博士、博士后等潜在的教师力量。力争将从事有关数据挖掘方向、大数据分析方向等具有一定大数据分析能力及实战经验的博士、博士后纳入教师队伍。此外,还要充分认识到大数据分析工作的交叉性和协作性,它对计算机技术、数学理论方法等都有较高的要求;要着重引进具有上述学科经历的复合背景人才,力争将这些新鲜血液融入传统的师资队伍当中,以改善教师知识结构的不平衡问题,力争建设一支专业结构合理、学术素养良好、适应能力强大的统计学教师队伍。
[ 参 考 文 献 ]
[1] 南江霞.一级学科背景下统计专业建设的探讨与实践[J].数学学习与研究,2015(3):6-7.
[2] 耿直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1):5-9.
[3] Viktor Mayer·Sch6nberger,Kenneth Cukier著,盛杨燕等译.大数据时代[M].杭州:浙江人民出版社,2013.
[4] 陈建宝,鞠芳煜,禚铸瑶.大数据时代下的统计学——第五届中国统计学年会综述[J].统计研究,2015(5):106-112.
[5] 朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2):10-17.
[6] 申广君.概率论与数理统计课程中反例教学的例证研究[J].大学教育,2013(4):84.
[责任编辑:陈 明]
[摘 要]大数据时代的来临给统计学科建设与教学带来了不小的挑战。传统的统计学科在认知水平、技术手段、内容框架等方面均需要进行革新。在回顾统计学科发展历史沿革以及大数据时代数据特征的基础上,对新时代下统计学科面临的传统统计手段的不适应性、传统统计学科框架不能满足时代要求、统计学专业设置与社会需求脱节和统计学师资队伍建设不够完善等问题进行阐述,可以得出相应的对策。
[关键词]统计学;大数据时代;学科建设;教学改革
[中图分类号] G642.0 [文献标识码] A [文章编号] 2095-3437(2017)06-0009-04
21世纪是一个信息化的时代,尤其在2012年之后,大数据逐渐进入寻常百姓的生活,并深刻影响着这个时代的变革。大数据时代下海量数据所隐藏着的巨大价值不可小觑。因此,如何应用、分析、挖掘数据背后的隐含知识、潜在规律成为各个领域所关注的热点话题,统计学科的重要性不断彰显。早在2011年2月,国务院学位委员会就将统计学科设为一级学科[1],改变了统计学科被分别安放在经济学门类和理学门类下的历史局面,从此终结了统计学究竟是应用经济学范畴还是概率论与数理统计学范畴的各种争论。如今的统计学,就是关于数据科学的学科,在理学门类之下理学学位和经济学学位均可授予。站在大数据时代的风口浪尖,在统计学科成为一级学科的历史背景下,统计学在全国各个院校的发展如火如荼。但如何让统计学科适应大数据的时代要求,如何培养胜任各种数据挖掘能力的人才,是奋斗在统计学教育一线同仁们所必须面对的问题。
一、传统统计学的发展历史
统计学源于实践与应用,当人类开始从事生产劳动以来,统计学就慢慢建立和发展起来。在西方,一般认为统计学始于古希腊时期的亚里士多德时代,并在此后开枝散叶。而中国也是世界上最早进行统计活动的国家,具有国际公认的最早的统计史料,但先秦之后发展缓慢,未成气候。1930年,中国统计学会成立,这是中国最早的统计学研究群体。
此后统计学的发展大致分为以下几个阶段:1.苏联模式模仿期。新中国成立后,我国在经济模式上采用了计划经济体制,同时也引入了苏联的马克思统计理论与模式。在这种模式之下,统计学仅仅是计划经济制度的专属工具,其抑制了数理统计学派的发展。因此,这个阶段下的中国统计学发展逐渐丧失活力,未能与西方统计学的主流研究方向接轨。2.改革开放时期的再认识。随着我国改革开放的不断深入,不断涌现的新事物导致传统模式下的苏联统计理论与我国实践工作形成不可避免的矛盾,依附于计划经济的统计学逐渐丧失生命力,这一现象引起了我国学者的反思。在这种背景下,欧美体系下的统计学逐步进入中国市场,并引发了一场关于统计学科建设的学术争鸣。3.20世纪90年代的“大统计”思想。随着我国改革开放的不断深化,统计学在社会经济统计学和数理统计学两个方面蓬勃发展起来。于是“大统计”的提法日渐增多,20世纪90年代尤其是20世紀90年代中后期有关统计学发展的文献,都在讨论统计学的融合与构建问题。“大统计”思想是对传统认识局限的一次突破,它为中国统计学在下一个世纪的发展提供了理论前提。4.大数据时代下统计学的新机遇。从上述3个阶段可以看出,统计学的发展与其时代背景息息相关。进入21世纪以来,在大数据的时代背景下,统计学在学科建设与教学改革方面该有怎样的侧重和突破,这正是身处这个时代的统计学人应该思考的问题。要对这个问题进行剖析,必须了解这个时代的数据特点。
二、大数据时代的数据特征
在20世纪90年代,信息化开疆拓土给数据的产生带来了指数级的增长模式,这一现象就曾引起美国社会的广泛讨论和研究。进入21世纪以来,社会高速发展、信息飞速流通、科技不断进步,这使得“大数据时代”呼之欲出。2012年,由维克托·迈尔-舍恩伯格 (Viktor Mayer?鄄Sch?觟nberger)和肯尼思·库克耶 (Kenneth Cukier)联合编著的《大数据时代:生活、工作与思维的大变革》给社会带来了不小的反响,学术界也逐渐摩拳擦掌地迎接大数据时代的来临。[2]
著名的4V理论有效揭示了大数据的主要特征。[3]1.Volume:海量的数据规模。在当下社会,每一分每一秒都伴随着大量数据的产生,由于数据的驱动性,现在的数据量已经不再是传统的TB、PB级别,其早已经扩展到EB、ZB乃至更高的级别。2.Velocity:快速的数据流转和动态的数据体系。在一个瞬息万变的社会中,数据是一种流动的状态,大量数据可以随时随地产生并改变,这种动态性给统计分析带来了巨大的挑战。3.Vari?鄄ety:多样的数据类型。大数据不但具有动态性,还具有多样性。数据形式包括:文本数据、网页数据、行为数据、图片数据、声音数据、多媒体数据等各种各样的数据形态。4.Value:巨大的数据价值。曾经有人把Data mining称为数据采矿,倘若在传统的数据模式下数据都蕴含着丰富的“矿藏”,那么大数据时代下的数据价值则是我们难以想象的。正因为数据拥有巨大的价值,这才使我们有了进一步分析处理的动力。
大数据时代下的数据特征给传统统计学带来了不小的冲击。作为一门处理、分析数据的学科,在新时代下必须认清统计学科所面临的问题,这样才能有的放矢地进行革新,采用新的技术手段驾驭新时代的数据,为社会进步做出应有的贡献。
三、新时代下统计学科面临的问题
(一)传统统计手段的不适应性
传统的统计思维模式基本是以问题为导向,确立要研究的问题之后,再着手获取数据。国家统计局所开展的数据普查和抽样调查都是基于这种模式。对于数据索取能力较弱的科研院所或个人而言,其没有能力进行大规模抽样调查的能力,一般是通过各种官方数据库获取数据用以科学研究。但用传统抽样调查手段所获取的数据,是用样本估计总体的思路进行,倘若调查方案设计合理、操作得当,误差可以控制在允许范围之内,这不失为一种良好的统计手段。但在大数据时代下,不仅难以有效地抽取数据,而且没有简洁有效的技术手段对数据进行分析,这给抽样调查带来了不小的麻烦,其省时省力的优势也不复存在。类似的问题在传统统计方法的发展中依然存在。因此,需要紧贴时代背景,建立一套适用于当下的统计分析模式,以便更加科学高效地开展统计分析工作。
(二)传统统计学科框架不能满足时代要求
统计学是从大量实践经验中所逐渐发展形成的一门对数据进行搜集、处理、分析的学科。统计学的产生与数据有着不解之缘,因此,有关大数据的处理必然离不开统计理论和技术的支撑。但是,传统的统计思想、分析手段以及分析设备等都无法满足大数据时代的发展要求。在人类迈入新纪元以来,互联网技术日臻成熟,社会信息化程度出现质的飞跃,大量半结构化、非结构化数据源源不断地产生,人们对各种类型数据资源的潜在规律以及数据回报价值都有迫切的需求。[4]这要求统计学有一套完整的学科框架体系去驾驭大数据,具备对海量非结构化、半结构化、实时性数据等的有效分析能力。而大数据时代下的数据分析工作,已经从根本上打破了传统统计学科的框架。
(三)统计学专业设置与社会需求脱节
当前统计学学生的培养方式虽然逐渐向应用层面倾斜,但形式与内容相对老套。在这种模式下,理论模型的建立、参数估计的方法、一些统计量的检验等都得到了足够的重视,但学生对这些问题的认识很可能还停留在表面。虽然部分课程安排有上机实践操作,但由于数据局限性等原因,其所带来的案例相对老旧、与时代脱节的情况时有发生。这导致学生不能很好地学以致用。另外,大数据时代下的统计分析工作,由于数据的海量性、动态性等特点,工作量相对较大,需要团队的分工协作才能很好地完成。而在我们日常的教学中,由于面向传统的统计手段较多,学生基本都是个人完成案例,这种教学方式难以培养学生在数量搜集、处理、分析中的团队协作精神,而这种精神在学生今后的工作岗位中是应该必备的。
(四)统计学师资队伍建设不够完善
由于统计学的蓬勃发展以及社会对统计学人才的迫切需求,各个院校纷纷成立(或筹备成立)统计学院,导致统计学教师相对紧缺。在教资力量相对不够充足的情况下,统计学科依然面临一个严峻的问题。这个问题就是在现有的教师队伍中,大部分教师接受的均是传统统计理论方法的训练,专业和研究成果也都偏向于经济统计、数理统计的传统模型、实证分析等方面。在传统领域,大部分教师具备教学与科研的经验,具有相当深厚的功底及心得。但是在大数据领域、有关大数据的清洗、降维、处理、可视化;云计算、云平台、分布式计算、并行计算的hadoop、Spark、MapReduce等有关大数据的挖掘理论和技能方面,则出现断层。对于绝大多数教师而言,这也是一个相对陌生的领域。因此,这引发了统计学师资队伍知识结构不完善的问题。
四、解决新时代下统计学面临问题的对策
(一)针对新问题,寻找新的统计技术手段
大数据时代下,数据量巨大、数据信息瞬息万变、数据类型多种多样,数据结构也由原来单一的结构化数据变为非结构化、半结构化数据模式。面对新的问题,对于海量数据的存储、清洗、数据挖掘、知识呈现、数据传输、管理等各个方面都需要有新的技术手段加入。[5]因此,我们需要从各个细小的环节入手,从而形成一个完备统一的处理大数据问题的新模式和新框架。这个过程需要其他领域专业人员的支持和协作,其中包括计算机、数学、经济学、信息学、管理学等。1.数据获取阶段。数据获取的途径有很多,不应再拘泥于过去翻阅式的查找和抽样调查。由于大部分数据均产生于互联网,因此我们不得不通过爬虫技术对所需数据进行爬取,从而获得海量的一手数据。2.数据清洗、降噪、降维等预处理阶段。这一阶段是大数据分析的开始,任何一种分析都不能离开有效的数据而进行,对原始数据的整理、清洗等工作直接影响到后续统计分析的有效性和科学性。3.数据挖掘、知识发现。这是整个数据分析中最为关键的环节,是整个分析的核心所在。在此需要强调的是,并非在大数据时代所有的传统统计方法都不可使用。当经过数据预处理、把数据转出化成传统数据模式之后,传统统计分析方法依然有其用武之地,且传统统计分析方法当中宝贵的统计思维模式和统计视野也是我们解决大数据问题的智库。因此,对于传统统计分析方法要给予足够的重视,其在大数据时代也有广阔的舞台。我们要在继承的基础上,进行改进、创新和发扬。
(二)系统性调整统计学科框架,以适应时代发展
在大数据时代下,统计学同样需要加入信息化的过程。虽然大数据与统计学有着千丝万缕的联系,但是由于面对的数据类型、对象等的不同,传统统计学的研究范式已经不能适应新时代的要求。这主要表现在以下几方面:1.统计对象的改变。新时代下的统计数据从数量、结构和类型上早已打破传统统计学的数据概念。2.统计技术的改变。新时代下关于数据的搜集、整理、知识发现等数据处理手段相较于传统的统计学科,已经发生了巨大的变化。3.数据仓库的建设和使用。关于海量数据的存储、调取、传输、管理是在传统统计学当中较容易被忽视的环节。传统统计学下的数据量较小,对其的存储、传输和管理并不存在问题,但海量数据出现之后,这个话题则成为统计学需要重点研究的问题之一。因此,我们需要从更高的视野重新构建统计学的学科框架,使其达到能驾驭大数据时代的目的,从而为人们的生产、生活提供科學有效地指导和帮助。首先,要从思想上打破对传统统计学的认识,将视野投放到更加广阔的数据天地。客观对待传统统计学在社会发展中所出现的滞后性问题。其次,应寻求多学科协作,信息资源共享。没有任何一种单一的技术分析手段可以贯穿大数据分析的始终,它需要多种学科的交叉与融合。因此,统计学的学科框架不能故步自封,一定要兼容并蓄,这样才有新活力。最后,统计学科框架的建设要体现出大数据时代的信息化。对信息的收集与爬取、清洗与降维、分析与挖掘、结果与展示等各个方面,都需要在传承经典的基础上,进行大胆地突破性改革。从而建设一个能够在新历史背景下解决新数据问题的学科,从而培养出适应这个时代发展的统计分析人才。
(三)改良统计学科内容设置,满足新时代下的社会需求
关于统计学科的专业培养方案。目前,基于传统统计学的模式,可以采取两种统计方式进行培养。这就是我们熟知的数理类和经济类,这两类具有不同的侧重点和学科背景。“大统计”思想的提出以及统计学一级学科的成立,终于可以让统计学汇到统计学院或者统计系的框架下统一培养。由于西方主流统计学甚至经济学,均注重数理思维和能力,任何一个统计分析手段和经济模型都离不开数学推导、演算,因此,打好数理基础成为我国统计学科建设的普遍共识。在本科生的培养方案中,就包含数学分析、高等代数等一系列数学思维培养的课程。但无论是本科生还是硕士生的教学,都缺乏对大数据分析技能的培养,未能迅速地紧跟时代,与社会需求相脱节。这一现象不利于学生就业。因此,亟须在教学内容、方法和技术方面进行改进。1.在教学内容方面,传统的统计学科从概率论与数理统计、多元统计分析到统计学原理等都是基于结构化的小量数据展开,关于非结构化大数据的教学内容缺失。因此,要注重培养学生对非结构化、半结构化数据的处理分析能力;教师应对原有课程进行调整,减少重复内容与重复教学,加入与大数据相关的数学理论与软件学习方面的新内容。2.在教学方法方面,应注重培养学生的动手能力和团队协作精神。传统统计学的数据处理分析工作量相对较轻,个人可以独立完成工作,但是在大数据模式下,分工与协作是必不可少的环节。因此,在培养学生实战能力的同时,不能忽视团队协作能力的培养。3.在教学技术方面,要善于通过经典案例寓教于乐,通过对实际问题的思考,培养学生对数据处理的热情及其思维能力和实战能力。有必要打破传统的相对固化的授课模式,采用具有时代感的新鲜问题来激发学生的创新性思维,让学生在解决实际问题的过程中对理论有更加深刻的认识。
(四)加强统计学师资队伍建,填补知识结构的不均衡性
在統计学成为一级学科之前,我国高校的普遍做法是将数理统计专业放在数学学院,授予理学学士学位,把经济统计放在经济学院,授予经济学学位。这种模式对我国统计学教师队伍的知识结构产生了重要影响。统计学专业教师基本也都来源于这两个领域:一个分支来自擅长数学模型、推导等数量关系的数理统计方面;另一个分支则是擅长经济理论、实证的经济统计方面。但互联网技术之下应运而生的各种新信息和新问题,需要用新技术去解决,遗憾的是这方面的人才相对缺乏,这导致在大数据时代下教师队伍知识结构不完整。要解决这个问题,可以从两个方面入手。首先,针对一些数学功底见长,对大数据分析感兴趣的教师进行内部培训。鼓励他们在全国乃至全球范围内参加有关大数据学科的培训、研讨等学术交流活动,力求在短期内培养一批在大数据方面有所专长的教师团队,以弥补整个教师队伍知识结构的失衡问题。同时加强教师队伍的自主学习和创新能力,保持他们对新事物、新方法的敏锐嗅觉。其次,在全国范围内着重关注相关培养单位的博士、博士后等潜在的教师力量。力争将从事有关数据挖掘方向、大数据分析方向等具有一定大数据分析能力及实战经验的博士、博士后纳入教师队伍。此外,还要充分认识到大数据分析工作的交叉性和协作性,它对计算机技术、数学理论方法等都有较高的要求;要着重引进具有上述学科经历的复合背景人才,力争将这些新鲜血液融入传统的师资队伍当中,以改善教师知识结构的不平衡问题,力争建设一支专业结构合理、学术素养良好、适应能力强大的统计学教师队伍。
[ 参 考 文 献 ]
[1] 南江霞.一级学科背景下统计专业建设的探讨与实践[J].数学学习与研究,2015(3):6-7.
[2] 耿直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1):5-9.
[3] Viktor Mayer·Sch6nberger,Kenneth Cukier著,盛杨燕等译.大数据时代[M].杭州:浙江人民出版社,2013.
[4] 陈建宝,鞠芳煜,禚铸瑶.大数据时代下的统计学——第五届中国统计学年会综述[J].统计研究,2015(5):106-112.
[5] 朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2):10-17.
[6] 申广君.概率论与数理统计课程中反例教学的例证研究[J].大学教育,2013(4):84.
[责任编辑:陈 明]