网站首页  词典首页

请输入您要查询的论文:

 

标题 浅谈数据资源开发与利用
范文 顾胜杰
摘要:我国已将大数据发展确定为国家级战略,这使我国数据资源开发与利用面临良好的发展机遇。随着数据技术的大发展,我国的数据资源开发与利用必将迎来崭新阶段。
关键词:数据资源 云计算 大数据
2010年10 月,工信部与国家发改委联合发布《关于做好云计算服务创新发展试点示范工作的通知》,表明从国家层面,云计算产业发展得到了重视与支持。2015年9月,经李克强总理签批,国务院印发《促进大数据发展行动纲要》,系统部署了大数据发展工作。《促进大数据发展行动纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效地经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能的产业发展新生态。这表明我国的数据资源开发与利用进入到一个新阶段。
一、云计算的内涵与开发利用现状
所谓云计算,就是对基于网络的、可配置的共享数据资源进行统一管理和调度,并实现廉价、稳定、安全方便的按需供给的一种模式。云计算通过网络将分散的计算、存储、软件等资源进行集中管理和动态分配,使信息技术能力如同水和电一样实现按需供给,具有快速弹性、可扩展、资源池化、广泛网络接入和多租户等特征,是信息技术服务模式的重大创新。而大数据则是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,它是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
伴随着大数据的飞速发展,它已经把触角触及很多领域。在医疗健康领域, 美国人已经开始利用大数据应用来进行基因测序;而当物联网利用各种传感器将物质世界中的各种信息变为电信号传送到计算机处理系统中时,一种趋势也就成了必然,那就是大数据信息总量的超常规高速增长。2015年9月18日,贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。贵州省计划通过综合试验区建设,探索大数据应用的创新模式,培育大数据交易新的做法,开展数据交易的市场试点,鼓励产业链上下游之间的数据交换,规范数据资源的交易行为,促进形成新的业态。国家发展改革委有关专家表示,大数据综合试验区建设不是简单的建设产业园、建设数据中心、建设云平台等,而是要充分依托已有的设施资源,把现有的利用好,把新建的规划好,避免造成空间资源的浪费和损失。探索大数据应用的新模式,围绕有数据、用数据、管数据,开展先行先试,更好地服务国家大数据发展战略。
实际上从数据技术角度分析数据资源,并没有所谓的真正的大数据还是小数据,本质上来讲,大数据是一个更加专注于挖掘数据价值的过程。通过技术和数据这两个纬度,使用者可以更有效并清晰的区分各个部门和单位各自的分工和各自的价值。在中国,传统的数据公司、数据技术公司很少,到了今天这个大数据时代,这种类型的公司才真正地开始涌现。在美国,数据技术不是在大数据这个概念出来后才出现的,它在过去十年、二十年,甚至上百年中一直存在着,它伴随着科技公司的发展而不断发展。而中国直到今天才出现了许多以数据为主业务的公司,数据资源的开发与利用也主要是围绕这些公司自身的行业进行。在中国的技术领域里,很多的传统IT企业几乎是不碰数据的。比如,以前银行的数据库几乎没有国产的,全都是大家知道的IBM、 Oracle、 EMC等国外公司编制的。真正接触到数据内核的服务几乎都是国外的软件厂商在提供支持。中国的传统IT企业,以前只是在做应用程序、系统集成这样的一些工作。今天中国很多传统IT公司在大数据时代也开始朝大数据公司看齐,在从一个IT公司成为一个DT公司。
二、大数据开发利用的问题及改革途径
我们中国的数据资源丰富,中国拥有全世界最多的人口、全世界最多的智能设备、全世界最多的产生数据的IT系统,这意味着中国一定会产生全世界最多的数据。今天中国巨大而丰富的原始数据资源基本上是一个“裸矿”,它需要被开采,需要被开发与利用,需要数据共享。数据资源的安全性是首先应考虑的问题,相应地,安全防护技术至关重要。比如说目前中国政府部门的数据就很难获取,阿里巴巴、百度、腾讯等公司的数据,也对外保密。我们需要相应的法律法规来保证原始数据开采的安全性。这些丰富的原始数据本身涉及每个公民的数据安全、数据保密,涉及很多个人隐私以及相关的法律法规。这些都是数据资源开发与利用中肯定会出现的问题。由于是新问题,并且我们国家在大数据开发与利用方面还有很多机制不完善,所以我们需要更好的数据资源开发与利用方面的法律法规,包括政府引导的、行业自制的协议以及将来的立法程序。这是中国的数据资源开发和利用必须要经历的发展过程。在世界上许多国家,尤其是发达国家,比如德国,在2005年就开放数据接口,发布数据开放标准,并且早在1977年就已经颁布了德国联邦数据保护法律。因为西方国家比较完善的法律法规和行业指导规范,他们的数据使用也是比较规范的,这也使得在所谓的大数据到来之前,西方国家已经有了很多数据应用。在大数据概念出现之前,西方国家就已经有了很好地数据资源开发与利用模式,而且这些更多的是由政府主导的。
数据资源开发与利用还有一个很重要的方面是人才。整个信息技术人才的成长是伴随着网络技术的发展而来的。以前在中国纯底层信息技术的人才很少受到人们重视,最近几年,逐渐开始得到市场认可。因为整个中国的劳动力,尤其是中低端劳动力成本已在逐年升高,导致很多企业不愿意雇佣更多的人,而是希望用IT技术,甚至是DT技术替代人。以前IT可能替代的是机械劳动,那未来,DT可能替代的是智慧劳动,比如许多行业的数据分析师。这整个过程与转变,让中国的数据资源开发与利用获得发展契机,而人才是整个数据资源开发和利用过程里核心的一个要素。
另外,系统科学在数据资源开发与利用中可以起到很大的帮助作用。当前国内国外的学术会议,企业之间的研讨,大量提到系统科学在大数据分析中的应用,比如说大数据趋势在什么时候会突然变化,这种变化的状态,可以通过系统科学的认证来形成相关知识进行解答。对于一个想要持续创新的企业来说,要利用系统科学在大数据分析中的作用,使企业处在一条边缘地带,既不能过于激进,迷失方向;又别过于稳定,原地踏步;而是要激发企业活力,使其维持可持续发展的动力。
以前国家对数据资源开发与利用重视不够,对国产软件企业、IT公司的支持力度也很有限。很多的用户采用拿来主义,使用美国的成熟技术直接去做自己的应用,而不会耐心的等待中国IT公司做自己的技术研发。许多数据技术、甚至前沿技术在中国的发展,多是跟随美国和西方的发展。在美国硅谷,每一个工程师,每一个企业都在努力创新,而且这些创新很多情况下是领先市场需求的。可能新技术在当时没人使用,在之后10年,20年才有人使用,但他们仍在不断努力,进行创新。整个中国的技术发展则更多的是被动的,甚至有了需求,可能还没有技术。这个时候,很多数据资源开发者都是采取拿来主义的方式,直接从美国等数据开发利用先进国家复制过来。
可以想见,复制模式不可能满足所有方面发展的需求。中国面对的数据量可能比美国还大,面对的计算挑战可能比美国还多。最近几年银行业经常出现系统宕机情况就说明,在美国成熟运行了很多年的包括IBM、Oracle的大型计算机系统也支撑不住中国消费者的金融交易。阿里巴巴集团通过自主研发应对每天比一个大型的银行还要多的数据量,成功构建了全世界最大的电子商务生态系统,接近4亿的活跃用户每天数千万笔交易在互联网上实时运行。
三、大数据应用技术及应用前景
余额宝是中国自主研发的非常典型的碎片化大数据应用技术的例子。运用云计算技术,余额宝把分散的资金做成了一个专业的投资。它的运行并不容易,因为传统银行考虑的是在机务上、服务上耗费非常多的精力和成本。而余额宝通过技术手段,将用户入门的门槛压低,每笔的金额也不定,满足了许多人的投资需求。并不是所有人都能拿出很多钱用于投资,但是通过互联网理财,每个人哪怕是只有1 块钱,都可以平等地享有闲散资金增值的权利。在这个基础上,阿里巴巴打造了中国领先的云计算和大数据平台,为大量中国乃至全球的个人和企业客户提供先进的云计算和大数据平台服务。这说明,在面对全球的大数据挑战的时候,技术是要源自于中国自主知识产权的,这也是需求带动出来的技术创新。
大数据应用对人们生活的影响如今已遍地皆是。就企业层面来说,在客户管理方面,无论中小企业还是大型的企业,数据收集、整体、挖掘都是非常重要,比如客户忠诚度,什么样的用户对于产品比较忠实,什么样的用户用一段时间会迁移,对后者详细的行为数据的分析,可以使得企业做出一些判断,把容易迁移走的使用者,用对应的创新服务再把他吸引回来。而在销售推荐方面,企业可以根据大家购买的特点,根据库存的时间情况,来调整产品的价格或进行精确的定点营销。比如内衣尺寸数据方面,我们可以将淘宝上的各个地方女孩子下单的数百万尺寸数据马上调出来,让在这方面做了数十年市场研究的人都会感到震惊!我们做一次市场研究,拿出5000样本量,已经是尽到最大努力了。现在百万数量级数据实时呈现,这是一个多么真实的市场。这一点是非常具有应用前景的。在社会应用层面,大数据的分析也可以在很多方面给人们的生活带来便利。比如现在高速路上的提示牌会显示当前的路况,其实是利用了手机定位的数据,如果大量手机都在一个地方,那这个地方就处于一个拥堵状态。大数据还能做什么,通过互联网的数据,人们可以颠覆一个行业的固有模式,实现一个行业结构的重构。研究机构可以从数据出发反向构建信息传播过程,比如说舆论的形成,一个好的舆论,或者一个差的舆论,对于社会来讲,当这个舆论形成了以后,我们可以反向把这个舆论从哪儿发生的,源头是什么找出来,然后去控制住这个源头,或者是解决相关的问题。
传统经典经济管理理论认为,作为CEO 、CIO只需要管理好三个资源:生产资料资源、人力资源和资本资源就够了。今天,互联网上的数据已经成了一个新的资源,这个资源和前面三个资源有非常本质的不同。前面三个资源都是我有你就没有,当我有你没有的时候,你想获得就要花更大的成本,导致传统经济管理的生产资料、人力、资本三资源的管理理论出现漏洞。数据资源的特征恰恰与之相反,这个非常重要的特征就是共享性、非排他性。这种共享性、非排他性使得我们发觉当企业拥有了它就可以穿越企业边界,让企业获得更超然的发展能力。信息技术和互联网技术发展到今天,我们还可以看到一个非常神奇的现象,就是一个企业的市值只体现了它的一部分价值,另外一部分价值对企业而言没有展现出来,这部分价值就是它的数据资源的价值。如果一个企业能够将自己的数据资源用上,当数据资源成为企业第四资源,这个数据资源共享性的特征将会给中国企业带来一次全新的价值创造,这让中国企业在互联网时代获得一个弯道超车的机会。
今天,我们国家已经把整个大数据发展变成了国家级战略,刚刚成功召开的中国共产党第十八届五中全会又一次强调和确定实施国家大数据战略。我们的数据资源开发和利用遇到了很好的时机,我们开始拥有中国自己的数据资源开发和利用核心技术,将来我们甚至有机会把这方面的技术输出到其他国家和地区,造福全人类。
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/15 21:21:29