大数据时代专利信息整合与分析系统应用研究
姜琦红 王黎明
摘 要:大数据时代已经到来,发达国家多已进行政府大数据管理,我国政府也应把握这一机遇,尤其是在信息数据资源急速增长的知识产权领域。由于经济飞速发展和科技的不断创新,商标和专利等数据激增。目前对于知识产权的保护技术和管理水平已无法满足现代社会的要求。本论文简要阐述了专利分析的现状,介绍了大数据的应用和特点以及大数据时代带来的变化,探讨了利用大数据技术的专利信息集成与分析系统的应用趋势。
关键词:大数据;专利分析;数据挖掘;可视化
DOI:10.16640/j.cnki.37-1222/t.2019.07.123
1 引言
大数据密集型时代,利用有效整合的专业数据进行科研发现是一种趋势。专利是一种综合性的信息资源,与期刊论文、交易、标准和诉讼等信息联系密切。在专利分析的过程中,为了获得有效、全面的分析成果,往往需要整合大量、相关的信息资源。因此,基于大数据本身的应用,无疑能够更好的实现以及促进整体专利分析技术的发展,让其更好的实现专利信息整合以及分析,促进专利技术的有序发展。
2 大数据技术概述
2012年,高德纳(Gartner)将大数据的定义修改为:“大数据是一种巨大的、高速的、可变的信息资产,需要新的处理方法来增强决策能力。”总的来说这三个性质很好的概括了大数据的特性以及发展方向,大数据的建设必须依靠计算机对数据的统计,只有通过数据才能确定最终的客观结果。后来高德纳(Gartner)再次修改了对大数据的定义,在量、速以及多变的基础之上添加了第四个性质即真实性,大数据只有通过计算机才能对数据进行客观的处理从而得到有效的结果。欧美发达国家早在二十一世纪初便开始对大数据的发展保持重视,政府部门在大数据开发上投入大量资金的同时,数据挖掘也正开始探索分析大数据的方法。阿里巴巴董事局主席马云则直接地指出,虽然阿里巴巴是全球最大的零售平台,但是阿里巴巴不是一家零售公司,而是一家数据公司。
麦塔集团(Matita Group)的分析师道格·莱尼(Doug Laney)指出数据增长的挑战和机遇在于三个方向:数量、速度和多样性。基于此,IBM进一步将数据增长的挑战和机遇扩展为五个“V”,即:(1)容量(Volume),大数据时代的数据量已达到PB(1024TB)甚至EB(1024PB);(2)种类(Variety),大数据时代中有着十分复杂的数据类型,包括结构化数据和非结构化数据;(3)速度(Velocity),快速处理方式是大数据获得有效信息的重要途径。现今数据更新速度十分迅速,只有快速地获得数据才能更好的整合所需信息;(4)低价值密度(value):合理地运用大数据技术,尽可能地用低成本获取高价值的信息;(5)真实(Veracity),您需要从大数据中过滤所有非真实数据以获取真实信息。
3 专利信息整合与分析现状
一般认为,专利分析起源于1949年Seidel提出的专利文献重要性的专利引文分析概念,但在上世纪90年代后,随着信息、网络和数据库技术的发展,专利分析才在企业战略和竞争分析中的应用得以实现。
4 大数据时代专利信息整合与分析系统应用
基于大数据分析的主要内容和专利分析的现状,未来大数据专利数据集成与分析系统的应用和发展可以包括以下几个方面:
4.1 基于语义引擎数据采集处理
在过去的机器检索中,计算机只能识别字符匹配级别的用户输入信息,不能理解信息的含义,特别是在搜索专利信息的过程中。检索策略的设定和调整都需要人为操作。而随着计算机技术和人工智能的发展,通过对网络大数据的语义标注处理,使计算机能够从语义层级理解输入信息,例如,Apple的语音识别工具Siri,专利检索系统Patentics等。都采用了语义引擎。在此基础上发展专利数据采集,例如实现语义专利信息检索,可以降低对专利分析人员个人能力的依赖,降低专利分析的成本。
4.2 基于数据挖掘算法、预测分析和数据质量管理的专利分析
大数据分析的核心是数据挖掘算法。从海量数据中挖掘和使用价值信息,研究物体之间的相关性,从而发掘物体之间的差异。知联系,利用这种相关性信息,可以实现定制化分析,并将专利分析的结果与企业需求结合得更加紧密。通过预测分析模型,可以从海量数据中获得存在规律性的信息,从而可以利用这些信息预测专利的发展趋势和技术,甚至行业的发展趋势。它允许企业根据专利分析的结果对专利的布局做出预先判断,由于专利发布的滞后,技术开发路线可以尽量避免影响专利分析的准确性。通过数据质量管理方法,借助质量管理方法和标准化数据处理流程对数据进行处理,它确保了高质量和可靠性的分析结果。
4.3 基于视觉分析的报告形成和结果显示
可视化分析的作用是可以将数据分析结果自动转换为图表。我们可以使用图表的简单直观功能显示复杂的大数据分析结果。样的分析对这就像选择不同的呈现方法和显示内容一样,可以有效降低专利分析的门槛,扩大用户群的使用范围。
5 结语
大数据时代的到来为专利分析提供了新的技术工具和技术思路,这对于从业者来说既是挑战又是机遇。未来,专利分析的重要研究方向是充分利用大數据分析,提高专利分析的用户体验,对专利信息进行数据挖掘和可视化预测。
参考文献:
[1]赵向阳,王亮,梁晨陇.基于专利数据的大数据技术发展研究[J].软件,2017,38(08):190-196.
[2]汪满容,刘桂锋,孙华平.基于专利地图的全球大数据技术竞争态势研究[J].现代情报,2017,37(01):148-155.
[3]李鹏飞,卢瑾,辛一.基于专利的大数据技术发展情报分析及战略研究[J].情报杂志,2014,33(09):45-50.
[4]姚卫浩,金江军.专利大数据及其发展对策[J].中国高校科技,2014
(06):17-18.
[5]梁建军.专利“大数据”[N].中国知识产权报,2013-08-21(005).
[6] Karki M M S. Patent citation analysis: A policy analysis tool[J].World Patent Information,1997,19(04):269-212.
*为通讯作者