标题 | 电力企业供应商资质信息审核技术研究 |
范文 | 汪亦星+曹楷 [摘 要]加强供应商资质信息智能化审核、选择优质合作供应商是电力企业实现可持续发展的基础和前提。文章从供应商资质信息数据来源视角切入,具体落实至“供应商强制性产品认证”信息,从文本信息抓取、网络信息抓取以及信息核实三大维度,对欲开发的供应商资质信息审核系统的相关技术开展深入研究,并最终确定了相关技术选取,为后期供应商资质信息审核系统的顺利开发奠定坚实基础。 [关键词]审核;资质信息;供应商;电力企业 [DOI]10.13939/j.cnki.zgsc.2017.09.183 1 引 言 近年来,随着电网工程建设规模的迅猛发展,电力企业的招标采购范围不断拓展。相应地,合作的供应商群体也越来越大。供应商是电网设备的直接供应者,其生产管理水平直接关系到所采购物资的价格、质量、交货期以及售后服务整体水平。而作为供应商选择的第一道关卡,供应商资质信息审核的重要性毋庸置疑。因此,如何加强供应商资质信息审核的力度、深度和广度,在众多供应商中选出真正适合的合作伙伴,实现电网工程的安全、可靠運行,已成为电力企业目前亟须解决的重大课题。 2 现状分析 随着企业的不断发展壮大以及市场竞争的日趋激烈,越来越多的企业和学者已经意识到了供应商管理对企业生存发展的重要性,并开展了一系列的研究与实践。电力企业因其本身的央企属性以及采购数量、金额规模巨大等特性,更是众多学者关注和研究的重点,相关研究层出不穷。如部分学者致力于构建全面、科学的电力企业供应商评价模型,通过定性、定量相结合的方法对投标供应商进行审核;部分学者依托电子商务平台,从供应商投标响应信息、资质业绩核实信息以及评标要点之间的映射关系切入,构建供应商资质能力数据模型;部分学者尝试借助信息化手段,通过开发相关系统,实现供应商资质信息的在线核实;部分学者则从预审视角切入,通过开发预审投标系统来提高供应商资质信息审核工作的效率和准确率。 通过研究分析,可以发现供应商的资质信息审核是目前的研究重点,真实、有效的资质审核是选择优质合作供应商的前提和基础。现有的相关研究主要聚焦于实现供应商资质信息的在线审核,对供应商资质信息的来源重视不足,虽然有部分学者通过投标响应信息和资质业绩核实信息的映射关系来进一步加强资质信息的真实性,但鉴于资质业绩核实工作的复杂性以及不同标段的技术特征,仍存在相当一部分的供应商资质信息数据尚未涵盖在资质业绩核实库内,在实际的评标过程中,这部分数据的审核完全依赖于供应商提供的投标文件以及评标专家的主观判断,存在一定的评标风险。 基于此,本文从供应商资质信息数据来源视角切入,落实至“供应商强制性产品认证”(以下简称“3C”认证)信息,尝试开发供应商资质信息审核系统。该系统旨在自动抓取认证认可业务信息统一查询平台的供应商公开认证信息,并与供应商投标文件中的“3C”认证信息进行真实性核对,进而为评标专家提供科学参考。为保证供应商资质信息智能化审核系统的顺利开发,本文从文本信息抓取、网络信息抓取以及信息核实三大维度,对现有的相关技术展开研究,并最终确定相关技术选取。 3 电力企业供应商资质信息审核技术研究 3.1 文本信息抓取技术研究 3.1.1 关键词提取技术 关键词提取技术不仅是一系列自然语言处理任务的基础步骤,也是信息检索和文本分类领域的基础与关键技术之一。在文档信息中,关键词能够反映一篇文档主题内容的词语或与文档所在领域高度相关的文档。关键词提取技术的产生与应用,有效解决了通过人工标注寻找关键词耗时、困难的问题,并且成为了网页浏览、文本分类和信息检索领域的技术基础。目前,关键词提取方法主要有基于规则和基于统计两个分支,其中,基于统计的提取方法比较通用。 3.1.2 FSO技术 FSO是指文件系统对象,在文件系统处理领域,FSO对象模型提出了一种有别于传统的、应用文件操作语句处理的全新模式。该模型提供了一个基于对象的工具,通过它提供的一系列属性和方法,工作人员可以比较简单和更加灵活地对文件系统进行各种操作。FSO技术可以利用应用程序创建、改变、移动和删除文件夹,或者监测是否存在该文件夹,若存在,指出文件夹所在路径。此外,FSO技术还可以使用户获取关于文件夹的某些信息,如名称、创建日期、最近修改日期等。 3.2 网络信息抓取技术研究 3.2.1 网络爬虫技术 网络爬虫也称“网络蜘蛛”,作为搜索引擎系统中非常复杂但很关键的部分,具有较强的专业性。网络爬虫技术是指在网络上根据事先给定的规则,自动爬行和抓取信息的程序或脚本。目前,网络爬虫按照系统结构和实现技术,大致可分为通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫四种。其中,通用网络爬虫是指爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据;聚焦网络爬虫是指选择性地爬行那些与预先定义好的主题相关的页面的网络爬虫,有效节省了硬件和网络资源,很好地满足一些特定人群对特定领域信息的需求;增量式网络爬虫是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面;深层网络爬虫可以获取一些不能通过静态链接获取的、引出在搜索表单后的、只有用户提交一些关键词才能获得的Web页面。 3.2.2 验证码识别技术 验证码是让用户输入一个扭曲变形的图片上所显示的文字或数字,扭曲变形是为了避免被光学字符识别之类的电脑程序自动识别出图片中的文字或数字而失去效果。总体来说,验证码识别系统的功能流程一般包括图像采集、图像处理以及模式识别三个阶段,其技术基础主要是图像处理技术和模式识别技术。目前,验证码广泛应用于论坛,许多论坛为防止有人利用计算机程序大量在论坛上张贴广告或其他垃圾信息,要求留言者必须输入图片上所显示的文字或数字或是算术题才可完成留言的提交。此外,一些网络交易系统为了避免计算机程序以暴力法大量尝试交易也会有验证码识别。 3.3 信息核实技术研究 3.3.1 精确匹配技术 字符串匹配在计算机领域有着广泛的应用,涉及数据处理、数据压缩、文本编辑、信息检索等多方面。精确匹配技术是指在数据序列中找出与一个或一组特定的模式串完全相同的所有串的出现位置。在精确匹配过程中,会有一个搜索窗口,其长度与搜索模式串长度相同,搜索窗口沿着文本从左向右滑动进行搜索匹配字符串。精确匹配技术主要应用在文本检索和网络安全的入侵检测领域中。 3.3.2 中文模糊匹配技术 模糊匹配技术可以通过计算句子之间的相似度反映句子的匹配程度。由于很多句子虽然表达形式不同,但是表达的意思却差不多,采用模糊匹配技术可以有效识别匹配相应的字符串,打破计算机只能逐字对比来判断它们的意思是否一致的局限性。目前,常用的模糊匹配技术有基于关键词信息的相似度计算方法、基于语义信息的相似度计算方法、基于语法结构的相似度计算方法等。 3.4 技术选取 通过对信息抓取技术和信息核实技术的对比分析,结合电力企业的业务实际和相关要求,选取合适的信息化技术来实现供应商投标文件资质信息的自动核实。 一是文本信息抓取技术,采用FSO技术,有效实现标书中供应商“3C”认证信息的直接抓取,并可以在使用者授权的情况下在目标目录下的Word文件中实现信息抓取。 二是网络信息抓取技术,采用深层网络爬虫技术,尽可能多地访问和收集互联网上的网页,更便捷地抓取网站信息,同时,结合图像验证码识别技术,将验证码解读成文字,提高信息抓取安全性。 三对于信息核实技术,采用精确匹配技术,将抓取的两类关键信息进行精准比照,准确辨识出供应商所填信息的真伪。 4 结 论 加强供应商资质业绩审核是防止流标、提升招标效率的有效手段。本文通过对电力企业供应商资质信息审核现状的研究分析,具体落实至供应商“3C”认证信息的审核,从文本信息抓取、网络信息抓取以及信息核实三大维度开展相关技术研究,并最终确定了FSO、深层网络爬虫、精确匹配等信息技术,助推供应商资质信息审核系统的开发进程。 參考文献: [1]马忠媛.电力设备公开招标过程中供应商的选择研究[D].保定:华北电力大学,2007. [2]李屹,贺绍鹏,张婧卿.供应商资质能力核实的信息化管理[J].中国电力企业管理,2016(15):68-69. [3]柴建军.电力设备招投标管理系统的设计与实现[J].中小企业管理与科技:上旬刊,2011(12):237. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。