标题 | ITSS在IT运维服务中的实施 |
范文 | 王定军+方如绢+费春勇 [摘 要] ITSS(Information Technology Service Standards,信息技术服务标准)是我国主导下研制的一套IT服务领域的标准库和一套提供IT服务的方法论。全面规范了IT服务产品及其组成要素,用于指导实施标准化和可信赖的IT服务。本文介绍了企业ITSS体系的实施,进一步规范了IT运维服务管理,有效提升IT运维服务能力。 [关键词] ITSS;信息技术服务;IT服务;系统运维 doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 01. 064 [中图分类号] F407.67 [文献标识码] A [文章编号] 1673 - 0194(2018)01- 0155- 05 1 前 言 目前,我国信息技术服务业增长迅速,2016年信息技术服务收入超过了2.5万亿元,如图1所示。 产业规模持续扩大,但由于没有统一的国家标准,每个企业遵循各自不同的服务标准。服务需方难以全面清理和管理IT服务需求,缺乏选择IT服务商的标准,无法对供应商进行管理和考核,难以得到可信赖的服务。服务供方难以标准化服务,常常陷入低价竞争。技术服务行业乱象丛生。 ITSS是在工业和信息化部、国家标准化管理委员会的指导下,由ITSS工作组组织研究制定的一套体系化的信息技术服务标准库。全面规范了IT服务产品及其组成要素,用于指导实施标准化、可信赖的IT服务。 ITSS使得供需双方基于同一标准衡量服务质量,提升IT服务质量、优化IT服务成本、强化IT服务效能、降低IT服务的风险。规范和引导技术服务行业的发展。 2 目前主流运维标准 2.1 主流IT服务理论 目前主流的IT服务体系、理论主要包括:ITSS、ITIL、ISO 20000等。 ITIL (Information Technology Infrastructure Library,信息技术基础架构库)由英国政府部门CCTA在20世纪80年代末制定,现由英国商务部OGC负责管理,主要适用于IT服务管理。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。 ISO 20000 是针对信息技术服务管理(IT Service Management)领域的国际标准,ISO 20000信息技术服务管理体系标准代表了被广泛认可的评估IT服务管理流程的原则的基础。该标准定义了一套全面的、紧密相关的服务管理流程。 ITSS(Information Technology Service Standards,信息技术服务标准)基于国内重点企业在运维服务方面的最佳实践,借鉴了ITIL、ISO 20000等先进国际标准和最佳实践。更加适合国内企业。 2.2 ITSS、ITIL、ISO 20000区别 ITSS、ITIL、ISO 20000主要區别如下: (1)性质不同:ITSS、ISO 20000是一套标准,而ITIL是一套最佳实践框架。ISO 20000是基于ITIL的IT服务管理标准。 (2)内容不同:ITSS覆盖了IT服务领域的全生命周期,从人员、过程、技术、资源多方面进行标准化。ISO 20000、ITIL主要关注管理流程。 (3)适用范围不同:ITSS适合IT服务供需双方,ITIL适合企业IT运维管理人员,ISO 20000适合外包IT服务企业。 3 ITSS原理 如图2所示,模型给出了运行维护服务能力的四要素:人员、过程、技术和资源。四要素通过关键指标体现运行维护服务的条件和能力,并应用于供方的能力评价。ITSS实施采用PDCA方法论实施过程管控,持续提升。 人员指IT服务生命周期中各类满足要求的人才的总称。规定了各类人员应具备的知识、技能和经验。过程指通过合理利用必要的资源,将输入转化为输出的一组相互关联和结构化的活动。规定了相应的流程和关键指标。技术是指交付满足质量要求的IT服务应使用的技术或应具备的技术能力,以及提供IT服务所必须的分析方法、架构和步骤。资源指提供运行维护服务所依存和产生的有形和无形资产。人员保证“正确选人”,过程保证“正确做事”,技术保证“高效做事”,资源确保“保障做事”。 4 ITSS实施组织架构 如图3所示,为快速推进ITSS实施,成立了公司管理层牵头的ITSS实施团队。 5 体系建设过程 如表1所示。 6 服务能力管理 6.1 服务目录 服务目录是运维服务能力管理的基础,描述了公司可以提供的服务。帮助客户识别有效服务,是SLA的基础。 6.2 能力指标 制定完善的运维服务能力管理计划和管理制度,包括人员、资源、技术和过程四个要素相关方面。建立运维服务能力管理的管理指标、考核体系和配套的管理制度,具有明确的量化指标,包括人员绩效考评、服务项目管理考评、服务交付指标等方面。建立服务保障体系,具有服务保障制度、岗位设置和匹配岗位需求的人员技术能力。 定期(一般为年度)对公司的运维能力进行策划,形成《运维服务能力管理计划》,建立相适应的能力指标体系。年底总结年度计划完成情况和指标达成情况。 7 人员 7.1 人员储备 根据业务需求,分析员工所需素质能力,确定岗位任职资格和职业发展通道,并根据任职资格进行人才选拔、储备、培养和晋升,进行关键岗位/管理岗位和非关键岗人才梯队建设。 根据《人才储备管理制度》制定年度《人员储备计划》,确定了各岗位人员的储备方式。 针对管理岗位,实施高潜质人才选拔;通过定期培训、轮岗等方式,培养储备人才;针对关键岗位,实施A/B角岗位备份工作;建立公司内部人才梯队信息。 7.2 人员培训 加强员工的培训教育管理工作,规范员工参加各类培训教育的行为。培训覆盖率目标为90%。包括骨干员工参加原厂培训认证,中级技术人员、操作岗位员工业务和技术能力的提升。主要通过部门内训、知识分享等方式进行。 7.3 绩效考核 绩效考核量化指标,定性考核和定量考核相结合,加强考核指标的针对性,在技术岗位逐步引入工作量和技能考试等多个量化指标,加强绩效考核对员工积极性的促进作用和引导作用。定期对绩效考核制度的可用性进行评估和改进。 8 过程 公司依据ITSS标准对过程管理八大流程进行了进一步的规范,针对每个过程制定KPI考核,根据阶段性的实施结果进行持续改进。 8.1 服务级别 定期组织运维服务能力评审会议,对服务目录进行评估。通过服务级别管理在平衡业务需求和成本的前提下,维持和逐步提高IT服务质量。 8.2 服务报告 规范服务报告管理流程。规范公司内部服务报告管理,对客户提供优良的服务保证,提高公司员工的服务水平和服务意识,确保负责人能及时、全面了解和掌握服务项目进展情况。 8.3 事件 事件的管理用来尽快解决环境中出现的事件,保持IT运维服务的稳定性。 特别对重大事件即指紧急程度较高、影响面较广且影响时间长的事件,进行了定义、分级和管理。 8.4 问题 问题管理旨在通过主动的识别和分析服务事件的起因,找到问题的根源并发起消除错误的行动,管理各种问题,将由IT基础设施中的错误引发的事件和问题给业务带来的负面影响最小化,并防止与这些错误相关事件的复发。 8.5 变更 通过变更管理,可以规范各类变更的实施过程,进而保证变更操作实施对内部外客户IT环境及业务带来的风险降到最低,提升服务质量,为业务的快速发展提供支撑。 公司针对变更的管理将变更分为四大类型:紧急变更、重大变更、常规变更、标准变更。 8.6 配置 《运维服务配置管理制度》包含配置管理职责、计划、制度等内容,保证所有配置项能够被识别和记录;配置项当前和历史状态得到汇报;维护配置项记录的完整性;确保IT资产的有效控制和管理。在固定周期内对IT環境进行审核、跟踪监测。 8.7 发布 规范发布部署的流程,包含范围和职责、发布评估、发布测试、发布申请、发布审核、发布实施、发布验收、发布回退、发布过程监控等流程。确保所涉及的软、硬件是可跟踪的、安全的,相应的版本都是正确、经检验和批准的。 8.8 信息安全 信息安全的管理是为规范服务管理和提供人员在提供服务流程中应遵循和执行的相关活动,保证信息安全管理目标的实现,满足SLA中的信息安全性需求以及合同、法律和外部政策等的要求。 9 技术 为确保运维技术研发成果与业务发展相匹配,《运维服务技术规范》规范了项目立项、项目实施、质量管理、项目变更控制、项目测试、项目验收、项目应用、项目改进。 根据市场分析和公司业务发展,每年制定运维服务技术研发规划,包括:新技术和前沿技术的应用、自动化运维、技术储备等。每半年进行研发成功总结说明。 10 资源 10.1 运维工具 专业的运维服务离不开专业的运维工具支撑。运维技术团队通发展了多种专业、实用的运维系统工具,有效提升了服务工作的专业性和效率。 根据实际情况,将运维服务工具分为三类:运维管理、运维监控、运维优化。 10.2 服务台 规范服务台工作人员的服务,不断提高公司的服务水平和服务意识,使客户享受到标准、热情、负责、耐心的服务,确保所提供的设备软硬件在运行期间能够稳定、安全、高效地运行,保证客户业务的正常运行,树立公司良好的服务形象,更好地服务广大客户,提高公司在客户心中的知名度和美誉度,持续提高服务水平和服务意识。 目前部分运维项目是客户现场驻点性质,运维服务台采用了公司-项目两级模式,有利于及时响应客户需求,提高客户满意度。 10.3 知识库 知识管理提高知识库使用效率,确保知识库内容的统一性、规范性、权威性,提升相关知识共享水平,规范知识库管理流程、明确运维人员在知识库流程中的职责。 为了提高知识共享效率,落实以下几方面的措施: (1)细化知识库分类。 (2)知识经过专家评审后发布共享。 (3)建立了知识库的奖励机制,对提供知识库数量、质量突出的个人,进行物质奖励。 (4)举办知识竞赛,提高知识学习的积极性。 11 应急响应 《运维项目应急处理管理办法》规定了应急的目标、应急原则、应急范围、应急响应组织、各类角色和职责、应急响应管理制度等内容。 定期更新《应急交付风险评估表》。采用风险识别方法识别各类潜质风险,按照风险影响度、风险概率计算风险值和对应的风险等级。根据不同的风险等级采用相应的风险控制措施,并测算采用风险控制后的风险等级。 《运维服务应急预案》规定应急事件的等级、应急小组构成和职责、应急响应的机制和针对不同风险的应急方案,每半年进行一次应急演练。 12 实施效果 12.1 人员方面 人才储备全年关键岗位储备完成计划达到90%。加强了管理技能、服务台工作技能以及运维工具的培训。完善了绩效考核的量化指标,采用定性考核和定量考核相结合,加强了考核指标的针对性。同时在技术岗位引入了工作量和技能考试等多个量化指标。 12.2 管理方面 通过培训和考核手段,提高了项目经理对服务级别协议的履行意识。规划了服务级别管理流程、实施服务级别管理流程(服务级别目录及级别协议的实施)、服务级别协议的监控和定期回顾报告、改进计划的制定和实施,来维护并不断改进IT服务质量,确保所提供的IT服务符合企业业务收益。每月顾客满意度调查,全年顾客满意度为95.28%。 12.3 资源技术方面 完成了自动化巡检工具、权限自动化配置系统、SAP请求自动化传输系统的研发。 知识库中已经上传了1 000多条知识记录,对所有内容进行系统分类,如常见的TOP问题和日常基本知识问题。 积极组织微创新活动,增加试验设备,增强运维人员微创新的氛围。 加大技术研发投入,持续将运维经验固化成工具,提高运维效率,进行智慧化运营。 为智慧化运营和业务拓展,做好技术储备。 主要参考文献 [1][南非]Peter Brooks.IT服务管理指标[M].丰祖军,译.北京:清华大学出版社,2008. [2][荷]Jan van Bon.IT管理框架[M].刘向晖,译.北京:清华大学出版社,2009. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。