网站首页  词典首页

请输入您要查询的论文:

 

标题 Zabbix性能监控软件在高性能集群上的应用
范文

    肖海琴

    [摘 要] 随着集群引进节点数量和存储容量的增加,运维难度逐渐增加,需要人数也会增加,如果运维人员想构建一套自己的监控系统环境,Zabbix将会是最佳的选择。如果是开发,想基于开源软件开发一套属于自己的监控系统,Zabbix也是比较好的选择。通过Zabbix连续监控软件在大庆高性能集群应用上的介绍,可自动地监控集群系统节点的性能和故障,达到快速处理和解决问题,减少运维成本。

    [关键词] Zabbix;集群;应用

    doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 03. 077

    [中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2017)03- 0139- 01

    1 引 言

    地震处理并行集群系统,主要是由高性能IO节点、管理节点、计算节点、高速网络及光纤存储、集群存储等集成起来的并行机系统。随着地震生产任务的逐年增加,服务器节点数量也随之增多,而整个处理系统长期以来缺乏一个实时监控工具,因没有故障监控和故障定位功能,给故障诊断造成困难。

    其实作为集群系统运维工程师所关心的是日常工作的主要内容,通过哪些手段可以保证服务器的正常运行。比如:检查服务器性能、连接数量、DB的相关情况等等。因此通过研究开发集群监控软件,对系统管理人员,能做到发现问题、预知问题、及时处理问题,对于提高系统管理和维护效率,有着非常重要的意义。

    2 Zabbix集群监控软件的主要功能及特点

    Zabbix是一个企业级的开源分布式监控解决方案,具备常见的商业监控软件所具备的功能。可监控系统运行性能的技术指标,包括CPU利用率、内存的使用、磁盘的使用、网络的状况、端口的监视、日志的监视等,支持自动发现网络设备和服务器,支持分布式,能集中展示、管理分布式的监控点,扩展性强,Server提供通用接口,可以自己开发完善各类监控,依照监控系统长期收集的各项综合信息,及用户实际应用的反馈信息,弄清系统瓶颈真正所在,为系统运行环境的优化提供宝贵的资料。其意义在于让系统步入一个良性的循環轨道,实现集群的负载平衡,提高整体运行效率,所以集群监控软件在生产中具有非常重要的作用。

    3 Zabbix集群监控软件的优劣势

    3.1 优点

    (1)开源,无软件成本投入;(2)Server对设备性能要求低;(3)支持设备多;(4)支持分布式集中管理;(5)开放式接口,扩展性强。

    3.2 缺点

    (1)全英文,界面不友好;(2)无厂家支持,出现问题解决比较麻烦。

    4 Zabbix配置使用及安装部署

    4.1 配置使用过程

    通过本地浏览器访问http://ServerIP/zabbix来开始配置和使用Zabbix。

    使用Zabbix进行监控之前,要理解Zabbix监控的流程。

    4.2 一次完整的监控流程简单描述

    Host Groups(设备组)->Hosts(设备)->Applications(监控项组)->Items(监控项)->Triggers(触发器)->Actions(告警动作)->Medias(告警方式)->User Groups(用户组)->Users(用户)

    4.3 安装部署

    Server:mgt2

    客户端:node001-node240

    Zabbix监控实例如图1所示。

    5 结 语

    开发的Zabbix监控系统已经部署到HP、IBM集群的偏移节点,并实现对偏移作业实时连续监控,通过直观的监控信息,可及时发现问题,并为系统性能优化提供有效帮助,提高了系统管理和维护水平。

    主要参考文献

    [1]吴兆松.Zabbix 企业级分布式监控系统[M].北京:机械工业出版社,2014.

    [2]高俊峰.高性能Linux服务器构建实战:运维监控、性能调优与集群应用[M].北京:机械工业出版社,2012.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/21 16:01:59