WNPM微诺容量管理软件
发布时间:2017-03-21 10:50  发布作者:admin
随着虚拟化、云计算、大数据等技术的兴起,企业信息化建设的不断深人,大部分企业都或多或少面临以下困惑:拥有大量的物理计算设备和虚拟设备,导致整个 IT系统的复杂度不断提高,为了尽快恢复生产,故障必须尽快处理,没有足够的时间去保留现场仔细分析故障原因;以下是 IT 运维人员经常遇到的场景:

业务系统的各个服务器的各个指标,都有那些出现了问题?主要IT对象的状态如何?嗯,查看磁盘IOPS的命令是什么… 快google!
不太正常的指标昨天这个时间的大致值是多少?指标在过去24小时的变化趋势是什么样的?
好像是这个操作系统问题,但没有现场,测试系统也没有重现,联系厂商,给了个Dump脚本,等着下次故障发生吧 ……

长此以往,必然导致不能快速找到故障的根源,改进也就无从谈起。整个系统长时间处于不稳定状态,IT 运维部门和业务部门都人心惶惶。
微诺时代认为解决之道是尽量多的收集系统中的各种数据,将故障现场保留下来然后做进一步的分析。这些信息包括:

获取IT基础架构动态信息,包括容量信息,连续快照信息等。
容量信息的自动健康基线及基于基线的自动预警
业务视角的数据视图
为此微诺时代(北京)科技股份有限公司研发了 “容量管理”系统,并命名为 WNPM 。WNPM 用户感受好、适用范围广,扩展性强。

 

解决方案:

微诺时代(北京)科技股份有限公司根据自身多年的 IT 服务经验,通过长期和客户磨合,我们将积累的丰富经验应用到本系统的研发中。我们系统优势包括:

拥有大量开箱即用的脚本,无需二次开发。 
数据展示灵活、多样。本系统支持多达近20种统计图形,能够让用户多维度的观察系统的状态。 
支持agent 和非 agent 体系,对现有系统冲击少。
具备和 Hadoop 平台的接口,能够将数据推送到大数据平台,为今后的进一步分析提供有效环境。

以下是 WNPM 的体系结构:



整个系统分为以下5部分:
用户界面:用户界面层主要是系统的控制台,从中我们可以看到每个 IT 基础设施的指标,包括统计图表等信息。
管理服务器:将数据库的信息展示在控制台中,并接受控制台发出的指令;
数据库:数据库存储各种性能数据和配置信息,支持Hadoop作为数据存储平台存储结构与非结构型数据。
通讯服务器:负责将执行脚本推送到各个管理节点,同时收集 IT 基础设施的数据。
脚本:收集数据、分析数据的程序。
 
现代 IT 系统是个复杂的整体,应努力避免信息孤岛的存在,为了便于和其它系统通讯,我们设置了开放接口,其它系统可以通过调用我们的开放接口获取容量管理系统中的数据。
同时为了更有效的分析和保留历史数据,保持容量管理系统的高效运行,我们将历史数据进行归档,归档方式有多种,可以归档成文件也可以通过数据推送归档到大数据平台(Hadoop)中。
 

WNPM 2.0 技术特点:

1. 采用开源技术采购成本低:
微诺时代的容量管理软件-WNPM 运行于 Linux 环境下,采用 Tomcat、Mysql 等成熟开源软件;具有采购成本低,技术成熟等优点。我们所采用的开源软件都是在行业内具有较高认可度的,其稳定性,性能都具有良好的口碑,同时使用较为广泛,学习成本和运维成本都较低。

2. 具备并发处理能力
WNPM 可以同时调度多台设备进行操作,具有并发处理能力。这样做的目的不仅可以大大提升数据的处理速度,而且我们的体系架构具备横向扩展能力,可以将不同的任务均衡的分布到不同的计算机上。当目前的服务器性能不够时,只要将新的服务器加入集群,即可处理更多地数据,管理更多的设备。

3. 系统架构可扩展性强
本系统的扩展能力体现在两个层面上:
(1) 如上所说,我们的系统具备横向扩展能力,可以将不同的任务均衡的分布到不同的计算机上。
(2) 整体架构采用基于 SOA 的体系架构,功能扩展能力强。新的功能可以作为服务很方便的融入到现有系统中。



4. 有开放接口
我们深知, IT 运维系统不是单一系统,是多系统组成的一个复杂的群落。它们之间相互依存,相互影响;其中的任何子系统都不能成为信息孤岛。为此 WNPM 设计了两类开放接口,一类是基于 HttpService 的接口,用户只要发起一个特定的 URL 就会发起远程调用获取本系统中的数据。另一类是基于 SNMP 协议的,当其它系统有数据要发往 WNPM 的时候可以采用 SNMP 协议将数据送到本系统中来。
有了开放接口,WNPM 就可以迅速融入现有的 IT 运维体系中,更快的产生效益。

5. Agent 与非 agent 结构的结合
用户现有的运维体系中已经充满了各种各样的 agent ,为了减轻系统负担,减少对生产环境的冲击, WNPM 采用agent 和非 agent 结合的方式,也就是说是否采用agent 由客户根据实际情况自行选择。我们建议被管理节点较多时采用 agent 结构,这样可以减轻 WNPM 服务器的负载。
 

成功案例:

中国民航信息网络股份有限公司
中国航信作为面向航空公司、机场、机票销售代理、旅游企业及民航相关机构和国际组织,全方位提供航空客运业务处理、航空旅游电子分销、机场旅客处理、航空货运数据处理、互联网旅游平台、国际国内客货运收入管理系统应用和代理结算清算等服务,是目前航空旅游行业领先的信息技术及商务服务提供商。公司性质决定了其 IT 系统具有关乎国计民生的地位,因此中航信对 IT 系统的持续服务能力要求很高。出现故障必须立即处理,否则就会大面积会影响旅客的正常出行。因为要求处理及时,故障现场不能保留,为事后的故障分析带来了极大困难;因为不知原因,改进也就无从谈起;故障的先期征兆和前导指标也不能快速归纳总结,给 IT 运维带来极大的困惑。经过严格的测试和评审,中航信采用了微诺时代的“容量管理系统-WNPM”为其收集分析 IT 运维过程中的各种数据。通过使用本系统,航信的故障现场基本得到完成的保留,故障分析准确率大大提高,故障复现率由 85% 压缩到不足 50% 。为航信有效提高服务水平做出了显著贡献。