IT运维管理拒绝,BSM与NSM关系不大

日前,中国IT运维管理解决方案厂商——北塔软件宣布,正式推出首款符合中国用户的IT运维管理软件——北塔BTIM(Before
Trouble Integrated
Manager)IT综合管理软件。该产品以业务价值管理为核心,将真正IT与业务融合,帮助企业实现自动化、智能化、流程化的IT全方位管理,实现对BSM的全面支撑,全面推动中国企业BSM建设驶入快车道。

韦德国际官网,IT运维管理拒绝“私情”,”透明化”是关键

在IT运维管理过程中,没有故障的网络是“理想化”的,尤其是在大型网络中,甚至会出现多起网络故障同时报修的情况。当多起运维需求同时被提交时,IT运维人员往往会面临如何处理优先级的问题。

中国是个讲人情的社会,这种特殊化的交际结构,是国内企业永远不可能绕开的话题。而职场上说到的“人情”,往往含有最基本的两层意思。一种源于亲缘,另一种源于同感。亲缘强调的是“熟人”,常被人当成是一种“私情”;而同感主要指同事、上下属之间的相互理解和体谅,强调人性化的处事方法。在故障处理级别设定的问题上,IT运维管理同样也会受到“人情”的困扰。若不能正确处理“私情”和“同感”的区别,往往就会让IT运维服务处于极其尴尬、被动的局面。

我们来看看一个IT运维中的实际案例。小李是某集团网络中心的资深工程师,他时常会遇到业务部门或者下属公司同时申报网络故障的情况。为了摆明自己不讲私情的立场,小李采用了“先报先修”的流程来处理申报,但这种自以为公正的方法却仍然遭到了投诉。更为严重的一次,由于集团核心业务系统没有得到及时修复,导致整个网络中心受到公司高层的通报批评。难道说“先报先修”不对吗?

针对IT运维管理过程中出现的类似问题,小李请教了国内领先的IT运维管理专家北塔软件。北塔软件专业人员为其解释:“在传统的IT运维管理模式中,运维工作本身不具备透明性、信息不对称,这是屡遭投诉和批评的主要原因。‘先报先修’看似合理,但却没有考虑到故障恢复的优先级,也就是故障的影响度、紧急度。因此,最佳的处理方案,首先就是要实现设备层面的主动运维,减少故障率;其次,就是要在这个基础上,形成业务层面的运维服务管理,签订并履行SLA协议。“

一般来说,在同时需要处理数个故障的情况下,由于受时间、资源和人力等的限制而无法实现时,就要排定处理的先后次序,即确定每个故障的优先级。但出现故障后,没有哪个用户会同意滞后处理。相反,他们总是认为自己的问题才是最需要优先解决的。因此,最好的IT运维方式,是建立透明化的运维平台。这非常像马路上的电子屏幕,用绿色和红色表示畅通和拥堵,通过透明化的方式,为IT部门和业务部门建立一个共同关联的平台进行交互。

以北塔软件的北塔BTIM综合业务管理系统为例,利用北塔BTIM的数据采集层、数据处理层和功能显示层,可以充分对IT基础设施进行透明化管理,将一些看不到摸不着的IT资源,通过清晰直观的方式展现和管理,以便于管理人员对IT系统的现状做到准确的把握,在服务可能出现停滞之前就发现先兆并采取相应措施。

另外,为了帮助企业建立有效的SLA协议机制,北塔BTIM中包含“业务仿真”等功能,以及巡检服务,可以帮助IT部门寻找可能导致违背SLA承诺中的性能问题、WAN延迟和业务缓慢的难题,按照业务访问的路径,关注业务路径中一切的元。其次,北塔BTIM还支持了从网络流量中剥离出关键业务的实时业务流量,进而投射到网络拓扑结构中,让业务用户的分布,各网络节点对业务流动的影响“一目了然”。一旦出现预警和故障,即使多么复杂的异构环境,都能为快速恢复业务的正常运行建立分析机制。

签订SLA之后,IT部门可能会得到一些前所未有的好处,但如何让非IT部门同样受益,实现同感呢?对此,北塔软件表示:“如果只是以列表的方式把参数展现出来,还是无法满足信息对称的要求。为此,用户可以使用北塔BTIM报表功能,将业务系统健康状况、整合参数、外联参数等数据‘翻译’成业务人员和领导看得懂的图形。对于业务部门而言,由于存在这个透明的管理平台,就可以清晰的构建业务架构的质量。而领导层也可以看到这些关键业务的健康状况,好还是不好,下面的员工满意还是不满意。”

如此透明化的IT运维管理,在科学处理故障的同时,就已经屏蔽了可能由于“私情”和不理解产生的协作矛盾,让IT运维管理可以进入到合理、有序的新进程。

在IT运维管理过程中,没有故障的网络是理想化的,尤其是在大型网络中,甚至会出现多起网…

IT运维管理离不开对IT基础设施的管理,但是目前很多人认为,IT运维对于底层的NSM不是很重要,实施BSM可以抛开。5CTO.com在采访中了解到,这种观点是有问题的。IT运维管理的核心目的是保证基础架构对业务的支撑。如果脱离了基础架构管理,我们拿什么去支持业务呢?业务是什么,业务是一个端到端的过程。前几年IT运维管理系统的流程没做好,最重要的原因是基础设施管理不扎实。基础设施管得不好,就盲目追求流程的结果是很可怕的。比方说我们实施了一个事件管理的流程,但如果我们发现的事件是错误的话,整个流程是毫无价值的。举个具体一点的例子,如果财务系统不能运行,IT运维系统会有很多告警,网络、服务器、数据库、中间件告警,但有造成这个故障肯定会有一个根原因,这个跟原因会造成系列的告警,如果对基础设施管理不扎实,就无法发现根原因;告警十几个,产生十几个事件,派了十几个人去执行十几个工单,最后是一件事。这个流程越高效,浪费资源越厉害。所以说,流程化管理的第一步是把基础设施管理做好,对这些问题有细致的了解,在此基础上事件管理才是合理的,比如网络有问题,结构不合理,如果没有工具发现这个问题,经常出事,流程就归为问题,事件管理是应急的。缺少大量的基础数据,不能有效解决问题。所以流程化管理做得不好,脱离了企业的实际,要搭建BSM,首先综合管理平台要牢固,把企业的方方面面纳入管理范畴,构建关联有关系,类似于ITSM的CMDB,在此基础上流程才是高效的,否则无法实现高效,都是误报。

众所周知,在IT建设领域,继以业务流程再造著称的ERP被大受追捧后,能够将IT与业务深度融合,优化IT资源配置的BSM业务服务管理,迅速成为中国企业关注的新焦点。

流程化的执行短期内是降低效率,如果要做ITSM,半年之内企业的效率必然下降,因为要进行资源整合,很多人要习惯,事件经理,问题经理,变更经理都不会很快习惯工作方式转变。用半年时间去适应,再半年去体现效率,用同样的人力物力处理事件数量成倍增长。

对于北塔BTIM上市,北塔软件副总裁李汉忠表示,受到全球金融危机影响,企业越发关注IT建设和运维的成本,并且希望应用IT系统获得更多回报,这使得IT运维管理的价值进一步凸显。北塔软件发挥在国内IT运维管理市场的深厚积累和实践,立足企业IT基础设施管理,结合最先进的IT发展理念,推出北塔BTIM这一全方位、开放式的IT综合管理平台,以全面、智能、透明、层次化管理等特色,实现了面向企业业务的端到端的全程管理,完全符合企业业务系统复杂化的应用特点,将成为中国企业实践BSM的切入点和最佳途径之一。

用户需要的是一个综合的管理平台,业务是一个多层次的问题,从网络到链路,到流量,到主机,操作系统,数据库,应用系统,能做统一监控。这个工作是大量的,要整合这些资源是很难的,需要时间的。国内大型企业在做这个工作的时候忽略了整合,他们分离、分立式的进行了管理,比如思科、ORACLE、流量等方面都用不同的工具去管理,这些工具是隔离的,数据没有关联性的,这就导致出现问题就容易出现推卸责任。国内有家大型企业实施了SAP系统,在进行领导参观前的最后一次演练时发现有人无法登录,认证系统出错。他们在排查鼓掌的时候,首先去查看AD系统。他们的AD系统是CA做的,经过验证,AD系统正常,但是网络有问题,经常丢包,这个丢包问题影响到了认证过程。为什么会不间断的丢包呢?他们认为是交换机的问题,可是换了一个交换机后却发现仍然丢包。最后用北塔BTIM系统排查,对信息收集归并分析,发现机房环境系统,一个空调坏了,交换机温度过高才导致的丢包,所以AD系统重复认证,CA认为其为非法,当时花了三天时间,终于找到故障。

对于BTIM以及BSM的中国进程,北塔软件技术总监孙永杰也表示,BTIM是北塔务实中国用户市场现状的适时产品,而BSM却非一个产品,BSM更多的是一种解决方案。在去往真正BSM的路上,目前国内用户市场的应用需求和实际部署还处于冰山一角。当然,他也表示,北塔将紧跟用户市场发展,推进中国BSM的落地。

这个例子就可以看出,如果没有一个统一的管理门户的话,信息是隔离的,管理人员如果无法找到问题的关联性是很难发现问题原因所在的。企业用户发展到业务系统很复杂的时候,一定会进行管理系统整合,把数据纳入一个平台,理清关联性。比如早期的布线系统,如果使用了若干年后出现了故障,管理员就需要一个一个的进行测试,而到今天,有管理系统能够对其进行标准化的管理。如果没有这些关联性,管理是没有头绪的。如果缺乏对基础网络的NSM管理,很容易把一些实际上很简单的事情判断成严重的问题,这对流程化的建设是不利的。国内脱离综合管理平台,不能做到有效实施,流程就成了OA系统。所以我们要注意,不要把ITSM做成了IT部门的OA系统,如果仅仅是把纸制变成了电子,同底层管理脱钩,是很难实现。这样造成的后果是知识库是无法积累,没有管理平台,没有解决问题的记录。NSM是BSM的基础,必须执行。

发表评论

电子邮件地址不会被公开。 必填项已用*标注