高效IT运维管理应是多面手,数据中心

数据中心“云化” 排解虚拟化的那些尴尬

虚拟化技术在这个云计算爆发的时代应用的越来越广泛,相比以前“真实”的物理设备来说,企业将虚拟化技术引入内部网络,将更多的数据资源放在资源池当中,使得数据、管理、运维都变得更加虚拟,从而大大降低了IT管理在整个企业当中的可视性。

图片 1

对于企业来说,在日常的管理当中,管理者都希望能够对企业的网络进行更加清晰化的了解和运维,然而随着虚拟化技术的不断应用,一方面减轻了IT管理者在物理设备端的工作压力,但是就像我们前面说那样,硬件设备的真实性大打折扣了,这些都是虚拟化技术带来的“尴尬”,本期我们就来说说这些尴尬。

数据中心“云化”带来什么

云计算发展到现在可以说是越来越成熟,有很多企业的数据中心也开始在充分利用云计算平台来进行运营,云时代数据中心最明显的特点就是虚拟化技术的大量应用,这使得运维管理的对象也在变化。
虚拟化技术的采用能够减少数据中心中物理服务器和设备的数量,并且提供更高的灵活性,从而满足迅速变化的业务要求。

虚拟化技术的结果是将这些资源都“池化”,使得一切管理对象变成虚拟的、可灵活迁移的逻辑存在。资源在数据中心中的物理位置的可视性变得困难。

对于数据中心的网络配置就带来了一个难题,由于数据中心的管理人员和服务器设备的管理员之间需要不断地沟通,对故障进行排查、检修、测试等等很多繁琐的步骤,这就从另一方面提升了企业数据中心等基础设施出现问题的几率。

另一方面,网络和服务器的边界也变得更加模糊,这带来了网络及计算资源的协同调度问题。业务的正常运行,不仅取决于在服务器上的资源合理调度,同时也取决于网络连接的合理调度。

如何应对虚拟化带来的“尴尬”

面对上述难题,企业需要建立一个基于云技术的数据中心平台,从而通过这个系统对整个网络之间的计算节点进行打通,同时,实现物力资源和虚拟资源之间的贯通,只有这样,才能够最终实现企业网络运维的自动化,提高数据中心的运维效率。

在云时代的数据中心里,IT管理者必须能够时刻了解自身的IT资源情况,随时能够了解虚拟机和物理服务器之间的对应关系,同时清楚地建立起物理服务器、虚拟机、物理网络、虚拟网络之间的关系,并且把这些元素同数据中心的业务系统之间的关系建立起来。

结语

对于企业来说,整合数据中心当中的软硬件资源,进而满足用户需求,提升数据中心的整体运维效率是非常有必要的,此外,在处理虚拟化瓶颈的时候,需要与服务器等硬件设备之间的资源进行融合贯通,只有这样虚拟化技术在云时代的网络当中才能够发挥更大的作用。


图片 2


排解虚拟化的那些尴尬
虚拟化技术在这个云计算爆发的时代应用的越来越广泛,相比以前真实的物理设备来说,企业将…

然后就应该IT考虑长期的优化和建设的规划,持续降低IT系统的故障率,提高IT系统的使用率。

高效IT运维管理应是多面手

随着云计算、大数据、移动应用等新一代信息技术的发展,企业信息化应用变得更加得心应手,但IT运维管理的压力似乎并没有减轻,反而面临更大的挑战。面对过去的老问题以及当前的新变化,如何提升运维效率,成为CIO们关注的重点。

但在解决如何提升IT运维管理效率之前,我们首先要理清一个概念——什么是IT运维管理?

IT运维管理起源于IT基础设置建设之初,是对处于运行状态下的物理网络,软硬件环境、业务系统等进行维护管理,我们把这种IT管理的工作简称为IT运维管理。

具体我们可以大致概括为以下七部分内容:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、WEB等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

第三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical
Success Factors)和KPI(关键绩效指标Key Performance Indicators);

第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

IT运维是IT管理的核心和重点,也是内容最多、最繁杂的部分,每一个子系统中都包含着十分丰富的内容,也因此被很多人称之为“IT运维管理就像一个什么都能装的箩筐”。但通过梳理,你会发现,其实IT运维管理也有依有据,有规律可寻。

IT运维管理可以让业务流程变得可视化
,就像新产品要经过严格的检验程序一样,业务流程也需要测试以证明它们能够经受住操作环境的压力和考验。一个新的或被修改过的业务流程在进行系统、技术和员工的投资之前也必须加以审核。这就需要流程可视化。

流程可视化是你能够真实地看见业务流程实施的简单而有效的方式。这种对待流程设计的方式可以植入你的企业文化之中。你可以像对待新产品一样来对待业务流程设计。

“流程”这个词不仅仅指企业的活动和工作流。“业务流程”通常包括很多业务元素。包括业务目标、需求、策略和原则,以及最佳实施策略的制定,也包括信息流,产品和服务,设备以及资金、系统和技术的支持。流程可视化的关键是把企业的基本元素和业务流程进行整合,通过演示告诉企业,你的业务流程和支持技术在真实的场景中将如何运作,信息流如何支持流程的运作,如何支持系统进行互动。

运维管理自动化可以帮助企业建立快速响应并适应企业业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。

运维管理自动化需求最早以代替人工操作为出发点,从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。

传统式被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪。具体表现为:运维人员被动或者效率低、缺乏一套高效的IT运维机制、缺乏高效的IT运维技术工具等等。IT运维自动化可以把IT运维人员从纷繁复杂、大量重复的工作中解放出来,专注于更有价值的工作内容。

首先,IT运维流程自动化能够提高流程的可控性,可以基于业务需求来制定个性化的流程,使企业领导有机会看见他们的业务流程,对企业流程有一个深刻的分析和理解,进而改造和优化流程。

其次,IT运维流程的自动化能提高透明度。因为随着业务需求的变化可能会有多个版本出现,手工流程的不透明将会给流程定制和优化带来相当大的困难,而自动化流程可以使用户能够一目了然的看到整个流程的各个节点运转情况,自动化工具潜移默化地提升业务保障能力。

再者,运维系统实行了自动化监控以后,通过工具自动监控对人的工作是一种减负,也是一种降低成本的表现。

简单的说,IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。

自动化工作平台还可帮助IT运维人员完成日常的重复性工作(如备份、杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。

服务流程规范化让IT运维管理有标准可参考,ITIL(IT Infrastructure Library
信息技术基础架构库)是国际上一套通用的IT服务管理标准。ITIL可以帮助IT部门建立一套最基础,但也是最规范的管理制度。参照ITIL制定一套IT运维管理制度,以此规范部门的服务标准。把每项职责都落实到人,按照“日事日清”的原则,对每位员工逐一考核。

通过IT服务规范管理,可以把支撑业务的IT系统的服务,将其纳入流程,并加以测量。IT服务管理(ITSM)就是以服务对象为中心,将IT有关工作流程化的管理起来。

服务流程规范化的最终目的是建立完善而成熟的IT运维管理体制,通过流程管理,不断提高IT运维质量,实现高效运维,提升组织内IT服务满意度,进而帮助企业建立快速响应并适应企业业务环境及业务发展的IT服务模式,使IT服务向规范化和流程化方向发展,共同促进、集团行政管理和服务水平的不断提升。

配置信息统一化,可以让企业建立统一的IT基础设施资源池,这样的做的好处是,所有的系统均处于同步运行状态,可统一管理、调配资源。

很多企业的IT运维管理平台都是按照IT服务行业标准ITIL建立,包括有事件管理、问题管理、配置管理、变更/发布管理、配置管理、作业管理、知识库、服务考核等在内的服务管理流程。

在形成闭环管理的同时,所有的流程信息均存储在配置管理库中,配置管理库所提供的数据一旦出现问题,而领导按照这个错误的数据做出了错误的决策,所造成的损失将是无法估量的。配置信息统一化后,如果某用户信息中心业务系统提前进行了告警,显示其中某台服务器负荷过高,信息中心运维人员收到告警信息之后可以立即上报,采购新的服务器。

IT运维管理平台应该着重在建设配置管理库上,配置管理数据库存储了所有配置管理的数据和信息。同时也是事件管理、问题管理、变更管理等流程查询、诊断、记录的基础,配置管理库的数据一旦出现任何问题,IT运维管理人员在对系统进行升级、改造过程中都会造成决策失误,从而影响业务系统正常运行。

IT运维管理平台的基础配置管理库具备联邦、调和、同步、映射四个重要特性。大部分厂商的配置数据库都是通过手工录入的,将繁琐的IT设备基础信息手工录入到配置管理库里,每次底层IT设备出现变更等情况都需要再录入到配置库,一旦有IT设备信息录入错误,配置资源库里的数据就会失真。

当IT设备配置项发生变动时,通过资源库检验配置项的正确性和完整性,建立统一的IT基础设施资源台帐,实现配置管理库联邦、调和、同步、映射四个重要特性。正确的数据让决策者精准的掌控业务运行全局状况,为领导决策提供科学的依据。通过资源与配置的统一管理,确保底层数据配置项准确无误,通过IT运维管理平台统一展现、全局掌控确保业务运行无忧,持续提高业务部门和客户的满意度,提高企业核心竞争力。

简言之,高效IT运维管理应该是个多面手,可看、可管、可抄、可调。

而从用户的实际应用情况来看,正是IT运维管理的上述四大作用,让用户从NSM网络安全与管理走到ITSM
IT服务管理,再到BSM业务服务管理这样一个不断升级的阶段,经历了由被动管理到主动管理、由主动管理到服务导向再到业务价值实现这样一个过程。

但在云计算、大数据、移动应用这种强调“屌丝文化”的新阶段,搭建一个高质量的应用,需要IT运维人员自己动手做很多事,才能搭建一个理想的应用系统。比如:为啥云计算有很多开源的东西,却不是人人都能做?其实,云计算跟房地产一样,要占地、占机房、占带宽。另外,在海量数据汹涌来袭的大数据时代,数据增加都是被动的、延迟的,如何让IT运维管理跟得上数据发展速度,做好大数据准备,已成当务之急。同样,移动应用也对IT运维管理产生了重要影响,催热了新型IT服务,让IT运维走向APP时代。IT运维管理需要更得上移动互联发展脉搏,提升客户体验,实现不同设备与不同平台之间的对接。只有这样,高效IT运维才会完整。

随着云计算、大数据、移动应用等新一代信息技术的发展,企业信息化应用变得更加得心应手,但IT运维管理的…

还是要根据自身的实际情况来选择,一般来说,运维工具可以分为运维监控工具、运维流程管理工具、厂商专业工具等几类。

运维监控工具几乎是每个企业都必须的,它可以在达到较高运维质量的同时基本不增加运维的人力成本。开源的运维监控工具如Nagios等更适用于精通Linux、很专业的运维工程师。选择商业工具时,可以根据企业的具体情况和产品的特色来决定。比如如果需要监控一些比较新的开源软件,蚁巡运维平台几乎是唯一的选择。

值得注意的是,由于目前市面上的免费的开源运维工具完善程度都不是很高,所以在人员技术能力一般的情况下采用开源运维工具并不能节约成本,反而可能会因实施复杂和无法得到技术支持而给企业的运维带来困扰。

其次应该是快速的诊断和排障功能,在发现问题的基础上,快速找到问题根源,并且及时将问题解决;

当企业的IT运维工程师不是很多时(6-7人以下),可以无需引入运维流程管理工具,而用OA、邮件等辅助工具可以达到类似的效果。目前市面上没有很好的开源的运维流程管理工具,当必须要引入运维流程管理工具时,使用国产化的商业工具几乎是必然的选择。

发表评论

电子邮件地址不会被公开。 必填项已用*标注