IT运维管理的服务内容是什么?IT运维管理的定义

阅读  ·  发布日期 2020-03-29 12:26  ·  pcmister

IT运维管理的服务内容是什么?

      运维(Operation and maintenance)一般是指对大型组织已经建立好的网络软硬件的维护,其中传统的运维是指信息技术运维(IT运维)。所谓IT运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如软硬件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。

      随着信息化进程的推进,运维管理将覆盖对整个组织运行,进行支持的管理信息系统涵盖的所有内容,除了传统的IT运维,还拓展了业务运维和日常管理运维。其参与的对象也从IT部门和人员,拓展到组织的管理层和各部门,及其相关的业务骨干。
企业将IT部门的职能全部或部分外包给专业的第三方IT外包公司管理,集中精力发展企业的核心业务。简单的说就是企业在内部专职IT运维人员不足或没有的情况下,将企业的IT外包服务流程,包括全部办公硬件、网络及外设的维护工作转交给专业从事IT运维的公司来进行全方位的维护。

IT运维管理的定义

      在网络的基础设施建设完成之后,整个网络处于运行状态,IT部门采用相关的管理方法,对运行环境(包括物理网络,软硬件环境等)、业务系统等进行维护管理,我们把这种IT管理的工作简称为IT运维管理。

      IT运维服务的提供者基于服务级别协议(SLA)向IT运维服务的使用者提供各类IT运维服务。不同服务级别对应的服务质量指标是服务级别协议的重要组成部分。服务质量指标体现服务供应商所提供的IT运维服务的质量。

IT运维的管理现状

      伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效能的加速器。同时,计算机硬件系统和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。拥有数量众多的昂贵的Unix主机支撑80%的信息化关键核心业务。这些主机的帐号管理存在安全漏洞和隐患,存在僵死帐号,共用帐号等问题。信息化业务的神经节点多由价格不菲的交换机、路由器支撑。这些关键神经的管理十分依赖人来维护。设备操作无法有效记录,留下审查凭证,完全由人控制的帐号无形增加安全隐患。服务器和网络设备的认证强度不高,通常都只有静态口令认证方式,并且静态口令经常是弱口令,导致核心服务器存在越权访问的风险。信息化应用的复杂度决定了多角色(系统/数据库/安全/审计管理员/代维厂商等)交叉管理。合作伙伴的授权无法有效监督,发生故障后无法快速、全面、有效举证,为业务增长带来瓶颈。运维人员使用无所不能的Telnet/SSH远程管理工具,为内部不法员工,不满员工,和离职员工故意破坏提供了机会,因没有可靠的追查和定位机制,造成损失且无法追究责任。有合法权限的用户因为操作疏忽,操作失误,造成损失,无法鉴定。

本文以下内容总结几个头痛的主要因子,拿出来供大家参考指导,并接下来的系列课题中会对针对这些现状提出改进措施。

      现状一:IT运维人员成本偏高。据专业调查,大多数CIO表示较关心的是IT运维成本过高。原因是在过去的5年中,很多企业都实施了很多IT系统,使得IT运行越来越复杂,也越来越难管理。同时,其中有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效能不高,而且人力成本更是花费惊人。同时,另一家国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。从图中,我们可以看出, “流程维护”类和“运维人员”两者都与软性方面的成本相关非常紧密。而且三者的关系可以用下图来表示:备注:C类成本的大小很大程度取决于B和D类。

      现状二:处在“救火式”的IT运维控制。国内在IT运维过程中,IT员工大多数只是处在被动低效能手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①.IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满足度都不高。

      现状三:简单的自动化程度起了“反作用”。尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,主要原因是自动化不高而导致的。技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起根本没法判断问题的根源在哪里。还有,许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。就如图中一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破,或者是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。

      现状四:本是同家兄弟,却不经常来往。这个问题主要是发生在拥有许多子公司的企业,每个子公司的系统都是独立的,下面主要以国内银行业为例。以前国内的银行业没有搞集中建设,每家银行的各个地方分行都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。虽然国内银行业的IT运行维护管理水平,有点接近国外80年代末90年代初银行业的水平,银行IT结构上都采用了大集中模式。从硬件设备上来看,国内银行不比别人差,甚至还有些靠前,但IT运维管理还没达到国外当时的水平,尤其是呼叫中心、客户服务方面。”。

      结束语,从上面三个现状来看,主要是有关软性方面的。的确如此,国内借着近十几年高速发展,硬件方面的发展取得了重大进步,某些方面的水平甚至是超过了国外的水平,并且IT硬件的生产厂商也是出现了很多与国外厂商同等秀舞的水平。但是往往是硬件易学,知识技巧难寻。这不仅与国内教育环境有关外,还与知识经验的继承有关。管理要动态匹配业务需求。IT部门还会经常联合HR、法务等部门一起做跨部门的沟通,面对的对象是各部门的管理层,让他们理解企业的IT策略。
想了解更多相关信息,可以咨询瑞铭安普专业工程师,为您制定专属解决方案!