良玉的博客 点点滴滴,积水成河_良玉的博客_页游、手游linux运维工程师之路

ITIL理论与实践探讨

随着IT产业的迅猛发展,各行各业对IT都有了更深的依赖性。IT作为支撑平台,已成为多数行业的基础设施。因此,如何保障IT基础设施的有效运转,直接关系到各项业务的正常开展。企业的IT安全问题和服务质量开始被提升到与资金安全、人员安全同等重要的战略高度。ITIL(Information Technology Infrastructure Library,信息技术基础架构库)的推出就顺应了这样一种趋势,它在实践中为保障IT服务的高效性和可靠性提供了指导依据。
 
IT服务是伴随着计算机应用系统的进步而发展的,大体上经历了3个阶段。在计算机应用的初期,由于软硬件结构简单,系统相对独立,维护起来也比较简单,系统故障导致的业务损失相对较小。当时的IT服务体系并没有明确的划分,绝大部分工作由用户直接完成。IT服务尚处于针对单机上特定软硬件的阶段。
 
随着网络技术的发展,软硬件系统的复杂度不断提高,各单位都建立了独立的由网络和软硬件技术专家组成的IT服务部门,对IT结构进行维护。其职能相对独立,主要是面向技术,与业务部门的关联度比较低。
 
进入第三阶段后,IT服务开始由技术导向转变为业务导向。其强调的重点已由设备的先进性和稳定性转移到为客户服务的高效性和完整性上来。以往技术专家型的服务模式已不能完全满足业务的需要。IT服务需要更加专业化和流程化,需要减少IT服务对支持团队中特定技术专家的依赖,需要对服务的结果有明确、合理的评测标准。在这种背景之下,ITIL体系应运而生。

一、ITIL概述
 
ITIL起源于上世纪80年代,由英国政府发起,委托英国国家计算机和电信局运作,后来并入英国商务部专门负责,倡导对IT资源的有效及低成本利用。ITIL是基于流程的方法论,它提供了一套适于IT服务管理的实践指南。目前ITIL已成为国际IT行业服务管理的理论基础,它为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。企业IT部门和最终用户可以根据自己的能力和需求定义自己要求的不同服务水平,参考ITIL规划和制定其IT基础架构及服务管理,确保IT服务管理能为企业的业务运作提供更好的支持。对企业来说,实施ITIL的最大意义在于把IT与业务紧密地结合起来,从而实现企业IT投资回报的最大化。 
 
ITIL用来建立和交付服务管理流程(见图1),包括服务支持和服务交付两项核心内容。服务支持主要规范IT服务日常工作中对各种场景的处理方法,是操作(运营)级的管理理念;服务交付主要规范IT服务应达到的工作目标,侧重于对客户的服务承诺和质量水平,是战术级的管理理念。服务支持包括服务台、突发事件管理、问题管理、配置管理、变更管理和发布管理等流程。服务交付包括服务级别管理、财务管理、能力管理、持续性管理和可用性管理等流程。各流程相互贯穿和作用,形成有机整体,共同建立起一个健全的服务管理体系。


1.服务支持的管理流程
 
服务支持包括的管理流程,可以看作是ITIL日常操作(运营)层面的部署。
 
服务台是IT服务提供者和用户之间日常工作的单一联系点,负责处理服务请求和报告突发事件。服务台处于第一线,负责解答用户提出的问题和服务请求。如果该问题属于正常服务级别能够解决的,服务台应快速响应负责恢复处理。如果问题不属于正常的服务请求或超出了正常的解决时限,则将问题作为突发事件,由服务台记录和跟踪,转入突发事件管理流程处理。
 
突发事件管理流程首先对问题进行分类,对该问题是否为已知错误原因的问题作出判断,并根据影响和紧急度判断该问题的优先级。通过调查和诊断,应将服务台不能处理的问题迅速转至二线、三线技术支持,最后将处理结果反馈回服务台,由服务台告知用户解决方案并关闭本次事件处理流程。
 
为更有效率地解决发生频繁、对业务产生影响的突发事件,服务台将该类问题进行归并,转入问题管理流程处理。问题管理包括问题控制和错误控制两部分。问题控制部分要找到造成问题的根本原因,错误控制部分要找到解决问题的彻底的解决方案。对突发事件中以变通方式解决的问题记录,问题管理流程首先对其进行识别并根据优先级分类,通过调查和诊断找出导致问题发生的根本原因,并对错误原因进行评估,初步提出解决方法,对需要修改配置管理信息的,形成变更需求报告,提交给变更管理流程。此外,问题管理流程还可以通过趋势分析、提供预防措施和事后回顾等实施主动问题管理。
 
为了使突发事件和问题得到更有效的解决,需要配置管理信息的支持。配置管理为其他流程提供IT架构的相关信息,包括相关软硬件各个配置项的详细信息及其相互关系,并收集和管理有关文档。配置管理拥有一个重要的配置管理数据库,这是一个关系型数据库,记录所有相关信息。服务支持和服务交付中的很多管理流程都依赖于配置管理数据库中提供的数据。
 
变更管理流程的目标是确定所需要的变更,并确定这些变更如何在最小的范围内得到实施。变更的结果是要修改配置管理数据库中的配置项。变更请求报告可以来自突发事件管理、问题管理、服务等级管理、可用性管理、能力管理及客户等。对于所有的变更请求报告,变更管理者(即变更经理)首先要进行过滤,并根据优先级判断需要尽快处理的变更请求,对紧急的影响范围大的变更请求可以通过紧急变更手续处理。变更经理将变更请求报告交由变更咨询委员会(由可以向变更管理小组提供专家意见的人员组成)审核,根据变更咨询委员会批准的变更请求,由变更实施小组制定变更计划并予以构建和测试。变更经理协调变更实施及评估,并制定相应的回退计划,修改配置管理数据库,完成变更。
 
发布管理与配置管理、变更管理密切相关。变更实施结果通常以发布管理形式执行。发布管理将配置项目经过测试后引入处于活动状态的使用环境,即生产环境中。发布管理的目标是确保发布信息被成功公布,确保只有经过测试和正确授权的软硬件版本才能提供给IT运行环境。发布管理的实施步骤一般包括发布策略、发布计划的制定,发布设计及构建配置、测试、发布承诺、推广计划、准备与培训以及最后的发行和安装,形成最终软件库和最终硬件库,修改配置管理数据库,完成发布管理。
 
2.服务交付的管理流程
 
服务交付的管理流程,更多地体现了ITIL在战术层面的部署。
 
服务交付中较为基础的是服务级别管理。服务级别管理是界定IT服务提供者与业务客户之间有关IT服务的协议,基于客户需求建立服务,目的是提高用户满意度。服务级别管理通过服务级别协议定义面向客户的服务条款,通过运行级别协议保证IT服务组织之间的协调工作关系,通过支持合同确保客户和第三方供应商之间的技术支持。服务级别管理力争将所有对用户的服务质量的影响减到最小。服务级别管理是服务支持和服务交付的关键。
 
财务管理负责对成本及IT服务投资回报的会计核算。财务管理与能力管理、配置管理和服务级别管理等密切相关。
 
能力管理是确保IT服务具有足够的可用能力,以满足业务需求,包括业务需求能力管理、服务能力管理和资源能力管理。能力管理是优化成本,强调用计划确保所签订的服务级别是可以被履行和扩展的。
 
持续性管理是面向IT服务遇到灾难恢复时的应急措施和计划,包括业务持续性管理和IT服务持续性管理。有效的IT服务持续性管理需要一个平衡的风险措施,例如远程容灾系统和备份恢复措施等,配置管理流程中的数据被用来辅助对风险的预防。
 
可用性管理是确保资源、方法和技术得以适当拓展的流程管理,以支持与客户签订的IT服务级别协议。可用性管理为服务级别管理提供支持,最大程度地减少意外突发事件的数量。可用性管理包括关键业务功能、安全性、可靠性、容错性、可维护性和服务可用性等管理内容。
 
总之,通过ITIL实施IT服务管理,可以将IT服务与业务需求更好地予以整合,在提高IT部门服务质量的同时也降低了运作成本。


二、ITIL的核心理念及其意义
 
ITIL的核心理念是减低系统对特定人员的依赖。这一观点可以从ITIL与CMM体系的比较中得到验证。
 
CMM(Capability Maturity Model,能力成熟度模型)是软件开发产业中被广泛接受的工作流程体系。CMM在软件产业中的作用类似于ITIL在IT服务产业中试图追求的地位。与ITIL类似,CMM的产生也是为了满足目标软件系统日趋复杂、工作协调愈加困难的特定需求的,使高度依赖于程序员个人才智的软件开发工作成为受控于工作流程的标准化开发过程。具体来说,CMM体系的目标是使软件开发工作具有可重复性,实现流程标准化、监控可量化以及系统的持续优化。
 
ITIL与CMM的共性就是它们与传统产业最大的不同。传统产业以机器生产为主导,人力只起到补充的作用。而新兴的IT软件产业,人员自身的创造力成为主导,产业的产出率对人员具有天生的高度依赖性。在以往的软件产业和IT服务产业中,关键岗位的技术专家对整个体系的效用具有不可替代的作用。这些人员一旦中途离岗,不论是软件项目还是系统维护都有可能发生致命的中断。因此,在IT服务和软件产业中如何做到既最大限度地激发每个员工的创造能动性,同时又尽可能地减少系统对任意个体的依赖性,就成了看似难以两全的矛盾。
 
CMM的实施,使软件开发成为“工程化”的工作。一个达到CMM3级水平(最高为5级)的软件公司,其项目管理按照预先的定义分阶段进行,各阶段都保留有完备的记录。其理想状态可以达到各阶段人员如果全部更替,也完全不会影响项目的进展。
 
ITIL也试图在IT服务领域中达到这样一种效果。通过对配置管理数据库的严格控制管理,系统中任何一点的变化都成为配置管理库中的一条记录,可以为全体人员共享。从服务台的单点接入到变更控制,再到配置管理,其精髓就是对一切技术人员的思维创新及行为的跟踪、控制与记录。ITIL试图转变的就是原来服务体系中“谁看到了谁才知道”的知识分裂体系,努力构建一个“一人拥有,全体皆知”的高效率体系,消除过程对个人的依赖,实现IT服务的“工程化”。
 
由此可见,CMM的实质是将“思维天马行空的软件工程师”变成“受控运作的软件开发机器”中的一个“可替换部件”。ITIL的目标也是将“高度自由的IT服务专家”变成“受控运作的IT服务机器”中的一个“执行机构”。最大程度地减低系统对特定人员的依赖,是二者共同的核心理念。
 
尽管CMM和ITIL对目标系统有一些负面的影响,比如,在摆脱对个人依赖的同时也损害了个人部分创造性的发挥,详尽的文档记录是以牺牲部分短期工作效率为代价的等,但二者对IT服务及软件产业的整体具有重要意义。CMM使大规模的软件开发成为可能,ITIL使IT服务标准的一致性和可靠性得到保障。正是由于引入了ITIL的理念,才使得随意性很强的IT服务具备了“服务级别”和“级别质量保障”的概念,使软性服务有了硬性的衡量标准。ITIL使以往只在电信服务中才有的“服务质量(QoS,Quality of Service)”的概念向更广泛的IT服务领域延伸。ITIL减低了人员的随意性,提高了工作的统一性,使服务行业形成标准。

 

三、ITIL的现状及问题
 
ITIL最早发源于欧洲,在中国起步较晚,国内实施ITIL的企业并不多。近年来,在欧洲、澳洲和北美非常流行的ITIL资格认证考试在亚洲也悄然兴起。目前,世界上有两大机构有权提供ITIL认证考试并颁发证书,即国际信息科学考试学会(EXIN,EXamination INstitute for information science)和信息系统考试委员会(ISEB,Information Systems Examination Board)。这两大独立机构使用同样试卷,具有同等权威。国际认可的ITIL证书共有3种:基础认证(Foundation Certificate)、从业人员认证(Practitioner's Certificate)和经理认证(Manager's Certificate in IT Service Management)。迄今为止,全球已有7万多人获得ITIL资格认证,且每年新增7千多名。我国取得ITIL基础认证的不到100人,取得ITIL经理认证的不到10名。
 
ITIL提供了IT部门如何实施其运作方式的一套框架指南,涉及流程、功能定义及组织机构等。ITIL本身并非是从市场上一次性购买后能立即投入使用的具体产品。当前也没有类似ISO 9000的正规手段来论证企业的流程是否符合ITIL标准。目前只是对实施ITIL的技术人员有相关的ITIL论证。
 
和CMM体系相比较,ITIL在推广的层次上还较为单薄。由于CMM是面向软件机构的评测标准,它的评审对象主要是企业和单位。获得CMM认证的软件公司被认为具备了相应的开发管理实力,可以在争取项目的时候获得一定的优势。因而CMM被业界广泛应用,并作为招标资质的评议标准。相比之下,ITIL还处于偏重理论指导的层面。其资格考试也仅限于个人。对于采用ITIL的组织机构并没有实践性的考核评级。这对检验企业应用ITIL的效果来说,就缺少了一套科学、完整、客观的评判标准。另外,由于面向企业的评级缺失,使得业界未能以ITIL作为资格审核的事实标准。


四、ITIL实施中的误区
 
在ITIL的推行实践中,企业会遇到各种阻碍,其中最大的阻碍应是人们(包括IT服务人员、用户和管理层)观念的转换。新服务体系的推行,其难度不亚于一次企业文化变革。ITIL实施中最有可能发生的认识误区主要表现在以下几点:
 
1. ITIL的推行是IT服务部门的事,应该由IT部门独立承担
 
ITIL的推行,并非简单的IT部门服务方式的转变,而是企业内部的一次观念变革,是以客户为中心的服务思想替代以职能为本位的工作理念。这种观念的变革,如果得不到管理层的全力支持和全体用户的积极配合,单靠IT服务部门进行流程上的改进,即使能够勉强启动,也不可能长期持续下去。比如,如果单位领导使用某系统时遇到了问题,不是通过服务台进行单点联系,而是直接找到IT部门的主管或专家;如果ITIL为了保证专业人员利用率而推荐设立的分级支持体系,不能被广大用户接受,大家还是按照以往的习惯直接联系二线或三线自己熟知的专家,那么ITIL的跟踪、记录和控制体系及ITIL的事件管理都会形同虚设。
 
2.变更咨询委员会可有可无,IT部门有能力在合适的时机进行变更;制定回退方案浪费时间,万一变更出了问题,我们有能力解决
 
事实上,由盲目乐观而导致故障的可能性是相当大的。有统计表明,80%的关键业务应用的故障是由人员或流程失误引起的。因此,谨慎和有备的变更是保护系统正常运行所必需的。
 
3.我们拥有最好的技术和设备,足够支持业务的需求,因此不需要能力管理,节约下来的费用可以添置一台新设备
 
目前,公司花费巨额资金购置的设备常年处于低负荷运转状态的情况并不少见。有关统计报告表明,仅1998~2000年,开设网站的各公司超出实际需求购买Java应用服务器浪费的资金就超过了10亿美元。通过能力管理流程,公司可以节省大量不必要的花费。
 
4.我们的宕机时间很少,没有人抱怨过我们,所以不需要可用性管理
 
随着信息化进程的加快,客户的要求也在发生变化,他们对系统可用性的要求会变得更高。在某些商业领域,可用性的目标已经被制定为24×365。越早制定可用性管理的方案就能越早地掌握IT服务的主动权。
 
5.我们已经最佳地利用了现有资源,财务管理没有必要了
 
如果没有财务管理,怎么得知资源已经实现最佳利用了呢?财务管理的意义之一,就是检查配置资源的合理利用率,实现最高的投资回报。此外,在IT服务外包的承接项目中,财务管理也是必不可少的。
 
6.我们这里不会有灾难发生,持续性管理意义不大
 
其实,灾难离我们并不遥远。远有美国“911”恐怖袭击事件,近有上海2号线地铁施工时发生渗水,危及某重要部门机房。意外随时有可能发生。有研究指出,在遭受意外灾难的企业当中,有2/5会在5年内倒闭。业务的持续性计划和灾难恢复计划是企业持续生存的必要保障之一。


五、实施ITIL的几点建议
 
企业要想成功推行ITIL体系,首先要取得领导层的高度重视和全力支持,以及全体用户的理解和配合。一个成功的服务管理项目必须同时考虑和协调3个层面的问题,即企业组织机构、技术和流程。企业组织机构包括管理层、人员、角色、地域、企业文化等;技术层面指技术架构、项目管理及具体实施的产品等;流程方面是指ITIL所涉及的领域。对其中任何一个方面的忽视,都将可能导致项目失败。
 
推行ITIL的工作流程时,至少要做到以下4点:
 
1.了解ITIL体系,领会ITIL的指导思想,培养ITIL人才
 
ITIL不是一种产品,而是一套流程和准则,必须对它有充分的了解,才可能成功实施。IT部门需要通过培训、招聘吸纳新的技术力量。除了流程,相关的IT产品技术等可能还需要技术专家的帮助,但企业必须直接介入相关技术实施阶段,不能完全交给外部资源负责。实施ITIL流程项目规划时,必须清晰地定义出项目的目标,如果没有从本身的实际情况出发,一哄而上的项目是极有可能失败的。
 
2.引进严格的项目管理制度
 
必须组建专门的项目小组,确定正规的项目内容,并建立控制、跟踪、分析等机制。同时还要确保必需的人力、物力资源的供应。项目启动前,还要全面、完整地了解目前的IT服务现状。当前状况是整个项目的基点,对当前状况进行分析,可以确定什么需要变更?需要增加什么新功能?哪些功能无需变化?项目正式启动前,还必须进行可行性评估、检查、审计等。
 
3.建立科学合理的流程
 
ITIL实践过程中,流程是最重要的。ITIL服务流程项目是一个较长的实施过程,根据企业规模和项目范围,一般从6个月到18个月不等。
 
4.选择适当的软件产品
 
企业对IT系统的管理是通过IT管理软件实现的,因此,选择适当的软件对成功实现ITIL的目标至关重要。在规模较小的企业里,由IT部门自身开发用于记录、跟踪事件之类的工具就可以了。对于规模很大的企业,则需要分布式、集成的服务管理工具,对各个被监控系统产生的大量事件进行实时分析处理和及时响应。通过自动化工具,可以实现核心服务管理功能的自动化


标签: ITIL探讨分析了解管理建议业界

作者:良玉 分类:ITIL 浏览:633 评论:0
留言列表
发表评论
来宾的头像