三峡总公司IT运维之四招

来源:百度文库 编辑:神马文学网 时间:2024/04/27 14:39:29
作者单位:中国长江三峡工程开发总公司信息中心

  传统被动的、孤立的、分散的“救火队”式IT运维管理模式,已经让IT部门疲惫不堪。如何简化IT管理,更好地满足业务需求,已经成为IT部门的一个重大挑战。

  为了有效地解决行业用户在IT运维管理方面的困惑,并推介ITIL在IT运维管理中的价值和意义,我刊策划了“IT运维诊断面对面系列活动”,活动特别邀请IBM、HP、CA、BMC等IT服务厂商的资深运营管理专家,深入了解行业用户的IT运维管理现状,切实为用户解疑答惑,并共同探讨IT运维管理方法和经验。

  本期由中国长江三峡工程开发总公司信息中心介绍了其IT运维现状,并邀请了冠群电脑(中国)有限公司技术经理侯继涛进行了点评。

  您有IT运维方面的困惑吗?您想与专家面对面交流吗?您想发表看法吗?请与我们联系,我们期待您的参与和支持。

  中国长江三峡工程开发总公司(简称“三峡总公司”)于1993年9月27日正式成立,是三峡工程的项目法人,全面负责三峡工程建设的组织实施和所需资金的筹集、使用、偿还以及工程建成后的经营管理。在三峡工程建设管理的同时,三峡总公司利用经济实力和技术能力继续开发长江上游干支流的水力资源,已经启动或计划启动建设溪洛渡、向家坝、乌东德、白鹤滩等四个梯级电站。

  统一的IT建设规划是三峡总公司良好IT运维管理的基础。在IT运维的人员组织结构、管理流程上,三峡总公司将项目管理的理念引入到IT运维管理中,充分利用了IT外包方式和先进的IT管理工具。

  三峡总公司的信息平台建设是伴随着总公司的业务管理需求而不断发展起来的。在三峡工程开工伊始,三峡总公司就充分认识到信息化对提高公司整体运营效率和核心竞争力的重要作用,不遗余力地投入企业信息化建设,经过10年努力,打下了较好的信息化基础。

  系统和网络平台始建成于1993年。经过不断发展,目前拥有各类服务器设备40多台套、网络设备近百台套。企业网连接总公司本部、各级子公司、各工程项目部以及与工程相关的各设计、监理、施工单位。网络覆盖面包括宜昌市、三峡坝区、云南溪洛渡施工地、四川向家坝施工地、成都办公地、北京办公地等地域。网络连接方式多样,既有千兆以太网连接,也有广域专线连接,并通过VPN实现了移动用户的远程办公。

  目前主要的应用系统包括在工程项目管理领域应用的工程管理信息系统(TGPMS)、财务管理信息系统、人力资源管理系统、基于Lotus Notes平台的总公司办公自动化系统、三峡电厂生产管理信息系统IFS/ePMS以及集团网上资金支付系统等。此外,一些下属部门与单位还结合自身行业特点,自建了一些小规模的应用系统、部门级网站,它们满足了特定时期管理工作的需要。

  第一招 统一规划是基础

  三峡总公司信息中心作为IT建设管理的职能部门,目前拥有员工19名。按照IT建设、运维管理的需要,信息中心内部划分为规划、工程管理应用、集团管理应用、软件开发支持、系统平台、综合管理等专业机构,分别对应于各专业应用系统的应用支持、软件功能的修改完善、系统平台的运维、普通用户的支持响应等工作。

  三峡总公司IT运维管理的首要目标是保证各专业应用系统和各IT应用的正常、可靠、高速运行,保证对突发事件、需求变更、技术支持需求进行快速响应,保证所有IT资产信息的完整,并能做到可靠跟踪。

  统一的IT建设规划是良好IT运维管理的基础。在IT系统建设初期,统一进行IT规划、IT建设、统一技术标准、统一资源利用,可以避免形成信息孤岛、减少重复建设、盲目建设;统一的IT系统建设构架,可以为以后IT运维管理的技术实现、组织管理、流程管理打下良好基础。

  三峡总公司在信息系统建设和运维管理过程中一直坚持以统一规划、统一投资、统一建设、统一管理为原则。

  比如,三峡总公司网络基础平台规划主要以主干网的规划、业务网络规划、业务拓展后的对策、接入规划、IP分配与管理等五个方面为重点。网络建成后,网络管理主要采用集中化管理方式,重要的网络设备管理、远程维护都由总公司信息中心的技术人员来实现;同时,由于全面实现了数据大集中,因此,三峡总公司采用区域数据中心的方式对主要服务器系统、数据库系统、存储设备进行管理,各分支单位不再单独设置机房和技术管理人员。

  由于下属各建设部、各子公司之间地域跨度较大,为实现跨地域接入的统一管理和监控,三峡总公司在不同地域设立了接入中心。

  第二招 引入项目管理理念

  三峡总公司的IT运维管理存在着点多、面广的特点,仅仅靠传统的某一处室、某一技术人员根本不能满足管理的要求,因此,三峡总公司在IT运维的人员组织结构、管理流程上做了一些探索,将项目管理的理念引入到IT运维管理中。

  每一个项目都有其生命周期,对于部分阶段性的IT运维工作来说,它们同样也有其运作流程。对于突发事件、需求变更、技术支持等IT运维工作,我们在实际工作中将其划分为项目启动、项目计划、、项目实施、项目控制、项目收尾等阶段。

  项目启动对应于收到故障报告、需求申请环节;项目计划实际上就是突发事件应急预案的获取、技术实施方案的准备、人员组织的安排等;项目实施就是对突发事件的处理、需求变更的实现、技术支持工作的完成等;项目控制主要是对工作进行跟踪反馈、及时调整资源,保证工作顺利进行;项目收尾主要是工作汇报、技术总结、工单系统的填写等。

  同时,IT运维的人员管理结构也采用矩阵式管理的方式,实现灵活管理、充分利用资源。

以如何处理用户反映业务系统数据查询缓慢为例,三峡总公司的IT运维流程如下:首先业务系统支持人员会收到故障报告,经核实后,将故障报告转软件开发人员检查软件代码;若软件开发人员通过检查发现整个数据库系统均运行较慢,将会把故障报告转数据库管理员、主机系统管理员,分别对数据库和操作系统进行性能分析,排除故障;最后填写工单系统,工作结束。

  采用项目管理的方式来管理IT运维流程,采用矩阵式管理进行资源调配,使运维工作思路更加清晰,责权更加明确,避免了各自为政的情况。

  第三招 充分利用IT外包方式

  三峡总公司的IT运维管理充分利用了IT外包方式,因为三峡总公司的IT运维管理存在着业务系统多、人员少、服务对象多的现状,完全靠信息中心的技术人员,根本无法满足三峡总公司IT运维的要求。

  三峡总公司的外包思路是对部分IT运维工作进行有限外包,针对不同情况采用不同程度的外包形式。对于一些重要的服务器设备、数据库系统,部分IT运维工作以合同形式委托给有实力的专业化IT公司,日常的运维工作以信息中心的技术人员为主,由外包公司提供技术指导。外包公司会定期进行系统巡检,接到故障报告后及时提供现场服务。对于普通用户的技术支持服务、软件维护的代码实现等基础性工作,主要采取的是以合同形式利用外包公司技术人员的方式,更强调的是对技术人员的外包使用。这样,可以将信息中心的技术人员从一些基础性工作中解放出来,更加关注系统运维方案的优化、高端IT系统的运维等工作。

  第四招 IT管理工具不可少

  三峡总公司IT运维管理充分利用了IT管理工具。IT运维管理的最终目标是以IT系统为工具,促进企业的管理、提高企业的竞争力。利用先进的IT管理工具,也会对IT运维管理工作起到很大推动作用。

  三峡总公司信息中心利用工单系统对运维工作进行跟踪,通过软件工具固化运维流程,取得了比较好的效果。利用配置管理工具(如Neuma+、CCC/Harvest、CVS、Microsoft SourceSafe),实现了对软件代码维护过程的各种文档的版本控制。利用三峡工程管理信息系统的固定资产管理模块,对公司内的IT设备进行跟踪管理,员工的计算机配置情况、资产的使用情况、变更情况等内容,通过该系统也能及时得到了解。

  经验及改进思路

  三峡总公司的IT运维管理体系是在实践中不断摸索和总结中形成的,还需要在今后的工作中不断完善和改进,我们打算从以下几方面开展工作:

  1、 继续贯彻IT系统的统一规划、统一建设、统一管理思路。以往的运维管理实践表明,在IT系统初期,缺乏完整的系统框架设计、技术标准,将为IT运维工作带来很大的技术困难。如果不形成统一的IT系统运维组织结构,也会带来许多沟通障碍、降低运维工作的效率。

  2、 引入先进的IT运维理论和IT运维管理工具。例如,对现在比较流行的ITIL理论进行学习消化,将它应用到本企业的IT运维管理实践中;选用适当的系统监控软件,将以前的事后应急处理变为对系统事件的提前监控。

  3、 优化运维管理流程,加大对重大系统故障的应急预案编制力度,强化对运维工作的技术总结,提高运维工作的处理能力和效率。

  4、 加强培训力度。提高普通员工的计算机应用水平和对专业系统的业务使用技能,实行持证上岗和部门的IT应用的年终考核制度;加强信息中心技术人员的专业技能培训,多学习新的IT技术;提高技术人员的实际处理问题能力,有条件的情况下通过实验环境、培训环境进行IT运维模拟实践。

  对 话

  冠群电脑(中国)有限公司技术经理 侯继涛

  记者:您认为三峡总公司的IT运维有哪些可借鉴的经验,针对其改进思路,您有哪些好的建议?

  侯继涛:三峡总公司信息中心的IT建设历程和IT运维工作的开展非常具有代表意义,尽管存在着支撑力量有限、需求繁杂、地域范围广等客观困难,三峡总公司信息中心探索出了符合中国特色和自身企业特点的IT建设和运维之路,有以下特别值得学习和借鉴的地方:

  ◆ 统一规划、统一建设、统一管理思路的IT建设和运维。这一点给我的印象非常深刻。因为大多数企业当前所面临的IT运维难题,不是缺乏管理工具,也不是缺乏人手,而是面临着一个繁杂的、难以管理的、相互割裂和孤立的系统。如果都能够像三峡总公司信息中心这样,在系统建设之初,就考虑到运维管理,运维管理就已经成功了一大半。

  ◆ 将项目管理的一些指导思想引入到IT管理中,重点考核支持的闭环流程、强调流程中人员的不同责任、引入矩阵式的管理组织架构等。虽然项目和运维是不同的,如项目的概念强调开始、结束,有独特性和临时性的概念;而运维强调在重复的执行过程中的持续提高,但在不混淆这些基本概念的基础上,借助项目管理的一些概念,强调运维中的过程、责任,对IT运维管理来说,也是有一定道理的。

  ◆ 充分利用外包。目前国内很多企业的IT部门都面临着人手少、低层次重复性工作多等问题,支持人员的精力都被牵扯在例如桌面机管理、病毒管理等低层次的工作中,无法腾出精力来从事高层次工作。利用外包,无疑是非常好的一个途径,来解决这些问题。三峡总公司信息中心的经验也说明了这一点。

  伴随着信息化的不断完善,IT系统本身的运维工作也需要不断地进行提高和改善。笔者认为,三峡总公司信息中心可以从以下几个方面入手,进一步提高运维管理水平:

◆ 强调运维流程的持续提高。目前三峡总公司信息中心借助“项目”的概念来强调运维管理的管理流程,其优点在上面已经提及,但是由于运维工作和项目管理本身天生的不同特点,这种思路也存在着一些缺点,如可能存在着只重目标,不重考核;强调特殊性,不重视重复流程的规范和形成等问题。借助ITIL的概念,可以帮助三峡总公司信息中心制订规范化的管理流程,并考虑这些流程的考核和持续提高,可以更好地改进目前的服务支持流程。

  ◆ 采用结构化的方式构建管理系统。IT管理工具的建设本身,和IT系统建设类似,也需要一个系统化、规范化的建设过程,需要考虑IT资源管理系统、网络管理系统、告警管理平台和服务管理平台等诸多系统的有机整合,才能使得管理系统能够发挥更大的管理价值。尤其是由于资金有限和管理需求的不断呈现,只有在统一规划的基础上逐步建设,才能够达到一个理想的管理效果。

  ◆ 在完善日常IT服务支持的基础上考虑IT服务交付管理的内容。仔细翻阅ITIL的管理框架,可以看出,服务交付管理占据着非常重要的战略地位。借助服务交付管理的流程建设,可以明确IT部门与业务部门的合作关系,提升IT部门的战略决策地位,在有限的投资和IT系统的容量、可用性、可持续性之间取得平衡。三峡总公司信息中心可通过接受培训的方式理解ITIL本部分的内容,并通过与三峡总公司的信息化建设相结合,来逐步建设、完善这些管理流程。

  在动态环境中,不确定性是常规而不是例外,这就要非常重视适应能力。

  —(美)亨利·艾伯斯

  所谓效率,说来也非常简单,就是抛弃笨拙的方法,用我们已知的最好方法去工作。

  —(美)亨利·福特一世

  忙碌和紧张,能带来高昂的工作情绪;只有全神贯注时,工作才能产生高效率。

  —(日)松下幸之助

  生意要一笔一笔地做,面对面地做,推心置腹地做。

  —(美)乔·杰拉尔德

  在竞争对手打败你之前打败他。我们必须了解将要发生什么,并且知道怎样阻止不利的情况发生。

  —摩托罗拉CEO埃德-桑德尔

  没有人能改变昨天发生的事。当一扇门关上时,另一扇门就打开了。越过打开的门,往往能找到更好的机会。

  —(美)理查 J. 费尔兹