医院IT运维服务建设包含运维服务制度、流程、组织、队伍、技术和对象等方面的内容,建设过程是一个循序渐进的过程,同时结合医院的临床特色,整合运维服务资源,规范运维行为,确保服务质量,形成统一管理、 集约高效的一体化运维体系,从而保障医院网络和应用系统安全、稳定、高效、持续运行。
建立IT运维团队
(一)运维团队
建立IT运维团队是实现IT运维管理的重要保障,运维团队由管理人员、一线运维工程师,二线支持工程师组成的服务运维团队,下面内容主要以外包运维团队为例。
(二)角色与职责
1. 项目经理
(1)负责运维工作现场协调和管理,调配公司方运维资源,运维质量控制和管理,涉及用户重点运维需求的督办和管理,按用户实际要求实现运维服务工作的完整性和有效性。
(2)对驻场服务人员和工程师的管理和检查日常服务工作情况。
(3)负责对用户提出的要求和意见进行改进,并做好相关的服务报告和汇报工作。
(4)及时完成用户交办的重要服务工作。
(5)协调和检查各项服务工作的进展情况,并与后台二线支持技术人员做好调配和工作督办。
2. 服务台人员
(1)负责统一接障平台电话或网络接障,故障受理和任务单派发,故障处理督办、回复和解释,故障数据统计和运维月报编写、运维资产备件管理和耗材等备件发放、登记。
(2)负责统一信息系统软、硬件接障、录入和统计工作。
(3)负责做好故障初步判断和解决,同时负责对移交给硬件或软件工程师处理的故障督办和跟进,及时做好用户、设备和软件开发公司的协调工作。
3. 硬件工程师
(1)负责计算机终端和系统维护、日常一般信息化设备巡检与保养,协助进行资产管理和计算机配件采购,维护内容包括:计算机终端用户数据备份与恢复、计算机网络访问维护、病毒防治、计算机使用培训。
(2)负责解决信息化设备(包括服务器、计算机终端、打印机等)、终端操作系统的日常巡检、维护和保养工作。
(3)负责对新旧设备的安装、报废和回收工作。
4. 软件维护工程师
(1)负责业务应用系统数据维护、软件变更和变更开发后的测试工作,以及对运维的应用软件日常故障检查和故障预警,保障应用软件运行稳定。
(2)协助查找接受运维的应用软件运行缺陷,对运维系统实现规范的软件代码管理、文档管理和知识库管理,并负责做好日常用户业务软件使用培训等。
(3)负责对主要临床应用系统、各类辅助应用系统进行维护,并按用户实际需求和业务发展,做好新增模块的开发(开发费用另外计费)。
(4)为保障系统长期有效运行,对业务应用软件提出改进和优化意见。
5. 二线应急服务工程师
(1)负责运行维护服务的标准、规范和技术支持;对用户提出维护服务的改善和投诉进行处理,响应用户要求紧急办理的其他维护服务工作。
(2)对重大技术问题进行现场判定和维护,并负责解决。
(3)负责运维管理优化咨询服务,提供运维管理体系建设目标和计划,并付诸实施。
(4)制订运维服务规范和完善运维体系;监督运维服务过程和质量控制;结合运维管理软件,提升实际运维服务工作效率。
(5)负责相关运维管理和知识培训工作。
(三)建立运维服务管理制度
常言道,“三分技术,七分管理”。健全、完善的IT运维服务管理制度是医院信息化系统建设的保障。运维服务管理制度的制订有利于保证IT基础设施和IT业务系统安全、稳定、可靠地运行,明确所有IT运维人员的岗位职责,规范系统操作,提高信息化系统的可靠性和维护管理水平。
科学、规范的运维服务管理制度的大体上包括:
1. 保密制度 通过规范明确安全保密要求,保障基础网络和网络安全,维护医院的利益和病人的合法利益。
2. 维护作业计划管理制度 通过规范IT维护作业计划管理制度,根据维护规程操作,减少维护操作风险,保证运维管理水平。
3. 外包管理制度 规范外包管理,强化外包流程管理,提高外包服务交付能力。
4. 网络安全管理制度 规范网络准入制度,提高网络安全防范意识。
5. 巡检管理制度 规范例行巡检制度,发现IT信息化系统隐患和潜在问题,及时解决问题。
6. 设备管理制度 规范IT设备管理活动,提高设备管理水平,保证设备安全稳定运行。
7. 维护人员管理制度 加强维护人员管理,提高维护人员素质,造就优秀的维护人才,提高运维维护技能的水平。
8. 运维考核制度 对运维全过程进行严格控制和监督,贯彻运维管理思想,促使运维工作制度化、规范化和科学化。
9. 服务流程管理制度 制订人员值班、服务管理、事件管理、问题管理、变更管理等服务流程管理制度,规范流程管理,确保IT运维服务有序进行。
10. IT资产管理制度 对硬件设备维修保养和备件库进行有效的固定资产管理,提高资产利用率,使其更好地发挥作用。建立有效的IT设备综合数据库,记录IT资产的需求、配置、调换、分级以及最终报废的历史情况,提供IT资产的生命周期管理,为成本管理提供完整的IT资产数据。
11. 培训制度 定期对所有参与服务的技术人员组织安全操作知识与IT运维流程进行培训,通过培训全面提升运维管理人员技术水平与安全操作意识。
建立IT运维服务流程
为保证整个运维管理部门有序地、高效地处理各种IT运维事物,需要建立一个以ISO20000标准为指导,包括服务台管理、事件管理、问题管理、变更管理、发布管理、配置管理、服务级别管理等的流程管理,由于每一个医院的IT信息化程度和IT规模不同,所以部署的服务流程也不尽相同。每一个组织根据自已的情况选择部署流程管理,提高IT运维服务的管理水平。常用流程管理主要包括:
1. 服务台管理流程 服务台作为事件管理的有效实现手段,服务台是一种基于日志管理来记录事件并为业务(内部或外部)。提供日常支持的服务平台;同时,它通过对流程,文档和岗位责任制的管理协调,来达到尽快解决事件的目的。
服务台主要用于处理出现在IT基础架构中或由用户报告的事件来尽快恢复服务的可用性,同时,服务台也是管理和维系客户、用户与服务提供者之间关联的主要接口。在服务台的构成上主要分为两个部分进行考虑:服务台管理和热线支持。
(1)服务台管理部分:包括服务台经理和其他的协助管理人员,主要从事服务台相关的管理活动,工作范围包括服务目录的维护、服务级别的监控和维护、业务机会的发现、服务台人力资源的监控和调配、日常工作规范/制度的监控、改进和完善、服务台人员绩效考核以及管理信息的收集、整理和统计等。
(2)热线支持部分:主要由热线支持坐席构成,随着业务的扩展,相应的热线支持人员和服务支持领域也会不断拓展,这时可以考虑根据业务范围和类型划分更细的工作组。坐席根据客户类型可以划分为VIP客户和普通客户,如果是VIP客户则可以直接拨打VIP坐席或者通过普通坐席转至VIP坐席。
2. 事件管理流程 事件管理流程是负责解决IT服务的突发事件、问题和客户请求等的运维流程,值班坐席人员对服务请求事件进行初步的调研和处理,并跟踪事件的解决情况,以便用户了解事件解决进展情况。
事件管理流程着重于在医院快速解决IT环境中的事件,并降低其对业务的影响度。主要活动包括记录事件、分派事件、解决问题和结束事件等,其流程内容如下:
(1)检测和记录:事件通过系统管理软件检测出来或用户打电话进来,所有事件记录进系统中。
(2)判断并分派:确定是事件,咨询还是投诉。如果是事件,进行事件的影响、收集信息等,尝试解决问题。
(3)判断是否已解决:确定问题是否已解决,如解决,由服务台确认;如未解决,继续诊断,必要时由二线支持,三线(厂商和集成商、服务商等)进行支持解决等。
(4)调查和诊断:二线支持和三线(厂商和集成商、服务商等)支持人员利用自身技能和相关工具,力图在规定的时间内提出解决方案,尝试解决事件。
(5)服务台确认:对事件的解决方案进行确认。
(6)结束:如果确认已解决,关闭记录。
3. 问题管理流程 问题管理流程的根本目的是消除或减少事件的发生,此流程分析发生在生产环境的事件,确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求、替代方法或建议的预防性措施来防止事件的再次发生。而且问题管理流程可能需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。
问题管理流程主要活动包括分析事件、找出问题、分派问题、确定根本原因以及找出解决方案,以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下:
(1)分析事件:定期分析事件,找出潜在问题
(2)生成问题记录:在系统中生成问题记录并把所有相关事件与此记录关联起来,重大或紧急事件处理完后定义为问题,技术支持专家在日常运维中发现的问题,主动性防范。
(3)分派问题:根据问题内容将问题记录分派给适当的技术小组。
(4)根本原因分析:被分派的小组人员将调查问题以期找出其原因,制订解决方案、替代方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。
(5)更新已知错误:问题记录必须被更新以反映它是已知错误状态,并且把任何替代方法、避免或最小化负面影响的动作行为也记录下来(根据需要添加到知识库中)。
(6)提出变更请求:对问题的解决方案进行评估,通过提出变更请求(RFC)以对该方案进行测试和实施。如果RFC没有被批准,问题记录保持为已知错误,它们可以被事件支持人员在事件再次发生时参考借鉴。
(7)关闭:一旦找出问题根本原因,并实施了解决方案,确认已解决了问题,问题记录可以关闭。
4. 发布管理流程 发布管理通过实施正规的工作程序和严格的监控,保护现有的IT运营环境和IT服务不受冲击。有效的发布管理流程应与变更控制管理流程在工作上进行密切的配合。发布管理应对待发布的变更有全面的理解,包括变更的动因、影响、范围等,以确保发布的所有技术和非技术方面都能得到整体性的考虑。发布管理负责变更实施的规划、构建、测试以及最终的上线,并保证配置管理数据库得到实时的同步更新,发布管理的主要活动包括:
(1)发布计划:每一个发布必须提供具体的发布计划,定义目标和范围,阶段和时间表,发布计划必须与相关业务部门、支持人员进行商讨,并获得签字确认。
(2)测试:发布在进入生产环境之前都必须经过测试。测试环境必须独立于正式环境,且与正式环境保持一致,同时确保测试环境的安全。
(3)分发与安装:在包括安装、操作、打包和交付在内的整个分发和安装过程中,都必须保持发布内容的完整性和准确性。
(4)验收与发布报告:发布结束后,需要对发布的成功与否进行验收确认。
5. 变更管理流程 变更流程是IT运维的一个核心流程,规范变更流程可以降低因变更给IT信息化系统带来的风险。定义变更审批的管理流程,及部署变更操作流程,实行“谁审批谁负责”,只有经过审批的变更才允许执行,并按照规程部署实施变更。
变更管理是起始于变更请求,终于变更经审批后得到成功实施的完整流程。该流程通过标准方法和流程来有效处理所有对于IT生产环境、配置管理库中配置项的变更,从而达到将变更所带来对IT服务质量的负面影响最小化和提高日常运维效率的目标,其主要内容如下:
(1)发起与分类:变更管理过程的起点,包括收集变更请求的必备信息,并分辨变更类型,创建RFC。
(2)评估与构建:从IT和业务的角度来评估和检查变更请求,确保实施变更时,既能满足业务的要求,同时确保对服务造成的影响最小:同时还应完成变更的测试,准备回退计划,以及任务的安排和指派。
(3)审批:由变更经理和变更管理委员会对变更进行实施前审批。审批内容包括变更影响、计划、实施人、变更失败后的回退计划。
(4)实施管理:在生产环境中实施,如果实施不成功,必须按照回退方案恢复到原来状态。
(5)回顾与关闭:确定变更执行的结果,以及总结改进过程,同时关闭变更。
6. 配置管理流程 配置管理是描述,跟踪、控制和汇报所有配置项的演化过程。凡是纳人配置管理范畴的工作成果都是配置项。
配置管理流程所管理的配置元素包括硬件、软件、网络设备、服务合同和客户端等IT基础架构中所有必须控制的组成部分。所有的数据存在配置管理数据库CMDB(configuration management dataBase)中。
配置管理是IT基础架构组成部分的文档化描述(如状态、关系等),并包括配置元素(configura-tion item CI)相关的文档资料。它制订、跟踪和汇报相关信息,以帮助其他流程更有效地运行,特别是变更管理、事件管理和问题管理等流程。
配置管理流程着重于管理IT生产环境中所有必须控制和可以控制的组成元素,并为其他相关流程(如问题管理等)提供相关信息,以使这些流程得到更有效的运行,从而保证IT环境的完整性和稳定性。其主要流程内容如下:
(1)配置管理策略的规划:确定配置管理的范围,包含两个方面的内容:哪些IT设备、IT资料需要纳入配置管理,即都有哪些CI;对CI都需要记录哪些信息。也就是配置管理的广度和深度。
(2)配置项的识别和维护:输入和更新CMDB数据。登入新的CI或已有CI的变更,指明IT环境中各CI之间的关系。
(3)录入和控制:加强CI变更的相应授权,在CI的整个生命周期内跟踪CI的状态历史(如以前、当前、计划状态等),确保只有被认可的和被标志的配置项才能接受和记录。配置项的状态报告应当定期地反映配置项的版本和变动历史。
(4)审计和确认:定期审核全部或部分CMDB数据,确认和物理环境的一致性,从而确保配置信息的完整性。
(5)回顾和改进:定期回顾流程和审核结果,找出改进机会,包括流程和CMDB。
7. 服务级别管理 服务级别管理流程的用途是确定能够支持业务需要的IT服务级别需求,通过对服务级别的管理来确保实现承诺的服务级别。
服务级别管理流程根据预先确定的标准服务参数来定义、协商、监控、报告和控制针对特定客户的服务级别。如果服务级别协议(SLA)需要,该流程还可以为客户创建定制服务,定制的内容要求记载在服务级别需求(SLR)中。服务级别协议是连接IT部门和业务部门的纽带。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。