全国数据中心专业人才网
全国数据中心专业人才网详情页背景图
全国数据中心专业人才网详情页icon最新动态 全国数据中心专业人才网所在位置icon 您所在的位置:首页 > 最新动态
ISO20000管理体系在数据中心的实践(六)
 

今天继续给大家分享ISO20000管理体系在数据中心的实践:问题管理及配置管理两个章节的内容。(内容较长,本次只分享两个章节的内容。)

猜你喜欢的文章
 

► ISO20000管理体系在数据中心的实践(五)

 ISO20000管理体系在数据中心的实践(四)

 ISO20000管理体系在数据中心的实践(三)

 ISO20000管理体系在数据中心的实践(二)

► ISO20000管理体系在数据中心的实践(一)

 
 
 

问题管理

 
 

一、概述

1.问题管理的定义和目标

问题管理是为了规范问题处理流程,提高问题处理的质量和效率所进行的活动。

问题管理的目标是查明问题发生的根本原因,并找到解决问题的方法和防止其再次发生的措施;预防和规避问题引引发事件,避免事件复发,以及最大限度减少不能避免的事件的影响。

2.建设背景及发展历程

(1)建设背景:根据ISO20000国际标准要求,建立问题管理流程。

(2)发展历程:

·2012年,根据1SO20000国际标准要求,建立问题管理流程。

·2013年至今,根据实际运行经验,优化完善流程部分细节,例如不断调整KPI指标目标值。

二、流程及运作

1.角色和职责

角色包括问题管理流程负责人、问题经理、问题负责人和问题处理专家,具体职责如下。

·问题管理流程负责人的主要职责是负责问题管理领域规章制度的设计、推广、监督和改进,负责跨部门问题处理的组织协调工作。

·问题经理的主要职责是负责鉴别流程改进点并向体系负责人提出改进建议;跟踪问题的解决过程,实施必要协调;督促问题解决,及时向管理层和相应的人员通报关键问题的解决状态;审查并关闭已解决的问题单。

·问题负责人的主要职责是负责审核问题单,指派具体的问题处理专家开展问题分析;协调内外部资源,保证所有已影响或潜在影响服务的问题得到处理。

·问题处理专家的主要职责是负责在规定的时间内调查问题根本原因,编写问题解决方案,处理问题单。

2.本管理流程的流程环节和关键活动介绍(流程的触发、输入和输出)

(1)问题管理包括问题检测与判定、问题记录与审核、问题分析与分派、问题诊断与调査、问题处理与解决、问题审查与关闭,流程如图5-2至图5-7所示。

图5-2 问题检查与判定流程

图5-3 问题记录与审核流程

图5-4 问题分析与分派流程

图5-5 问题诊断与调查流程

图5-6 问题处理与解决流程

图5-7 问题审查与关闭流程

(2)流程触发:事件触发,即在发生生产事件或监控发现潜在风险后,分析问题的原因和解决方案。

(3)输入包括以下内容

·事件信息,包括事件发生时间和具体描述、事中解决的过程、需分析的问题点,以及后续优化、落实的事项。

·日常生产运维过程中发现的尚未影响对外服务的隐患,如监控发现资源使用率超过既定阈值、应用系统响应缓慢等等。

·内审、管理评审、外部审核等过程中发现的需改进的问题。

(4) 输出包括《问题管理执行情况报告》(模板如图5-8所示),以及解决问题相关的变更。

图5-8流程执行情况报告模板

3.与其他流程的接口或集成

(1)事件管理流程:将尚未找到根本原因,需后续跟进的事件输出至问题管理流程,输出信息包括事件相关描述信息和后续分析、解决问题需跟进落实的事项。

(2)变更管理流程:问题管理中解决问题需进行的生产环境的操作和调整,相关变更需输入至变更管理流程。

(3)持续改进管理流程:问题管理产生的持续改进要求输入至持续改进流程。

4.本管理流程的运作机制

问题管理流程是由本流程负责人负责该流程的策划、监督、执行及改进,根据具体问题的所属条线和影响程度将问题进行分类分级,分派给具体的问题处理专家完成问题的分析和处理,并将问题的原因和解决方案记录下来。对于暂无法彻底解决的问题,制定有效的规避措施,减少事件复发的影响。

5.本管理流程管理工具的介绍

问题管理主要活动通过IT运维流程管理平台进行管理,可完成问题的手工记录和事件自动转入、问题的分类和分级、问题的评审和分派、记录问题原因、解决方案和排期、关联或生成问题相关变更。

三、绩效管理

1.指标设置

(1)指标名称:问题解决率;问题按时解决率。

(2)指标定义:

间题解决率=一年内已关闭的问题数/一年内新增的问题总数。

可题按时解决率=一年内按时解决的问题数/一年内新增的问题总数。

2.考核

(1)考核方式:量化考核。

(2)考核频率:每月一次。

(3)考核阀值:根据数据中心实际情况设置。

3.本管理流程的文化建设

问题管理流程通过针对重点问题组织召开问题分析会、定期通报问题解决进展、协调内外部资源推动问题解决等工作,建立了问题管理的常态化机制,各负责部门及时分析和处理问题,且详尽地记录分析结论和解决方案。并且各部门也建立了相应的工作机制,安排专门负责问题管理方面工作整体统筹协调的人员。

四、持续改进

1.近三年的持续改进简述

问题管理不断完善流程工具,增加问题报表等功能。

建立信息科技体系联动机制,定期与软件中心、信息科技部沟通,并协同架构优化工作组、基础环境组等推动跨部门问题的解决。

调整绩效指标阈值和统计周期;问题管理平合新增了重复问题关闭、申请延期等功能,对问题流转和处理时限增加邮件通知提醒功能,同时完善了对批次的控制,并加强与变更管理的关联。

2.遇到的问题风险和处置措施

(1)风险:问题按时解决情况不佳。

处置措施:通过邮件定时自自动提醒、定期通报等方式,提高人员重视程度和告知频率,不断提升按时解决率。

(2)风险:部分问题无法明确原因。

处置措施:建立偶发问题关闭机制,对于未能明确原因的问题,及时制定规避措施和应急手段,持续观察一段时间,期间如未再复发,可认为是偶发事件。

3.未来展望

加强对风险的主动识别能力,通过日常运维情况及生产问题举一反三,变响应式问题管理为主动问题管理,主动发现可能造成服务影响的薄弱环节,切实提高问题库完整性,减少潜在隐患。

加强对于已有间题的积累,拟建立间题索引,形成知识库机制。

 
 
 

配置管理

 
 

一、概述

1.配置管理的定义和目标

配置管理的目标是:定义和控制IT服务与IT基础设施组件,并保持其信息准确。

2.建设背景及发展历程

(1)建设背景:根据ISO20000及ISO27001国际标准要求,建立配置管理流程。

(2)发展历程:

·2012年,根据ISO20000国际标准要求,建立配置管理流程。

·2013年,根据IS027001国际标准要求,完善配置管理流程。

·2014年至今,根据实际运行经验,对流程部分细节进行优化完善,例如增加配置申请单定期审核要求。

二、流程及运作

1.角色和职责

角色包括配置管理流程负责人、配置经理、配置管理员和配置审核员,具体职责如下。

配置管理流程负责人负责本管理领域规章制度的设计、推广、监督、回顾、报告和改进;组织配置经理开展数据中心层面配置规划,并形成配置管理计划;定期主持召开配置管理回顾会议,确保配置管理活动有效、正确的执行。

配置经理参与数据中心层面配置管理工作的规划设计;负责本部门配置管理的推广、监督、报告和改进;组织完成本部门配置项的规划、识别、控制、维护和审核等工作,并根据需要编写本部门的配置规划、配置审核报告等;负责本部门配置项数据的准确性(包括配置更新和配置审核的结果)。

配置管理员负责所管范国内配置项的更新维护,对所管辖范围内配置项更新的准确性、及时性负责;配合配置经理完成本部门配置审核工作。

配置审核员负责定期对配置信息的准确性进行审核并制定数据中心配置审核计划,组织各部门配置经理开展配置审核工作,并根据各部门反馈的配置审核报告及配置审核抽查结果形成数据中心配置审核报告。

2.配置管理流程的流程环节和关键活动介绍(流程的触发、输入和输出)

·配置管理包括配置规划、配置控制和配置审核三项关键活动。

·流程触发:时间触发,即每年在规定时间启动本年度配置管理的规划划、审核等活动;变更触发,即变更成功实施完成后触发配置控制活动。

·输入包括IT规划、生产变更和配置审核结果。

·输出包括配置计划、配置审核计划、配置申请单、配置模型和配置项。

3.配置管理流程与其他流程的接口或集成

配置管理流程与变更管理流程建立接口,在变更单中勾选此次变更是否引发配置更新,如果是会触发新建配置申请单进行配置更新。

4.配置管理流程的运作机制

配置管理流程是由本流程负责人负责该流程的策划、监督、执行及改进,根据每年整体规划及管理要求制定配置管理规划,由配置经理及配置管理员完成配置控制活动,由配置审核人员完成配置审核。

5.配置管理流程管理工具的介绍

目前配置管理流程建立在数据中心T运维流程管理平台上,完成配置申请、审核等流程,配置管理数据库正式投产,实现配置项的增、删、改和查操作。

三、绩效管理

1.指标设置

配置项正确率:正确配置项数量/配置项总数。

配置项修改及时率:及时修改的配置项数量/需要修改的配置项总数。

2.考核

考核方式:量化考核。

考核频率:每季度。

考核阀值:根据数据中心实际情况设置。

3.配置管理流程的文化建设

配置管理通过每年度的规划、控制、审核等活动,逐步深入地认识和了解配置管理流程。

四、持续改进

1.近三年的持续改进简述

近三年的持续改进主要是对配置管理纳管范围及颗粒度以及工具的改进。

2.遇到的问题风险和处置措施

风险:变更管理工具中关于“是否涉及配置项”的选项存在较多变更填写人员不了解是否涉及配置项变更,故误填写较多。

处置措施:采取加大对于配置信息包含内容的宣贯等措施进行优化。

3.未来展望

通过采取数据联邦、自动发现等多种形式,丰富配置数据,保证配置数据准确性。

梳理配置应用场景,充分发挥CMDB的价值,将配置管理与应急处置、变更管理、资产管理和监控处置等运维工作相结合,为安全生产提供辅助决策。

 

本次内容小编就介绍到这啦,未完待续……

文章摘自《管理体系在银行业数据中心的创新与实践》