第一节总则
第一条为稳步提升我行信息科技服务管理水平,加强信息系统问题管理和跟踪,实施故障根源分析和整改解决,预防故障重复性发生,特制定本制度。
第二节适用范围
第二条本制度适用于我行所有信息系统生产环境以及与生产系统相关的网络、设备、机房等基础设施和监控、操作等生产服务。
第三条问题管理范围包括与IT生产系统相关的各种问题,以及围绕问题解决所发生的发现与记录、分析与诊断、解决与整改、关闭与总结的整个过程。
第三节职责描述
第四条问题管理过程的角色主要包括:问题提出人、问题经理、问题分析人、问题解决人。
(一)问题提出人:
1、问题提出人负责提出问题并提交问题单至问题经理。问题提出人通过参与事件解决过程被动发现问题,或通过参与监控事件、日常检查、基础设施的运行趋势分析等活动主动发现问题;
2、问题提出人负责对问题信息进行收集、整理并登记。问题提出人应及时登记问题,确保内容完整、描述准确,分类合理,避免重复提出问题;
3、问题提出人负责对问题单的最后处理结果进行确认并关闭问题单。(二)问题经理:
1、问题经理负责对问题进行分派、监控、所需资源的协调、定期产生报表等;
2、问题经理负责定期对问题进行汇总,分析,向相关人员汇报问题单处理进度;
3、问题经理负责问题的最后审核,并做好关闭和事后评价工作。(三)问题分析人:
1、问题分析人负责对问题现象进行审核、确认;2、问题分析人负责深入的问题分析,以找出根源性原因;3、问题分析人在特殊情况下为专家。
(四)问题解决人:
1、问题解决人负责确认问题分析人的分析结果;
2、问题解决人负责分析结果的基础上,找到可行的解决方案;
3、问题解决人负责安排生产变更或其他输出方式,实施问题的解决过程。第四节问题来源
第五条问题的来源包括如下几种情形:
(一)事件升级,通常由生产事件触发,管理目标是通过故障诊断、明确故障的根本原因、提出解决措施或纠正建议、最终解决问题以避免故障再次发生。
(二)运维自查,通常由运维人员从监控事件、日常巡检、系统的运行趋势分析等工作中找出基础设施或环境中的薄弱环节、并提出消除薄弱环节的建议,进而阻止潜在故障的发生。
(三)风险事件,通常由我行风险管理部门根据生产系统故障的业务影响及风险隐患建立风险事件,并组织分析原因、提出整改要求及后续跟踪处理。
(四)审计发现,通常为与我行信息科技相关的内、外部审计的问题发现,通过问题管理的生命周期以实现审计整改跟踪及解决过程。
(五)专项检查,主要涵盖行内外专家或监管部门组成的各类信息科技专项检查,力图通过问题管理流程实现对检查结果的后续跟踪及解决。
第五节问题识别与记录
第六条问题提出人在创建问题单时需要说明问题来源、问题分类、优先级问题描述等详细信息。
第七条问题管理流程应与事件管理流程相对独立,事件处理过程中故障消除、业务恢复后如需后续分析处理,应结束事件单,创建问题单。
第八条运维过程中发现的潜在故障,尚未影响业务的,应创建问题单。第九条对所处理事件历史记录进行趋势分析归纳后,形成的总结性案例问题,可创建问题单。
第十条在确认风险事件需要进一步跟踪处理后,可由问题经理创建问题单。第十一条在确认信息科技相关的内外部审计结果后,可由问题经理创建问题单。
第十二条在确认各类信息科技专项检查工作的检查问题后,可创建问题单。
第六节问题分析与诊断
第十三条问题在被创建后,由问题经理对问题进行初审,如判断需要进入分析流程的,由问题经理下派分析任务单进行问题的分析与诊断工作。
第十四条问题分析工作应由技术专家、架构师、项目组负责人主导,复杂问题可多人并行进行问题的调查与诊断工作。
第十五条问题分析人在问题分析单中注意完整的填写处理过程、问题根本原因等字段。
第十六条除非涉及厂商改造外购产品、国外厂商确认问题周期较长等外部客观情况,分析任务单应尽量在15个工作日内完成分析流程,并关闭分析任务。
第七节问题解决与整改
第十七条问题在被创建后,由问题经理对问题进行初审,如判断无需进入分析流程的,可直接由问题经理下派解决任务单进行问题的解决和整改。
第十八条问题经理在确认分析人的分析结果后,可分派问题解决任务单至问题解决人处。
第十九条问题解决人应由项目组负责人、各系统及专业相关的维护负责人主导,复杂问题可多人并行进行问题的解决与整改工作。
第二十条问题解决人在问题解决单中注意完整的填写整改分类、整改情况说明、解决方案、计划整改完成日期等字段。
第二十一条问题解决人应在填写的计划整改日期内,完成问题的解决和整改工作。
第八节问题关闭与总结
第二十二条问题处理完成后,由问题经理负责对问题过程进行回
顾,问题经理在回顾过程中,可将问题重新提交给处理团队处理。第二十三条问题经理完成问题回顾后,关闭问题。已关闭的问题
单不允许重开。如果问题重复发生,则创建一个新的问题单。第九节风险事件类问题处理
第二十四条为更好的跟踪处理风险事件及所涉及的整改内容,可由问题经理建立类型为?风险事件?的问题单。
因篇幅问题不能全部显示,请点此查看更多更全内容