ITIL 问题管理综合指南
什么是ITIL问题管理
问题是多个事件的原因或潜在原因。影响许多用户的重大事件或重复发生的事件可能会出现问题。此外,可以在基础设施诊断系统中识别问题之前 用户会受到影响。
事件会阻碍业务生产力,提供快速解决方案有助于确保业务运营的无缝连续性。但是,当多个事件同时发生或同一事件多次发生时,通过提供拼凑的解决方案或一遍又一遍地提供相同的解决方案来推进是不可行的。
ITIL®问题管理是一种程序性方法,通过深入研究事件以找到根本原因和修复程序,并确保IT基础架构运营中出现的事件最少,并降低 通过适当记录现有问题并提供解决方法来事件。
问题管理是一种有条不紊的方法,用于确定事件的原因和管理所有问题的生命周期。ITIL®问题管理过程的目标是最大限度地减少事件的影响并消除重复发生的事件。虽然ITIL®没有说明任何特定的技术要执行问题管理,它建议遵循三个阶段:
本文稍后将详细讨论这些阶段。
被动式管理处理当前影响用户的事件,而主动式问题管理处理将来可能作为事件出现的问题,如果它们被单独处理。
健全的问题管理流程有可能显著减少事件工单的涌入,为IT 服务台员工节省大量时间和精力。这一优势还体现在其他好处中,例如缩短平均修复时间 (MTTR)、 更高的客户满意度、强大的已知错误数据库以及更低的 IT 服务和问题成本。此外,一个实施主动问题管理的企业可能会发现在问题中断业务流程之前识别和消除问题的巨大价值。
问题管理作为ITIL®实践在与整个服务价值链中的其他ITIL®实践一起使用时最有用。信息在各种ITIL®实践之间交换, 即事件管理、变更管理、IT 资产管理、知识管理和持续服务改进。各方之间交换的这些信息在每次ITIL®实践中积累价值,进而建立理想的IT 服务管理流程。
在继续之前,以下定义将有助于理解本文上内容。
- 解决办法:还原服务并确保业务连续性的临时解决方案。解决方法可减少事件或问题的影响。
- 根本原因分析 (RCA):根本原因是问题的根本问题。RCA 是帮助发现问题根本原因的调查技术。
- 已知错误:以前发生过并具有解决方法或已知根本原因的问题。
- 已知错误数据库 (KEDB):通过使用事件管理和问题管理记录已知错误而创建的数据库。
在本文中,我们将详细研究问题管理的各个方面,提供您快速了解如何在企业中实施问题管理所需的所有知识。
IT 问题管理有哪些好处
企业在建立问题管理的过程中可能会遇到一些障碍,企业可能没有资源来分配给问题管理团队,或者它可能已经有一个非正统的 管理问题的方式,不愿意改变。有时,这可能只是与成本相关的拒绝请求。
因此,将所有利益相关者纳入问题管理过程并表达它如何提供价值至关重要。 到企业的不同方面。这些好处包括:
- 通过适当的文档消除企业服务中的故障。
- 通过识别和解决薄弱环节来完善服务设计,确保最有效和高效的路径 用于服务交付。
- 通过为事件提供永久解决方案而不是停留在变通办法上,提高服务故障的首次修复率。
- 减少影响多个用户或在关键时刻影响单个用户的事件的影响。
- 防止随着时间的推移困扰企业的大多数事件和问题,从而提高用户的工作效率。
- 增强用户对企业 IT 服务的信心。
- 通过系统地维护 KEDB 减少从故障中恢复所需的时间。
- 通过一次性修复防止重复发生事件,节省解决这些事件的宝贵服务台工作。
- 通过从已解决的问题中学习,鼓励 IT 服务随着企业的发展而成熟。
- 通过技术意识和有价值的见解在企业内培养 IT 人才。
IT 问题管理角色和职责
问题管理团队的角色与存在的企业结构直接相关。 该企业的年龄、文化、技术和遍布全球的地点数量会影响其问题管理团队的组成。对于小型 IT 企业,团队的职责可能全部合并,或者 就大型跨国公司而言,它们可能是专业化的。
无论哪种方式,IT团队的便利性和灵活性都取决于定制安排,以确保根据ITIL®建议有效地解决问题。了解企业的一般情况 策略是启动团队组建的良好起点。此外,重要的是要警惕企业准备为发展问题管理团队而驱逐的资源。
随着企业技术的发展,团队的角色和职责应该扩展、分化和成熟,否则在服务交付过程中可能会出现责任方面的混乱。
下面列出了问题管理团队的一般角色和职责:
角色 | 责任 |
---|---|
问题管理器 | 负责整个实践的有效性和效率。类似于团队领导 |
问题所有者 | 对分配给他们的任何问题工单的生命周期负责 |
问题代理 | 负责问题工单中关联的任务 |
诊断团队 | 具有各种专业知识的各种人员,负责问题的RCA |
IT 问题管理流程
就像企业为客户创造价值一样,IT服务管理通过最佳实践为其用户创造价值, 并间接帮助为企业创造价值。若要创建此值,必须有一个具有已定义输入和输出的进程。当ITIL®就绪的服务台到位时,问题流程的简化流程如下所示:
根据ITIL®的说法,您可以使用您认为适合您企业的任何技术来实施问题管理流程。所实施的技术应具有支持三个阶段的功能 的ITIL®问题管理。
这三个阶段是:
问题识别
问题识别阶段在管理工具中识别并记录问题。与多个服务管理实践(包括事件管理,资产管理,CMDB和变更管理)相关的服务台工具使企业在此阶段具有优势。
虽然服务台工作人员通常会根据事件激增来报告问题,但主动的问题管理方法通过以下方式识别问题:
- 分析事件趋势,利用网络监控系统,并利用其他诊断软件。
- 检测可能再次发生的事件的风险。
- 评估从合作伙伴和供应商收到的信息。
- 评估来自内部软件开发人员、工程师和测试团队的信息。
根据企业的结构、领域和文化,可能有更多的模式可以识别问题。然而,重要的是要有一个系统来引入、识别问题、 确定优先级,并记录以供进一步检查和诊断。
问题控制
问题管理是一项协作工作,因此为了使结果有效,应有多个部门和利益相关者参与问题控制阶段。
问题控制包括优先级划分、调查、分析和记录已知错误和解决方法等活动。有许多技术可以帮助确定问题的优先级和分析。一个好的经验法则 首先要解决的问题,这些问题一旦解决,将显着遏制企业中的服务中断。
可行性是解决问题时需要注意的另一个方面。永久修复问题可能需要比解决解决方法更多的资源。快速的成本效益分析可以确定是否应继续进行永久修复。
变通办法记录在问题记录中。通常,如果问题持续更长时间,建议实施快速解决方法。此解决方法甚至可以成为事件管理解决方案的一部分;但是,问题管理 团队应查看解决方法,并在必要时优化解决方案。如您所见,有效的事件解决方法可以成为某些问题的永久解决方案。
错误控制
此阶段通过定期检查 KEDB 中的已知错误来管理可能的永久修复(如果它们通过成本效益分析)。
分析问题后,将其记录为已知错误。我们会定期重新评估这些已知错误,以说明它们产生的影响,并测试变通办法的有效性。
问题管理软件的最佳功能
企业更容易利用软件来制定他们的问题管理流程,而不是尝试从头开始开发它。市场上有许多解决方案声称是问题管理的最佳解决方案; 至少,问题管理软件应该具有下面列出的功能。
问题创建和日志记录
- 从事件中创建问题:确定需要全面调查的潜在问题事件,并关联更改
- 将问题标记为已知错误:维护 KEDB
- 创建问题模板:标准化定义问题的格式
问题分析
- 问题角色和技术人员:确定问题所有者
- 包括针对每个问题的分析、影响和 RCA:分析问题的影响、症状和根本原因,并记录下来
- 标记受影响的服务和涉及的资产:精确定义每个问题,并量化业务影响
问题解决方案
- 在问题中添加具有依赖关系的任务:将解决方案实施分配给具有截止日期的特定技术人员
- 将解决方法标记为解决方案:提供带有解决方法的临时解决方案,或问题的永久解决方案
- 将更改与问题相关联:使问题管理与其他 ITSM 流程协同工作
问题结束
- 将问题解决方案和解决方法复制到所有相关事件:避免冗余活动,并确保所有工单上的记录一致
- 问题关闭后自动关闭所有相关事件:节省技术人员的时间和精力
- 创建工作日志以记录解决问题所需的成本、工作量和时间:获取有关解决问题所需的成本和时间的详细 KPI
- 通知规则和公告:建立通知机制,让利益相关者了解情况
ITIL®的问题管理框架是每个企业主动诊断和解决问题的指路明灯。问题管理及其实践对所有企业都是灵活的,无论 规模、地理分布、行业和每天使用的技术。
具有强大事件管理的企业应通过实施单独的通道来记录和管理问题以及维护 KEDB,从而实现基本的问题管理设置。作为问题管理团队的经验 随着企业的发展,这个过程也应该成熟。
对于一个已经实行问题管理的企业来说,它的愿望应该在于将事件减少到历史最低点。这可以通过主动的问题管理方法来实现。
实施问题管理流程的简单第一步是利用具有正确模块的服务台工具,以确保全面的 IT 服务台操作和对工单、事件和问题的集中控制。 在您的企业中拥有简化的问题管理流程是一项长期项目,将随着业务的增长和 IT 基础架构的扩展而获得回报。