如何通过监控应用性能来减少业务损失?(代码片段)

author author     2022-12-05     496

关键词:

对于依赖IT技术的企业来说,停机是最大的噩梦。一项有关企业停机的调查研究发现,过去三年中,将近96%的企业遭遇过停机状况。由于IT导致的停机,企业每年平均至少损失千万元的营收,并平均减少545小时的有效业务时间。其实多达51%的停机是可预防的,这意味着这些损失是可以通过及时恰当的措施来避免的。停机也并不是唯一可以造成企业巨大损失的难题。较长的加载时间也会严重影响终端用户体验,因此,应用程序性能管理(APM)可以为IT团队提供非常实质性的帮助。

什么是APM(应用程序性能管理)?
APM是指监控或管理代码/应用程序的性能,监控其稳定性,响应时间和整体用户体验。应用程序性能监视不仅仅是指性能指标的汇总和监视,更是一个综合性的解决方案,可以减缓性能下降,识别故障并使您能够对监视的目标采取及时有效的措施。

为什么需要APM工具?
当应用程序不可用,会立刻中断用户与外界的连接。如果没有适当的APM解决方案,IT团队将被大量需求支持的电话轰炸,解决问题的MTTR则将变得很长,因为他们无法准确查明问题的根源。而如果有APM工具就可以保护您的企业免受潜在的IT威胁。
在大型企业中,IT团队包括支持,ITOps,DevOps,质量保障(QA)和安全保障团队。APM与其中三个团队相关:ITOps,DevOps和QA。
ITOps团队的责任是确保企业的IT基础架构运行正常,并提供快速开发和功能发布所需的服务。APM工具有助于减少风险并降低 系统发生故障的负面影响。
质量保障团队不仅需要确保应用程序的质量和正常运行,而且负责检查SLA遵从性。综合监控是确保遵从SLA 并实现理想性能的最佳方案。通过强大的APM软件可以轻松地进行此类监视。
对于DevOps团队,应用程序性能管理工具可支持DevOps目标,例如缩短开发和发布周期,并减少关键应用程序中的缺陷。

简而言之, APM软件可帮助ITOps,DevOps和QA团队实现共同的目标,可以大大减少网络中断次数,从而避免不必要的IT消耗。

优秀APM工具必备的特点
APM工具必须性能强大全面才能被IT部门接受。例如,基于应用程序指标的监视工具可以告诉您应用程序的性能何时偏离最佳性能;一个智能的APM工具可以解析事务数据并执行代码概要分析,以揭示性能下降的原因。APM工具的核心包括执行以下功能:

URL监控

代码分析

事务跟踪

综合监控

应用程序依赖关系映射

服务器和数据库监视

自动诊断问题

高级分析

为什么Applications Manager是理想的选择?
Applications Manager是ManageEngine的基础结构和应用程序监视解决方案,旨在确保IT基础结构中各个组件的可用性和高性能。其提供对130多种技术KPI的监视和分析,包括云应用程序,容器,服务器,数据库,虚拟应用程序和Web应用程序。
Applications Manager使用字节码工具提供对应用程序深入了解,并通过汇总和跟踪诸如响应时间,数据库状态,错误和异常状态之类的指标来监视应用程序的性能,还可以利用代码概要分析及其他数据收集技术来提供详细的事务跟踪。
Applications Manager 通过综合事务监控来确保Web应用程序的无缝终端用户体验,使您能够运行模拟的应用程序环境,以体验用户从不同位置进行Web事务的过程,以供分析和故障排除所用。

Applications Manager还提供了动态更新的应用程序映射关系图 。这些关系图可帮助IT团队可视化应用程序交互的基础架构。这种自动化的可视化功能可帮助IT团队改善其故障排除工作,降低其MTTR,还可以用来了解配置变更和计划内停机时间的影响。

借助Applications Manager的智能故障管理系统,您可以借助阈值(可以是自适应的,静态的或动态的)和异常情况来识别即将发生的故障,并采取预防措施以避免发生故障。

您还可以使用Applications Manager的500多个报表来更深入了解容量规划,进行趋势分析和SLA管理。快速配置可定制的交互式仪表板功能可帮助IT和DevOps团队在网络中断或排错期间进行有效协作。

如何基于运维事件中心通过logstash进行日志关键字监控(代码片段)

日常运维过程中,很多场景都需要对日志关键字进行监测,以便第一时间发现应用/业务相关异常,这是一种比较常见的监控需求,所以也有很多方法可以实现关键字告警。对于简单的告警可以通过一些传统的监控... 查看详情

微服务应用监控springbootactuator详解(代码片段)

...业务流程中间会经过很多个微服务的处理和传递,那么,如何能知道每个服务的健康状况就显得尤为重要。万幸的是SpringBoot为我们提供了监控模块SpringBootActuator,本篇文章将和大家一起探讨一些SpringBootActuator一些常见用法方便... 查看详情

zabbix5.0企业级分布式监控系统-精讲与企业应用(代码片段)

...d/88076/),又名从入门到精通系列课程。本课程主要讲述了如何通过Zabbix系统,来监控IT基础设施的方方面面,包括软硬件、操作系统、网络、虚拟化、中间件以及各种业务应用系统等等。从Zabbix如何安装部署开始,一步步带你精... 查看详情

prometheus-简介及安装(代码片段)

监控是整个产品周期中最重要的一环,及时预警减少故障影响免扩大,而且能根据历史数据追溯问题。对系统不间断实时监控实时反馈系统当前状态保证业务持续性运行监控系统监控方案告警特点适用ZabbixY大量定制工作大部分... 查看详情

01-运维监控(代码片段)

...不起这种规模的监控,服务器随时随地可能出库长,需要通过监控来让机器来管理监控机器;不管是虚拟机还是物理机等等,当然有时候先上服务的运行,网络设备,业务状况以及用户体验也需要监控。监控在企业中扮演着重要... 查看详情

docker下prometheus和grafana三部曲之三:自定义监控项开发和配置(代码片段)

...前面的文章中,我们体验了快速搭建监控环境,也揭示了如何编排Docker容器来简化环境搭建过程,在监控系统中有个业务web服务,它上报的数据也能在监控系统中通过图形化界面展现出来,如下图所示:本文通过实战来介绍业务... 查看详情

zabbix监控(代码片段)

...控1.及时定位问题无需人为干预,大大减少人力成本2.通过技术角度,实现实时监控业务,当出现问题及时定位并告警到相关管理人员3.记录并以图形化的方式展示出来,方便管理人员进行系统运行性能评估4.出现... 查看详情

zabbix4.0安装(代码片段)

...一.监控的重要性应用运维的三大任务之一:故障处理。如何找到故障就成了一个问题。通过客户反馈可以得知故障的发生,但是从客户感知到故障到提交故障可能周期很长。因为有些客户即使发现了无法访问服务也不会提交故... 查看详情

40张图详解docker容器监控(代码片段)

...关内容进行详解。Docker监控命令在容器中,通常可以通过执行命令或利用第三方工具,获取当前容器中的数据并将数据呈现给用户。安装完成的Docker自带一些用于监控容器的子命令,这是Docker开发者为用户提供的容器... 查看详情

拦截器的使用(代码片段)

...系统日志  一个完善的应用系统,应该具备监控功能,通过完善的系统日志记录系统运行过程中都经历了什么,当发生错误的时候及时通知管理人员,将损失降到最低。同时通过系统日志的监控 查看详情

培训减少,验证-增加。培训损失,验证损失减少(代码片段)

我正在努力实施LRCN但我在培训方面面临障碍。目前,我正在尝试单独训练CNN模块,然后将其连接到RNN。您在下面看到的结果在某种程度上是我迄今为止取得的最好成绩。问题在于除了训练准确性之外,一切似乎都很顺利。它正... 查看详情

如何监控1小时内edi系统传输的文件数量?(代码片段)

...件,以便及时处理以避免或者减少损失,我们该如何实现?首先我们需要建立一个script端口。在script端口配置如下代码。<arc:callop="portStatisticsTransactionLogs?type=day"out="output"><!--Onlychecktransaction... 查看详情

使用开源软件prometheus监控企业内部应用(代码片段)

使用开源软件Prometheus监控企业内部资源1.写在前面​在公司行政管理大区内,因为业务体量小,业务变化相对少,之前公司采用的监控技术栈较为落后,只有简单的北塔网络监控,基本没有任何的监控平台。... 查看详情

系统架构高可用系统设计原则01(代码片段)

...少停工时间,而保持其服务的高度可用性。通俗来讲就是通过专业的设计保障系统相关服务能够不间断的稳定运行。度量方式:%availability=(TotalElapsedTime-SumofInoperativeTimes)/TotalElapsedTime可用性和系统组件的失败率相关。衡量系... 查看详情

字符串池化,减少了三分之一的内存占用(代码片段)

...快。开篇摘要本文通过一个简单的业务场景,来描述如何通过字符串池化来减少内存中的重复字符串实例,从而减少内存的占用。在业务中,我们假设如下:有一百万个商品,每个商品都有一个ProductId和Color列... 查看详情

zabbix监控系统(代码片段)

随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用... 查看详情

容器云平台监控告警体系——golang应用接入prometheus(代码片段)

...行状态和性能指标。  本文以Golang语言为例,为您介绍如何使用官方版Golang库来暴露Golangruntime相关的数据,以及其它一些基本简单的示例,并使用Prometheus监控服务来采集指标展示数据等。2、暴露应用监控数据2.1安装Prometheus... 查看详情

生产性能运维监控之top介绍(代码片段)

...端IP访问比较多,对应访问的语法和PID、访问过程CPU开销如何,内存使用如何以及该语法访问执行时间长度等都可以一一展现,这样方便查询对应应用交易日志和数据库愈发监控来定位分析问题,也可以通过top命令查看系统的CPU... 查看详情