运维监控理论

minseo minseo     2022-10-24     133

关键词:

  监控

  1,识别监控对象

  2,理解监控对象

  3,细分监控对象的指标

  4,确定告警的基准线 

 

  预中级

  1,工具化和监控分离

  2,监控对象分离

    2.1 硬件监控(方法:机房巡检,IPMI,SNMP)

    2.2 系统监控(对象:CPU,内存,IO[磁盘,网络])

    2.3 服务监控(对象:各类服务[Nginx|Tomcat|RabbitMQ|OpenStack|MySQL|*])

    2.4 日志监控(方法:ELK)

    2.5 网络监控(方法:第三方,Smokeping)

    2.6 APM应用性能管理(工具:听云 PINPoint)

    2.7流量监控(工具:Piwik)

    2.8其他监控(安全监控,业务监控,舆论监控)

  3,掌握一个监控工具。例如Zabbix  

 

  中级

  1,标准化监控(标准化的脚步,模板)

  2,分布式监控(主动,被动,分布式)

  3,自动化监控(自动发现,主动注册[Agent主动注册,Server主动添加(API)])

  4,性能优化(数据采集,数据存储,数据查询)

  5,二次开发(定制的报表,api调用)

 

  进阶

  1,动态告警

  2,智能告警: 告警去重  依赖

  3,故障自愈(事件驱动,主动控制)

  4,大规模

 

  硬件监控

  1,机房巡检

  2,通过网络巡检

 

  Dell iDRAC

  HP ILO

  IBM IMM

 

  系统监控

  CPU

    进程:每一个进程,至少有一个线程。每个进程可以有多个线程  

    监控CPU命令

yum -y install sysstat
vmstat 1 10
mpstat 1 10 
cat /proc/loadavg 
lscpu

  

  内存

  

  IO

yum -t install iotop

    

  网络IO

  iftop

  制定网卡查看

iftop -i eth0

  查看进程占用的流量

nethogs

  

  

 

  

 

运维监控系统pigossbsm为银行运维监控提供全力保障(代码片段)

IT运维服务在银行信息化建设和运行中的核心地位,而定量、实时的交易数据、事件和性能指标成为判断信息系统安全运行状态的主要依据。因此,进行银行业IT运维监控指标体系研究与构建,建立IT统一运维监控指标体系至关重... 查看详情

自动化---zabbbix监控

《架构师之运维监控》PS:监控是什么,运维喝茶之道。(凡人)1.识别监控对象(分级)2.理解监控对象(理论知识)3.细分监控对象的指标4.确定告警的基准线预中级(筑基)1.工具化和监控分离2.监控对象的分类:2.1硬件监控(... 查看详情

无监控,不运维!运维监控工具平台建设总结

本文摘自微信公众号《高效运维》运维行业有句话:“无监控、不运维”,是的,一点也不夸张,监控俗称“第三只眼”。没了监控,什么基础运维,业务运维都是“瞎子”。所以说监控是运维这个职业的根本。尤其是在现在Dev... 查看详情

谈谈运维监控选型以及设计思路

运维行业有句话:“无监控、不运维”,是的,一点也不夸张,监控俗称“第三只眼”。没了监控,什么基础运维,业务运维都是“瞎子”。所以说监控是运维这个职业的根本。尤其是在现在DevOps这么火的时候,用监控数据给自... 查看详情

运维监控基础

一、运维监控基础1.报告网路/系统/业务运行状况2.提前发现被监控设备的问题二、监控的资源类别硬件监控:CPU、内存、磁盘I/O系统监控:存活状态、进程数、用户数、磁盘使用率网络监控:故障点监测、出站流量、入站流量应... 查看详情

prometheus..框架以及数据类型

...作者,希望可以跟那些提供原创的老师们学习原文:大米运维目录prometheus.(3).框架以及数据类型第?讲-企业级运维监控理论基础第?讲-企业监控通用技术第三讲-Prometheus监控入门简介第四讲-Prometheus运行框架介绍第五讲-Prometheus数... 查看详情

运维监控前言

  自进公司以后也就在运维开发这条路越走越深了。闲着也是闲着,把这两年的做的系统和笔记整理一下。  稍微理一下,后续应该会有以下内容:    服务器监控系统(附:流量汇聚、同比监控)、硬件监控系统、交... 查看详情

zabbix运维监控

一、监控概述1分类:硬件监控----系统监控----应用监控----业务监控----安全监控----网络监控----WEB监控----自动化监控-----分布式监控2内容:磁盘容易坏、CPU(负载、用户态及内核态、使用率)、内存(使用率、寻址、大页面内存... 查看详情

最简单也最难:运维监控的最后1公里

谈运维我们不得不提监控,监控是运维的起点,也是难点。随着IT架构逐渐复杂化,从前端到IT底层,中间涉及浏览器、网络、服务器、操作系统、中间件、应用、数据库等,每个环节厂商不尽相同。当出现异常需要定位哪个环... 查看详情

01-运维监控(代码片段)

...是否有异常,顺便拿Execl记录一下。现在如今的企业中,运维就要负责成百上千台的机器,传统的方式依然不行,没有高大上的方法是支持不起这种规模的监控,服务器随时随地可能出库长,需要通过监控来让机器来管理监控机... 查看详情

大公司运维监控怎么做?从哪些方面考虑?

大公司的运维监控一般是采用自研或商用软件方案。相比较自研,商用其实更省心,出现问题直接甩锅就好,所以我们建议还是直接购买成熟的运维监控系统即可,不仅确保数据安全,还能方便使用。一般建... 查看详情

大公司运维监控怎么做?从哪些方面考虑?

大公司的运维监控一般是采用自研或商用软件方案。相比较自研,商用其实更省心,出现问题直接甩锅就好,所以我们建议还是直接购买成熟的运维监控系统即可,不仅确保数据安全,还能方便使用。一般建... 查看详情

运维监控一般告警方式有哪些?

IT运维人员不可能时候盯着服务器,所以系统发生故障时候一般都会发出告警的,这样运维人员才能及时处理,保障服务器正常运行。那你知道运维告警方式有哪些?华汇数据DCOM监控平台涵盖了网络、服务器硬件、虚拟化平台、... 查看详情

运维之监控系统实践

一、监控的分类基础资源监控系统:zabbixopen-falconn9e(夜莺)prometheus(CNCF)cactinagionsganglia应用程序监控(APM):Pingpoint,Twitter的Zipkin,美团的CAT商业化厂商:听云日志监控:ES/自研二、监控系统(我们在用什么?)open-falconzabbix... 查看详情

值得收藏一文说尽运维监控

...,业务可以持续稳定运行有问题第一时间反馈出来,便于运维人员处理监控方法了解监控对象例如:CPU如何工作?性能基准指标例如:CPU使用率、负载、用户态、内核态、上下文切换报警阈值定义例如:CPU负载高的定义, 查看详情

企业运维之zabbix监控部署--监控应用(代码片段)

企业运维之zabbix监控部署--监控应用1.Apache监控2.Nginx监控3.Mysql监控4.zabbix监控Tomcat在前面的博客中介绍了如何部署企业级监控,以及监控主机时的几种发现方式,以及对于API接口的管理做了简单的介绍和操作演示;接... 查看详情

greenplum监控与运维

...务器日志文件8.使用gp_toolkit9.SQL标准错误码二、例行系统运维任务1.例行vacuum与analyze2.例行重建索引3.管理GP数据库日志文件三、推荐的监控与运维任务1.监控数 查看详情

greenplum监控与运维

...务器日志文件8.使用gp_toolkit9.SQL标准错误码二、例行系统运维任务1.例行vacuum与analyze2.例行重建索引3.管理GP数据库日志文件三、推荐的监控与运维任务1.监控数 查看详情