1、李文祥2013.9企业级监控解决方案通知通知控制中心控制中心Administrator状态检查状态检查配置配置通过ping 或 端口检测端口检测监控被监控的设备网络设备安装了ZabbixAgent的服务器没有安装ZabbixAgent的服务器通过Zabbix Agent监控通过SNMP监控为什么要用Zabbix!时间时间就是金就是金就是金就是金钱钱Administrator实时通知检查状态省省省省时时就是省就是省就是省就是省钱钱系系统故障宕机故障宕机系统架构系统架构代理系统基本数据流监控预警监控(Items)触发器(Triggers)事件(Event)动作(Actions)处理流程神马可以被监
2、控?Zabbix Agent SNMP Agent IPMI Agent Agentless Monitoring Web Monitoring Database Monitoring Internal Check Calculated Monitoring Custom Command MonitoringZabbix Agent 监控功能控功能添加监控的方法1.手动增加2.自动发现3.自动注册图形触发器表达式表达式:system.cpu.loadall,avg1.last(0)5load1表达式2:system.cpu.loadall,avg1.last(0)5|:system.cpu.l
3、oadall,avg1.min(600)2load15或load1连续10分钟大于表达式:net.tcp.servicesmtp.last(0)=0&:net.tcp.servicesmtp.last(0)=0 两台器的SMTP同时故障表达式:agent.version.str(beta8)=1 检查agent的版本中是否包含字符串“beta8”触发报警表达式表达式5:tick.nodata(180)=1三分钟没有收集到数据表达式6:zabbix:system.cpu.loadall,avg1.min(300)2&zabbix:system.cpu.loadall,avg1.time(0)00
4、0000&zabbix:system.cpu.loadall,avg1.time(0)06000000:00-06:00之间load1连续五分钟最小值大于表达式:public.monitor:system.cpu.load,avg1.abschange(0)0五分钟内最大值和最小值之差大于,表示服务可用状态没有变更触发报警表达式表达式9:public.monitor:system.cpu.load,avg1.avg(600)public.monitor:system.cpu.load,avg1.avg(600,86400)+10当前小时的平均load1一天以前1小时的平均load1加10,av
5、g时间默认为S,也可以为次数,如avg(#600)代表600次的平均值表达式10public.monitor:system.cpu.load,avg1.count(600,12,”gt”)10最后600秒load1大于12的次数大于10表达式11public.monitor:system.cpu.load,avg1.count(#10,12,”gt”,86400)824小时以前最后次load1值大于12的个数超过8个触发报警表达式格式表达式N表达式1表达式表达式1表达式+表达式1N&表达式N表达式1N|表达式N表达式1N+10|表达式N表达式1N+10|表达式N|表达式3N触发器依赖这些设备的
6、监控的所有监控项都依赖于这个依赖于这个 Proxy的的可用性可用性;而包括这个Proxy在内,节点内的设备的监控都依赖于依赖于防火墙防火墙的可用性的可用性报警功能简单报警远端命令报警间隔升级报警声音报警报警升级(Esacalations)故障信息可以立即通知用户报警信息可以一直发送直到问题解决可以延迟发送报警信息报警信息可以升级(Escalations)发送给另一个高级用户组ZABBIX API监控即服务(MaaS,MonitoringasaService)基于HTTPJSON-RPC协议以user.login接口为例:API支持的数据类型类型类型说明说明bool布尔值trueorfalsef
7、lag当该值不等于空或者false时被认为是trueinteger整数.float浮点数.string文本字符串.timestamp Unix时间戳array数组.object关联数组.queryAvaluewhichdefines,whatdatashouldbereturned.Canbedefinedasanarrayofpropertynamestoreturnonlyspecificproperties,orasoneofthepredefinedvalues:shorten-returnsjusttheprimarykey;refer-returnstheprimarykeyandtheforeignkeysusedtolinkrelatedobjects;extend-returnsallobjectproperties;count-returnsthenumberofretrievedrecords;supportedbyallgetmethodsandcertainsubselects.维护状态一个时间段维护,周期性有规律的维护,维护期间是否做数据收集谢谢!了解更多,参看zabbix的研究.docx