场景:Web站点部分是IIS下的站点,IIS不像apache,nginx提供了status模块,可以直接通过web或nagios监控到站点的当前连接数等情况。

       监控服务器是CentOS 6.3+Cacti+Nagios+check_mk 。以下简称监控服务器

      所有的Windows服务器用check_mk-agent监控。以下简称监控客户端

任务:打算利用check_mk-agent的插件来监控IIS的性能数据

Windows 客户端监控插件:

       由于check_mk_agent支持bat.vbs,exe的客户端插件,

最初打算用wmic实现。

C:\Program Files\check_mk\plugins\下创建w3svc_perf.bat 内容为:

@echo offecho ^<^<^
^>^>wmic path Win32_PerfRawData_W3SVC_WebService get Name,currentanonymoususers,currentconnections,currentISAPIExtensionrequests /format:csv

这里只取当前连接数,当前匿名用户数,当前ISAPI请求数。

保存后重启check_mk_agent服务。

在监控服务器上执行cmk -d 监控客户端IP

得到如下内容

.................................[`System`][`Windows PowerShell`]<<
>>_Total,16,605,16xxx.xxx.com,0,10,0xxx.xxx.com,4,88,4xxx.xxx.com,12,507,12awstats,0,0,0<<
>><<
>><<
>>1388575521

但是执行多次发现 有的时候 <<<w3svc_perf>>>下有一个空行,有的时候没有。不知道问题在哪里

不晓得哪个给解释一下。逐放弃wmic bat插件 改用wmi

C:\Program Files\check_mk\plugins\下创建w3svc_perf.vbs内容如下:

' w3svc_perf.vbsOn Error Resume NextDim objWMIService, objItem, colItems, strComputerDim WshNetwork : Set WshNetwork = CreateObject("WScript.Network")Dim Hostname : HostName = WshNetwork.ComputerNamestrComputer = "."Wscript.Echo "<<
>>"Set objWMIService = GetObject("winmgmts:\\" & strComputer & "\root\CIMV2")Set colItems = objWMIService.ExecQuery("select name,CurrentAnonymousUsers,CurrentConnections,CurrentISAPIExtensionRequests from Win32_PerfRawData_W3SVC_WebService",,48)For Each objItem in colItems Wscript.Echo objItem.Name & "," & objItem.CurrentAnonymousUsers & "," & objItem.CurrentConnections & "," & objItem.CurrentISAPIExtensionRequestsNextWSCript.Quit

在监控服务器上执行cmk -d 监控客户端IP

得到正常结果,反复执行后<<<w3svc_perf>>>下无空行

在监控服务器/usr/share/check_mk/checks下创建w3svc_perf,内容为:

#!/usr/bin/python# -*- encoding: utf-8; py-indent-offset: 4 -*-#创建库存函数def inventory_w3svc_perf(checkname,info):        inventory = []        print info:        return inventory#创建监控check函数def check_w3svc_perf(item, params, info):        return (0,"test ok")#创建check类型(在check_info字典中添加新的check库存,check函数以及是否出性能图)check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)

cmk -L |grep w3svc_perf

w3svc_perf            tcp      yes    yes    w3svc%s

可以看到已经添加新的check类型了。

根据print info断代码的返回,可以看出,客户端插件返回的

<<
>>_Total,16,605,16xxx.xxx.com,0,10,0xxx.xxx.com,4,88,4xxx.xxx.com,12,507,12awstats,0,0,0

部分内容 被作为参数info传递到服务端的监控插件的库存以及check函数中。且为一个列表返回。用cmk --checks=w3svc_perf -I 监控客户端 可以看到上述的print info的返回值

[['_Total,12,667,12'], ['xxx.xxx.com,1,21,1'], ['xxx.xxx.com,0,112,0'], ['xxx.xxx.com,11,534,11'], ['awstats,0,0,0']]

有了这个print的调试结果,既可对返回值进行解析处理了,修改后的监控/usr/share/check_mk/checks/w3svc_perf,内容为

#!/usr/bin/python# -*- encoding: utf-8; py-indent-offset: 4 -*-w3svc_perf_default_values=(2048,1024,2048,2014,1024,512)def inventory_w3svc_perf(checkname,info):    inventory = []#测试输出#     for line in info:#        temperfdata = " ".join(line).split(",")#        webname= tempperfdata[0]#        curuser = int(tempperfdata[1])#        curconn = int(tempperfdata[2])#        curisapi = int(tempperfdata[3])#        print "webname ,%s,curuser,%d,curconn,%d,curisapi,%d"%(webname,curuser,curconn,curisapi)    inventory.append('sessions',w3svc_perf_default_values)    return inventorydef check_w3svc_perf(item, params, info):    curusercri,curuserwrn,curconncri,curconnwrn,curisapicri,curisapiwrn = params    for line in info:        tempperfdata = " ".join(line).split(",")        webname= tempperfdata[0]        curuser = tempperfdata[1]        curconn = tempperfdata[2]        curisapi = tempperfdata[3]        if   int(curuser) > int(curusercri):            infos[0]="Critical -%s:curuser=%d,(Crit) > %d."\            %(webname,int(curuser),int(curusercri))            state=1        elif int(curuser) > int(curuserwrn):            state=2            infos[0]="Warning -%s:curuser=%d,(Warn > %d)."%\            (webname,int(curuser),int(curuserwrn))        elif int(curconn) > int(curconncri):            state=1            infos[1]="Critical -%s:curconn=%d,(Crit > %d)."%\            (webname,int(curconn),int(curconncri))        elif int(curconn) > int(curconnwrn):            state=2            infos[1]="Warning -%s:curconn=%d,(Warn > %d)."%\            (webname,int(curconn),int(curconnwrn))        elif int(curisapi) > int(curisapicri):            state=1            infos[2]="Critical -%s:curisapi=%d,(Crit > %d)."%\            (webname,int(curisapi),int(curisapicri))        elif int(curisapi) > int(curisapiwrn):            state=2            infos[2]="Warning -%s:curisapi=%d,(Warn > %d)."%\            (webname,int(curisapi),int(curisapiwrn))        else:            state=0            infos[0]="OK,webname:%s,curuser:%d,curconn:%d,curisapi:%d"%\            (webname,int(curuser),int(curconn),int(curisapi))          infotext="".join(infos)        return (state,infotext)check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)

最后执行cmk-I && cmk -U && cmk -O

在到

spacer.gif

竟然看到的状态是unkow 返回值也不是预想的那种循环遍历所有站点的性能值返回,而是把info列表的第一个值取出返回了。继续调试。。。。。

烦请写过check_mk插件的兄弟伙给指条明路

checks 做了修改

—————————————20140108————————————————————————-

#!/usr/bin/python# -*- encoding: utf-8; py-indent-offset: 4 -*-# the agent info#<<
>>#_Total,8,586,8#xxxx.xxx.com,0,11,0#yyyy.xxx.com,0,48,0#zzzz.xxx.com,8,527,8#this line not agent return#webname,curuser,curconn,curisapiw3svc_perf_default_values=(2048,1024) #警告,严重阙值的默认值,可在main.mk中 #用w3svc_perf_default_values = (1500, 1600) #修改def inventory_w3svc_perf(info): inventory = [] for line in info: tempperfdata = " ".join(line).split(",") webname= tempperfdata[0] curuser = int(tempperfdata[1]) curconn = int(tempperfdata[2]) curisapi = int(tempperfdata[3]) inventory.append(('w3svc:'+webname,w3svc_perf_default_values)) \ #检查入库,用元组入库,直接'w3svc:'+webname,w3svc_perf_default_values\ #入库不得遍历 return inventory #返回库def check_w3svc_perf(item,params,info): cri,wrn = params #定义警告和严重的阙值 for line in info: tempperfdata = " ".join(line).split(",") webname = tempperfdata[0] curuser = tempperfdata[1] curconn = tempperfdata[2] curisapi = tempperfdata[3] infos=[] #定义输出内容的空数组 state=0 if int(curuser) > int(wrn) : if int(curuser) > int(cri): state=2 infos.append("Crit!,%s_Curuser=%d >cri[%d]"\ %(webname,int(curuser),cri)) else : state=1 infos.append("Warn!,%s_Curuser=%d >wrn[%d]"\ %(webname,int(curuser),wrn)) elif int(curconn) > int(wrn) : if int(curconn) > int(cri): state=2 infos.append("Crit!,%s_Curconn=%d >cri[%d]"\ %(webname,int(curconn),cri)) else : state=1 infos.append("Warn!,%s_Curconn=%d >wrn[%d]"\ %(webname,int(curconn),wrn)) elif int(curisapi) > int(wrn) : if int(curisapi) > int(cri): state=2 infos.append("Crit!,%s_Curisapi=%d >cri[%d]"\ %(webname,int(curisapi),cri)) else : state=1 infos.append("Warn!,%s_Curisapi=%d >wrn[%d]"\ %(webname,int(curisapi),wrn)) else: state=0 infos.append("OK!!webname=%s,curuser=%d,curconn=%d,curisapi=%d"\ %(webname,int(curuser),int(curconn),int(curisapi))) infotext="".join(infos) if infotext.find(item.split(':')[1]) > -1:#判断item是否在输出内容,并切分\ #后输出。 return (state, infotext)check_info['w3svc_perf'] = (check_w3svc_perf, "%s", 1, inventory_w3svc_perf)

效果图

cmk -P create w3svc_perf

cmk -P pack w3svc_perf

打包为mkp文件  可直接cmk -P install 安装