■ 河北 趙學作
編者按:Nagios 功能十分強大幾乎所有的項目都可以監控,大到服務器的存活狀態,小到服務器上的某一個服務(Web),這些功能都是通過自定義插件(或者叫做腳本)來實現。
Nagios 是一款用于監控系統和網絡的開源應用軟件,其模式是服務器—客戶端。也就是說,首先要在一臺服務器上(Server)部署相應的主要套件,然后在要監控的服務器上部署客戶端程序,這樣Server 會和Client通信,從而監控Client 端的各項資源。當Nagios 監控到某項資源發生異常會通知到用戶,用戶可以通過Web 頁面來查看Nagios 所監控的各項資源,默認搭建的Nagios 服務器只能監控簡單的幾個項目,而其他服務之類的監控項目都是由用戶開發的插件來實現的。
1.安裝apache+php(略)
2.建立Nagios 賬戶
3.下載軟件
4.編譯安裝Nagios
all-config ##把配置文件樣例復制到Nagios 的安裝目錄
5.編譯安裝nagios-plugins
6.安裝NRPE
7.配置Web 接口
在文件最后加入以下內容:
8.配置Nagios
其中把 use_authentica tion=1 改成 use_authent ication=0 #即不用驗證用戶
9.啟動Nagios
啟動前先檢測:
如果最后顯示如下,則說明配置沒有問題了。
啟動成功后,在瀏覽器中輸入 : http://服務器IP/nagios/
即可訪問Web 頁面的Nagios。
如果你打開了Web 頁面,點擊左欄的Host Detail會在右欄看到一行數據,其中Host 名為“localhost”,Status 顯示為“up”,并且顯示為綠色,如果是其他顏色就說明你的localhost 出了問題。目前只有一行數據,也就是說只監控了監控中心(localhost)一臺主機,那么如何添加其他機器被它監控呢?這就需要在要被監控的機器上也部署Nagios 軟件。
1.添加賬戶
2.安裝NRPE
3.安裝nagios-plugin
同服務器中安裝方法
4.配置
找到”allowed_hosts=127.0.0.1” 改成 “allowed_hosts=127.0.
0.1,192.168.1.8” ##第二個IP 是server 的IP
找到” dont_blame_nrpe=0” 改成 “dont_blame_nrpe=1”
5.啟動NRPE
添加主機就是到Server端(監控中心)修改配置文件。
1.修改主配置文件
增加內容:
cfg_dir=/usr/local/nagios/etc/services ##定義一個目錄,以后把新增加的主機信息文件全放到這里
2.添加被監控主機信息
注意,這里的IP 是Client端IP,監控項目有三個Ping、SSH 和 HTTP。其實這三個項目使用的腳本都為本地腳本,即使遠程主機沒有安裝Nagios和NRPE 同樣可以監控這些項目。但如果想監控Load、Disk等項目就需要通過NRPE 服務來實現。因此,需要在Client上啟動NRPE 服務。