中國科學院計算技術研究所煙臺分所

員工社區 | 郵箱登錄 | 加入收藏 | 中國科學院
 
輿情專區
技術交流 當前位置: 網站首頁 » 新聞中心 » 技術交流
2013 1123
運維監控方式的選擇
信息來源:數據中心運維管理  瀏覽量:

一、運維監控的項目

在IDC級別大量的服務器實現人工發現問題基本不現實,這就需要我們采用自動化的程序來進行,首先需要明確我們要監控的項目,比如我們可能碰到這些的問題:
WEB服務器無法連接了?某服務器或某交換機某端口流量不正常?部署在服務器上的程序無法正常運行了?CPU或內存負載過高有宕機隱患了?等等。
做為運維工程師,必須要第一時間知道這些問題并且解決或通知相關程序負責人來解決。
 
二、監控對象
1、操作系統監控:主要有CPU 負載、內存使用率、磁盤使用率、登陸用戶、等這些常規的信息,針對服務器的用途可以有選擇或全部進行監控。
2、應用程序監控:主要監控該應用程序的運行狀態,端口狀態等。
3、數據庫監控:數據庫表或者表空間的使用情況,是否有死鎖,錯誤日志,性能信息等等。
4、網絡監控:主要監控當前的網絡狀況,網絡流量等。
5、日志監控:不管是應用程序或操作系統,日志是最直接反應出是否在正常運行的一個參考。
 
三、監控軟件的選擇
監控軟件數量多如牛毛,但功能參差不齊。因目前所接觸的都是linux操作系統,所以從支持linux系統的監控軟件里面選擇。
大多數開源的小軟件或者是都可以支持以上條目中的操作系統監控、網絡監控等,但涉及到了進程、日志的監控,以及一些更為自由的定制項目,80%的已有監控軟件滿足不了需求,經過多方面調研,得到以下兩個軟件。
Linux 平臺下的監控方法基本上可以分為兩種,第一種是通過外部檢測命令或者代理程序獲得被監控主機的相關狀態,代表工具:Nagios。第二種是通過 SNMP 協議來實現對服務器和網絡設備的監控工作,代表工具:Cacti。
 
四、Nagios和Cacti的特點
(一)Nagios
Nagios 是一款用于系統和網絡監控的應用程序。它可以在你設定的條件下對主機和服務進行監控,并根據管理員所設置的報警閥值和報警方式在監控對象報警時和恢復時通知管理員。
Nagios 強大之處在于靈活的插件式監控和報警功能,如果你想獲得系統性能方面的圖形信息可以使用 Cacti,也可以把 Nagios 和 Cacti 有效的集成起來,這要看你實際的應用需求了。
Nagios可以隨意定制要監控的客戶機的項目,通過調用nrpe插件---可以理解成Nagios客戶端的一部分---來運行在客戶端上的腳本插件,腳本插件可以自由編寫,只要能返回Nagios的正常、警告、緊急三個參數就可以,簡單的功能寫起來也比較容易。使用Nagios基本可以滿足一切想要監控的內容,要說缺點有二:一是配置稍微復雜點,二是畫圖功能不夠直觀并且配置也是較復雜。
我們在實際環境中,使用了Nagios的分支項目:Icinga,其配置、安裝、運行方式等完全與Nagios相同,可以使用Nagios所有可用的插件或擴展程序,程序界面更加符合我們的要求。下面是Icinga新版本測試中的頁面:
 
 
(二)Cacti
Cacti是一套網絡流量監測圖形分析工具,通過 RRDTOOL 工具繪圖,通過PHP程序展現出來。我們使用它可以展現出監控對象一段時間內的狀態或者性能趨勢圖。在這點上正好彌補了Nagios的缺陷。Cacti 有三大組件: MySQL 數據庫、 RRDtool 工具、 Net-Snmp 程序。 MySQL并不負責監控數據的存儲,只保存模板和 rra 文件與主機對應等信息,而真正的監控數據存儲和圖像展現都是 rrdtool 來做的。而 Net-SNMP 負責數據的采集。
Cacti使用界面:
 

 

  
網站地圖     聯系我們     人才招聘     留言反饋     所長信箱
魯ICP備11026262號-1】 ? 2011 中國科學院計算技術研究所煙臺分所 版權所有
福彩30选5开奖公告