1、什么是IDC機(jī)房運(yùn)維?
IDC機(jī)房運(yùn)維涉及到方方面面的問題,它不同于其他運(yùn)維,處理的問題都是比較低沉的問題。在很多公司可能都是將服務(wù)器托管的到專門的IDC機(jī)房讓專業(yè)的人士進(jìn)行維護(hù),還有些大公司建有自己的IDC機(jī)房,但管理層面上可能只是網(wǎng)絡(luò)信息部門的一個(gè)子部門,但我們?nèi)砸鎸?duì)很多機(jī)房管理的問題。IDC機(jī)房運(yùn)維可以簡(jiǎn)單的從五個(gè)方面來概括:主機(jī)監(jiān)控、信息統(tǒng)計(jì)、硬件維護(hù)、系統(tǒng)維護(hù)、網(wǎng)絡(luò)維護(hù)。處理這些問題就是IDC機(jī)房的運(yùn)維。
2、分層運(yùn)維
我認(rèn)為我們所熟知的計(jì)算機(jī)能有今天的成就很大一個(gè)成功是在于它的模塊化設(shè)計(jì),以及分層體系,現(xiàn)在我們用的PC的硬件是由CPU、內(nèi)存、硬盤、主板、輸入輸出設(shè)備等組成。正是這些模塊化的構(gòu)造讓人們對(duì)計(jì)算機(jī)的維護(hù)更加的方便,快捷。
現(xiàn)在我們正在步入云計(jì)算時(shí)代,云計(jì)算的實(shí)施卻是阻礙重重。但是云計(jì)算是必然的趨勢(shì),因?yàn)檫@是人們對(duì)信息自由的渴望、是對(duì)資源合理利用的迫切需要。所以說云計(jì)算的發(fā)展也少不了用模塊化,分層次的進(jìn)行設(shè)計(jì)和優(yōu)化。
我們來看看云計(jì)算的分類 云計(jì)算可以認(rèn)為包括以下幾個(gè)層次的服務(wù):基礎(chǔ)設(shè)施即服務(wù)(IaaS),平臺(tái)即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。
我覺得我們現(xiàn)在的系統(tǒng)分層多且繁雜,無法體現(xiàn)我們?cè)贗DC機(jī)房的運(yùn)維,我認(rèn)為IDC機(jī)房的運(yùn)維應(yīng)該根據(jù)服務(wù)提供的角度去對(duì)IDC機(jī)房進(jìn)行維護(hù),從終端角度來看,所有提供網(wǎng)絡(luò)服務(wù)的資源都是一朵朵的網(wǎng)云。我們?cè)贗DC機(jī)房中的運(yùn)維都是為了面向終端進(jìn)行服務(wù)。所以說我們應(yīng)該根據(jù)服務(wù)來對(duì)我們的IDC機(jī)房進(jìn)行運(yùn)維。
我根據(jù)云計(jì)算服務(wù)的分類認(rèn)為我們?cè)谶\(yùn)維分層的問題上應(yīng)該和云服務(wù)的分類相呼應(yīng)來進(jìn)行維護(hù),所以我認(rèn)為,IDC機(jī)房的運(yùn)維應(yīng)該分成:基礎(chǔ)設(shè)施維護(hù),耦合層維護(hù),應(yīng)用服務(wù)維護(hù)三個(gè)層面。
基礎(chǔ)設(shè)施維護(hù)
基礎(chǔ)設(shè)施維護(hù)顧名思義,指的是對(duì)設(shè)施設(shè)備的維護(hù),包括設(shè)備的環(huán)境維護(hù),設(shè)備的統(tǒng)計(jì)等等。在這個(gè)層面我們需要保證每一臺(tái)機(jī)器是可以正常連接的,是可以正常使用對(duì)外提供服務(wù)的,并且我們得保障機(jī)器的正常運(yùn)行并且是可管理的。總的來說基礎(chǔ)設(shè)施層的維護(hù)是為了對(duì)耦合層的交付使用而服務(wù)的。
耦合層維護(hù)
在這個(gè)層面我們對(duì)設(shè)備有了統(tǒng)一的管理,在這個(gè)層面有系統(tǒng)性的架構(gòu)統(tǒng)一的管理系統(tǒng),指令系統(tǒng),和監(jiān)控系統(tǒng),在這個(gè)層面我們可以發(fā)現(xiàn)底層的問題,并交由底層處理,并在這個(gè)層面保證應(yīng)用服務(wù)的正常運(yùn)行。在這個(gè)層面將會(huì)涉及負(fù)載均衡和備份等技術(shù)。
應(yīng)用服務(wù)維護(hù)
在這個(gè)層面主要是客戶對(duì)自己應(yīng)用的維護(hù),在這個(gè)層面里客戶對(duì)自己運(yùn)行的運(yùn)營(yíng)軟件進(jìn)行維護(hù)。
當(dāng)然這個(gè)分層的維護(hù)只是個(gè)萌生概念,如果有一天這個(gè)理論可以被建立,相信會(huì)被更加的完善。并且為我們更好的理解運(yùn)維體系服務(wù)。
3、運(yùn)維工程師
4、機(jī)房運(yùn)維技術(shù)體系
在機(jī)房中我們要面對(duì)各種各樣的事情,如服務(wù)器上架,服務(wù)器下架,處理問題服務(wù)器等等。在機(jī)房運(yùn)維中我覺得也應(yīng)該建立起我們的技術(shù)體系,從這幾方面入手使得我們的機(jī)房運(yùn)營(yíng)的更加平穩(wěn)健康。
1、 監(jiān)控體系,一個(gè)健壯的身體里不開每天的觀察,我們需要時(shí)時(shí)刻刻觀察我們的機(jī)房,看看機(jī)房發(fā)生的細(xì)小問題,所以說強(qiáng)大而有健全的監(jiān)控體系有利于我們更好的維護(hù)我們的機(jī)房。
2、統(tǒng)計(jì)體系,在IDC機(jī)房我們管理著數(shù)以百計(jì)的服務(wù)器,統(tǒng)計(jì)工作可馬虎不得,每一臺(tái)機(jī)器的配置,存放位置等等,都關(guān)系著數(shù)千元的設(shè)備的物理安全,其他的還有帶寬安全等等。數(shù)量少還好,數(shù)量一多就有可能出錯(cuò),如何快速高效的統(tǒng)計(jì),并不出錯(cuò)也是門技術(shù)。所以單獨(dú)為一個(gè)體系也是有必要的。
3、 故障管理體系,在機(jī)房中我們要處理每一臺(tái)服務(wù)器發(fā)生的故障,有些問題很棘手,有些問題很簡(jiǎn)單,但大多數(shù)問題都有相似性,可以參考其他問題的處理過程處理,良好的故障管理體系肯定是有助于我們快速的響應(yīng)和處理問題的。
4、 自動(dòng)化體系,太多的手動(dòng)執(zhí)行大大影響了我們處理問題的工作效率,機(jī)房運(yùn)維引入自動(dòng)化的理念開發(fā)自動(dòng)化管理工具可以大幅度的提高我們機(jī)房的管理效率。
5、 評(píng)估優(yōu)化體系,正所謂人無完人,在好的東西也有不好的地方,如IPONG待機(jī)時(shí)間短,建立評(píng)估優(yōu)化體系使得我們可以在定期的時(shí)間內(nèi)發(fā)現(xiàn)我們不足的地方,更好的優(yōu)化我們的不足之處。