過(guò)去我們對(duì)于電視信號(hào)不好的解決方案,都有一個(gè)共識(shí):拍一拍。
現(xiàn)在我們對(duì)于電腦、手機(jī)死機(jī)的解決方案也有一個(gè)共識(shí):重啟。
服務(wù)器故障怎么辦
但是,當(dāng)我們面對(duì)服務(wù)器出現(xiàn)故障時(shí),又該做出什么反應(yīng)呢?如果你要是拍一拍,估計(jì)服務(wù)器不會(huì)給你任何反應(yīng),但是你的同事可能會(huì)用狐疑的眼神兒看你;如果你立刻重啟,你的上司可能會(huì)臭罵你一頓。那么服務(wù)器故障時(shí),作為專業(yè)的技術(shù)人員該做出什么反應(yīng)?
知己知彼
如果你是新人,想要知己知彼,就一定先要搞清楚服務(wù)器硬件情況。因?yàn)橛袝r(shí)候服務(wù)器是裸機(jī)狀態(tài),所以,如果你不了解服務(wù)器的硬件情況,了解一下這里的IT架構(gòu)和具體的硬件信息是很有必要的。諸如網(wǎng)絡(luò)狀態(tài)、有沒(méi)有不間斷電源、硬盤是否支持熱插拔、服務(wù)器是不是HA高可用集群等問(wèn)題。
摸清表層
即便只是看清表層,我們也需要盡可能多的了解有用信息,例如:服務(wù)器何時(shí)故障的?故障表現(xiàn)是什么?故障有沒(méi)有呈現(xiàn)規(guī)律性?上一次更新是什么時(shí)候,更新了什么等問(wèn)題。畢竟服務(wù)器不是電腦,如果你沒(méi)搞清楚狀況就進(jìn)行強(qiáng)行關(guān)機(jī),很可能造成數(shù)據(jù)丟失,而且還沒(méi)解決問(wèn)題。要記住,服務(wù)器是7*24小時(shí)開(kāi)機(jī)的存在。
只有了解了服務(wù)器故障的基本邏輯,查看了日志等信息,盡可能的了解問(wèn)題所在,才能給出具體的解決方案。
了解過(guò)去
我們常說(shuō)以史為鑒或者讀史使人明志,其中都體現(xiàn)了了解過(guò)去的重要性。所以我們要先看一下過(guò)去都發(fā)什么可什么。查看歷史操作記錄,可以了解過(guò)去有誰(shuí)登陸了,都執(zhí)行了那些命令,更多的信息對(duì)于你的判斷準(zhǔn)確性由很大的提升。但是,作為admin用戶,在查看歷史記錄時(shí),要注意不要利用自己的權(quán)限去侵犯別人的隱私。
看清現(xiàn)狀
做過(guò)了以上的準(zhǔn)備,你還需要檢查一下現(xiàn)在有沒(méi)有其他人在線。如果有人正在在服務(wù)器上工作,而你卻莽撞的對(duì)服務(wù)器進(jìn)行其他更改,那你可能要面臨一個(gè)很糟糕的情況。除了看誰(shuí)在線之外,你還可以了解一下誰(shuí)登錄過(guò)。另外,還要看清現(xiàn)在有哪些程序正在運(yùn)行,并作出相應(yīng)的調(diào)整。
然后你就可以根據(jù)自己的判斷,對(duì)服務(wù)器進(jìn)行修復(fù)了。
切記,在服務(wù)器上,拍一拍和萬(wàn)能的重啟都是莽撞之舉,在服務(wù)器出現(xiàn)故障時(shí),要了解服務(wù)器故障的具體原因,方能對(duì)癥下藥。