剛從山東回來,一堆麻煩事情。這不,快要下班了,客戶說oraclerac掛了。這是有兩個(gè)節(jié)點(diǎn)和一個(gè)共享存儲(chǔ)組成的rac系統(tǒng),安裝了oracle11gr2.我試著登錄系統(tǒng)查看,發(fā)
剛從山東回來,一堆麻煩事情。這不,快要下班了,客戶說oracle rac掛了。
這是有兩個(gè)節(jié)點(diǎn)和一個(gè)共享存儲(chǔ)組成的rac系統(tǒng),安裝了oracle 11g r2.我試著登錄系統(tǒng)查看,發(fā)現(xiàn)一個(gè)服務(wù)器不能聯(lián)通。另一個(gè)上去了,執(zhí)行df -h ,發(fā)現(xiàn)一個(gè)分區(qū) /tmp被塞滿了。再進(jìn)子目錄查看,發(fā)現(xiàn)一堆0926.dmp這樣的文件,每個(gè)文件大小都在600M左右。看來是程序員在執(zhí)行exp備份操作,一問,服務(wù)器空間,果然如此。
再?gòu)膔ac的私有網(wǎng)絡(luò),試著登錄另一個(gè)節(jié)點(diǎn),居然進(jìn)去了。這說明心跳檢查是正常的。
在跟其他人溝通后,我采取如下步驟:
1、清理/tmp空間,香港空間,手動(dòng)刪除陳舊的文件,釋放出至少50%的空間。
2、關(guān)閉所有oracle實(shí)例 srvctl stop instance -d sery_db -i sery1 , srvctl stop instance -d sery_db -i sery2.
3、查看不能從外面訪問的那個(gè)服務(wù)器的網(wǎng)絡(luò)狀態(tài),香港服務(wù)器租用,檢查方法為:
(1)ip add 檢查地址是否存在
(2)mii-tool 檢查網(wǎng)線是否正常
(3)service network start 重啟網(wǎng)絡(luò).嘿嘿,居然正常了。
4、檢查asm文件系統(tǒng),步驟為:
(1)ps aux | grep asm檢查進(jìn)程
(2) su - grid ; asmcmd 進(jìn)去查看日志文件、數(shù)據(jù)文件是否存在。還好它們都在呢。
5、啟動(dòng)實(shí)例,然后用sqlplus登錄檢查數(shù)據(jù)文件等。
主要原因:oracle會(huì)根據(jù)需要往/tmp分區(qū)寫入數(shù)據(jù)(比如排序等中間過程),如果文件系統(tǒng)滿了,則寫入失敗,可能導(dǎo)致會(huì)話掛起。
本文出自 “sery” 博客,請(qǐng)務(wù)必保留此出處
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com