在UNIX 系統(tǒng)中,一個(gè)進(jìn)程結(jié)束了,但是他的父進(jìn)程沒(méi)有等待(調(diào)用wait / waitpid)他, 那么他將變成一個(gè)僵尸進(jìn)程. 在fork()/execve()過(guò)程中,假設(shè)子進(jìn)程結(jié)束時(shí)父進(jìn)程仍存在,而父進(jìn)程fork()之前既沒(méi)安裝SIGCHLD信號(hào)處理函數(shù)調(diào)用 waitpid()等待子進(jìn)程結(jié)束,又沒(méi)有顯式忽略該信號(hào),則子進(jìn)程成為僵尸進(jìn)程。
一個(gè)進(jìn)程在調(diào)用exit命令結(jié)束自己的生命的時(shí)候,其實(shí)它并沒(méi)有真正的被銷毀, 而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,它的作用是 使進(jìn)程退出,但也僅僅限于將一個(gè)正常的進(jìn)程變成一個(gè)僵尸進(jìn)程,并不能將其完全銷毀)
進(jìn)程的危害
由于子進(jìn)程的結(jié)束和父進(jìn)程的運(yùn)行是一個(gè)異步過(guò)程,即父進(jìn)程永遠(yuǎn)無(wú)法預(yù)測(cè)子進(jìn)程 到底什么時(shí)候結(jié)束. 那么會(huì)不會(huì)因?yàn)楦高M(jìn)程太忙來(lái)不及wait子進(jìn)程,或者說(shuō)不知道 子進(jìn)程什么時(shí)候結(jié)束,而丟失子進(jìn)程結(jié)束時(shí)的狀態(tài)信息呢? 不會(huì)。因?yàn)閁NⅨ提供了一種機(jī)制可以保證只要父進(jìn)程想知道子進(jìn)程結(jié)束時(shí)的狀態(tài)信息, 就可以得到。這種機(jī)制就是: 在每個(gè)進(jìn)程退出的時(shí)候,內(nèi)核釋放該進(jìn)程所有的資源,包括打開(kāi)的文件,占用的內(nèi)存等。但是仍然為其保留一定的信息(包括進(jìn)程號(hào)the process ID,退出狀態(tài)the termination status of the process,運(yùn)行時(shí)間the amount of CPU time taken by the process等)。直到父進(jìn)程通過(guò)wait / waitpid來(lái)取時(shí)才釋放. 但這樣就導(dǎo)致了問(wèn)題,如果進(jìn)程不調(diào)用wait / waitpid的話,那么保留的那段信息就不會(huì)釋放,其進(jìn)程號(hào)就會(huì)一直被占用,但是系統(tǒng)所能使用的進(jìn)程號(hào)是有限的,如果大量的產(chǎn)生僵死進(jìn)程,將因?yàn)闆](méi)有可用的進(jìn)程號(hào)而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程. 此即為僵尸進(jìn)程的危害,應(yīng)當(dāng)避免。
1、如何查看僵尸進(jìn)程?
如何查看linux系統(tǒng)上的僵尸進(jìn)程,如何統(tǒng)計(jì)有多少僵尸進(jìn)程?
#ps -ef | grep defunct
或者查找狀態(tài)為Z的進(jìn)程,Z就是代表zombie process,僵尸進(jìn)程的意思。
另外使用top命令查看時(shí)有一欄為S,如果狀態(tài)為Z說(shuō)明它就是僵尸進(jìn)程。
Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie
top命令中也統(tǒng)計(jì)了僵尸進(jìn)程?;蛘呤褂孟旅娴拿睿?br />
ps -ef | grep defunct | grep -v grep | wc -l
2、如何殺死僵尸進(jìn)程?
一般僵尸進(jìn)程很難直接kill掉,不過(guò)您可以kill僵尸爸爸。父進(jìn)程死后,僵尸進(jìn)程成為”孤兒進(jìn)程”,過(guò)繼給1號(hào)進(jìn)程init,init始終會(huì)負(fù)責(zé)清理僵尸進(jìn)程.它產(chǎn)生的所有僵尸進(jìn)程也跟著消失。
ps -e -o ppid,stat | grep Z | cut –d” ” -f2 | xargs kill -9
或
kill -HUP `ps -A -ostat,ppid | grep -e ’^[Zz]‘ | awk ’{print $2}’`
當(dāng)然您可以自己編寫更好的shell腳本,歡迎與大家分享。
另外子進(jìn)程死后,會(huì)發(fā)送SIGCHLD信號(hào)給父進(jìn)程,父進(jìn)程收到此信號(hào)后,執(zhí)行waitpid()函數(shù)為子進(jìn)程收尸。就是基于這樣的原理:就算父進(jìn)程沒(méi)有調(diào)用wait,內(nèi)核也會(huì)向它發(fā)送SIGCHLD消息,而此時(shí),盡管對(duì)它的默認(rèn)處理是忽略,如果想響應(yīng)這個(gè)消息,可以設(shè)置一個(gè)處理函數(shù)。
3、如何避免僵尸進(jìn)程?
處理SIGCHLD信號(hào)并不是必須的。但對(duì)于某些進(jìn)程,特別是服務(wù)器進(jìn)程往往在請(qǐng)求到來(lái)時(shí)生成子進(jìn)程處理請(qǐng)求。如果父進(jìn)程不等待子進(jìn)程結(jié) 束,子進(jìn)程將成為僵尸進(jìn)程(zombie)從而占用系統(tǒng)資源。如果父進(jìn)程等待子進(jìn)程結(jié)束,將增加父進(jìn)程的負(fù)擔(dān),影響服務(wù)器進(jìn)程的并發(fā)性能。在Linux下 可以簡(jiǎn)單地將 SIGCHLD信號(hào)的操作設(shè)為SIG_IGN。
signal(SIGCHLD,SIG_IGN);
這樣,內(nèi)核在子進(jìn)程結(jié)束時(shí)不會(huì)產(chǎn)生僵尸進(jìn)程。這一點(diǎn)與BSD4不同,BSD4下必須顯式等待子進(jìn)程結(jié)束才能釋放僵尸進(jìn)程
或者
用兩次fork(),而且使緊跟的子進(jìn)程直接退出,是的孫子進(jìn)程成為孤兒進(jìn)程,從而init進(jìn)程將負(fù)責(zé)清除這個(gè)孤兒進(jìn)程。