在網(wǎng)絡(luò)中,不少服務(wù)器采用的是Linux系統(tǒng)。為了進(jìn)一步提高服務(wù)器的性能,可能需要根據(jù)特定的硬件及需求重新編譯Linux內(nèi)核。編譯Linux內(nèi)核,需要根據(jù)規(guī)定的步驟進(jìn)行,編譯內(nèi)核過程中涉及到幾個(gè)重要的文件。比如對(duì)于RedHat Linux,在/boot目錄下有一些與Linux內(nèi)核有關(guān)的文件,進(jìn)入/boot執(zhí)行。
編譯過RedHat Linux內(nèi)核的人對(duì)其中的System.map、vmlinuz、initrd-2.4.7-10.img印象可能比較深刻,因?yàn)榫幾g內(nèi)核過程中涉及到這些文件的建立等操作。那么這幾個(gè)文件是怎么產(chǎn)生的?又有什么作用呢?本文對(duì)此做些介紹。
一、vmlinuz
vmlinuz是可引導(dǎo)的、壓縮的內(nèi)核。“vm”代表“Virtual Memory”。Linux 支持虛擬內(nèi)存,不像老的操作系統(tǒng)比如DOS有640KB內(nèi)存的限制。Linux能夠使用硬盤空間作為虛擬內(nèi)存,因此得名“vm”。vmlinuz是可執(zhí)行的Linux內(nèi)核,它位于/boot/vmlinuz,它一般是一個(gè)軟鏈接,比如圖中是vmlinuz-2.4.7-10的軟鏈接。
vmlinuz的建立有兩種方式。一是編譯內(nèi)核時(shí)通過“make zImage”創(chuàng)建,然后通過:“cp /usr/src/linux-2.4/arch/i386/linux/boot/zImage/boot/vmlinuz”產(chǎn)生。zImage適用于小內(nèi)核的情況,它的存在是為了向后的兼容性。
二是內(nèi)核編譯時(shí)通過命令make bzImage創(chuàng)建,然后通過:“cp/usr/src/linux-2.4/arch/i386/linux/boot/bzImage /boot/vmlinuz”產(chǎn)生。bzImage是壓縮的內(nèi)核映像,需要注意,bzImage不是用bzip2壓縮的,bzImage中的bz容易引起誤解,bz表示“big zImage”。 bzImage中的b是“big”意思。 zImage(vmlinuz)和bzImage(vmlinuz)都是用gzip壓縮的。它們不僅是一個(gè)壓縮文件,而且在這兩個(gè)文件的開頭部分內(nèi)嵌有 gzip解壓縮代碼。所以你不能用gunzip 或 gzip –dc解包vmlinuz。
內(nèi)核文件中包含一個(gè)微型的gzip用于解壓縮內(nèi)核并引導(dǎo)它。兩者的不同之處在于,老的zImage解壓縮內(nèi)核到低端內(nèi)存(第一個(gè)640K),bzImage解壓縮內(nèi)核到高端內(nèi)存(1M以上)。如果內(nèi)核比較小,那么可以采用zImage或bzImage之一,兩種方式引導(dǎo)的系統(tǒng)運(yùn)行時(shí)是相同的。大的內(nèi)核采用bzImage,不能采用zImage。 vmlinux是未壓縮的內(nèi)核,vmlinuz是vmlinux的壓縮文件。
二、initrd-x.x.x.img
initrd是“initial ramdisk”的簡(jiǎn)寫。initrd一般被用來臨時(shí)的引導(dǎo)硬件到實(shí)際內(nèi)核vmlinuz能夠接管并繼續(xù)引導(dǎo)的狀態(tài)。圖中的initrd-2.4.7-10.img主要是用于加載ext3等文件系統(tǒng)及scsi設(shè)備的驅(qū)動(dòng)。
比如,使用的是scsi硬盤,而內(nèi)核vmlinuz中并沒有這個(gè)scsi硬件的驅(qū)動(dòng),那么在裝入scsi模塊之前,內(nèi)核不能加載根文件系統(tǒng),但scsi 模塊存儲(chǔ)在根文件系統(tǒng)的/lib/modules下。為了解決這個(gè)問題,可以引導(dǎo)一個(gè)能夠讀實(shí)際內(nèi)核的initrd內(nèi)核并用initrd修正scsi引導(dǎo)問題。initrd-2.4.7-10.img是用gzip壓縮的文件,initrd實(shí)現(xiàn)加載一些模塊和安裝文件系統(tǒng)等功能。
initrd映象文件是使用mkinitrd創(chuàng)建的。mkinitrd實(shí)用程序能夠創(chuàng)建initrd映象文件。這個(gè)命令是RedHat專有的。其它 Linux發(fā)行版或許有相應(yīng)的命令。這是個(gè)很方便的實(shí)用程序。具體情況請(qǐng)看幫助:man mkinitrd下面的命令創(chuàng)建initrd映象文件。
三、System.map
System.map是一個(gè)特定內(nèi)核的內(nèi)核符號(hào)表。它是你當(dāng)前運(yùn)行的內(nèi)核的System.map的鏈接。
內(nèi)核符號(hào)表是怎么創(chuàng)建的呢? System.map是由“nm vmlinux”產(chǎn)生并且不相關(guān)的符號(hào)被濾出。
對(duì)于本文中的例子,編譯內(nèi)核時(shí),System.map創(chuàng)建在/usr/src/linux-2.4/System.map。像下面這樣:
nm /boot/vmlinux-2.4.7-10 > System.map
下面幾行來自/usr/src/linux-2.4/Makefile:
nm vmlinux | grep -v '\(compiled\)\|\(\.o$$\)\|\( [aUw] \)\|\(\.\.ng$$\)\|\(LASH[RL]DI\)' | sort > System.map
然后復(fù)制到/boot:
cp /usr/src/linux/System.map /boot/System.map-2.4.7-10
下圖是System.map文件的一部分:
在進(jìn)行程序設(shè)計(jì)時(shí),會(huì)命名一些變量名或函數(shù)名之類的符號(hào)。Linux內(nèi)核是一個(gè)很復(fù)雜的代碼塊,有許許多多的全局符號(hào)。
Linux內(nèi)核不使用符號(hào)名,而是通過變量或函數(shù)的地址來識(shí)別變量或函數(shù)名。比如不是使用size_t BytesRead這樣的符號(hào),而是像c0343f20這樣引用這個(gè)變量。
對(duì)于使用計(jì)算機(jī)的人來說,更喜歡使用那些像size_t BytesRead這樣的名字,而不喜歡像c0343f20這樣的名字。內(nèi)核主要是用c寫的,所以編譯器/連接器允許我們編碼時(shí)使用符號(hào)名,當(dāng)內(nèi)核運(yùn)行時(shí)使用地址。
然而,在有的情況下,我們需要知道符號(hào)的地址,或者需要知道地址對(duì)應(yīng)的符號(hào)。這由符號(hào)表來完成,符號(hào)表是所有符號(hào)連同它們的地址的列表。上圖就是一個(gè)內(nèi)核符號(hào)表,由上圖可知變量名checkCPUtype在內(nèi)核地址c01000a5。
Linux 符號(hào)表使用到2個(gè)文件:
/proc/ksyms/p>
p> System.map
/proc/ksyms是一個(gè)“proc file”,在內(nèi)核引導(dǎo)時(shí)創(chuàng)建。實(shí)際上,它并不真正的是一個(gè)文件,它只不過是內(nèi)核數(shù)據(jù)的表示,卻給人們是一個(gè)磁盤文件的假象,這從它的文件大小是0可以看出來。然而,System.map是存在于你的文件系統(tǒng)上的實(shí)際文件。
當(dāng)你編譯一個(gè)新內(nèi)核時(shí),各個(gè)符號(hào)名的地址要發(fā)生變化,你的老的System.map具有的是錯(cuò)誤的符號(hào)信息。每次內(nèi)核編譯時(shí)產(chǎn)生一個(gè)新的System.map,你應(yīng)當(dāng)用新的System.map來取代老的System.map。
雖然內(nèi)核本身并不真正使用System.map,但其它程序比如klogd,lsof和ps等軟件需要一個(gè)正確的System.map。如果你使用錯(cuò)誤的或沒有System.map,klogd的輸出將是不可靠的,這對(duì)于排除程序故障會(huì)帶來困難。沒有System.map,你可能會(huì)面臨一些令人煩惱的提示信息。
另外少數(shù)驅(qū)動(dòng)需要System.map來解析符號(hào),沒有為你當(dāng)前運(yùn)行的特定內(nèi)核創(chuàng)建的System.map它們就不能正常工作。
Linux的內(nèi)核日志守護(hù)進(jìn)程klogd為了執(zhí)行名稱-地址解析,klogd需要使用System.map。System.map應(yīng)當(dāng)放在使用它的軟件能夠找到它的地方。執(zhí)行:man klogd可知,如果沒有將System.map作為一個(gè)變量的位置給klogd,那么它將按照下面的順序,在三個(gè)地方查找System.map:
/boot/System.map/p>
p> /System.map/p>
p> /usr/src/linux/System.map
System.map也有版本信息,klogd能夠智能地查找正確的映象(map)文件。