cmd/compile 包含構(gòu)成 Go 編譯器主要的包。編譯器在邏輯上可以被分為四個(gè)階段,我們將簡(jiǎn)要介紹這幾個(gè)階段以及包含相應(yīng)代碼的包的列表。
在談到編譯器時(shí),有時(shí)可能會(huì)聽(tīng)到 前端(front-end)和 后端(back-end)這兩個(gè)術(shù)語(yǔ)。粗略地說(shuō),這些對(duì)應(yīng)于我們將在此列出的前兩個(gè)和后兩個(gè)階段。第三個(gè)術(shù)語(yǔ) 中間端(middle-end)通常指的是第二階段執(zhí)行的大部分工作。
請(qǐng)注意,go/parser 和 go/types 等 go/* 系列的包與編譯器無(wú)關(guān)。由于編譯器最初是用 C 編寫(xiě)的,所以這些 go/* 包被開(kāi)發(fā)出來(lái)以便于能夠?qū)懗龊?Go 代碼一起工作的工具,例如 gofmt 和 vet。
需要澄清的是,名稱(chēng) “gc” 代表 “ Go 編譯器(Go compiler)”,與大寫(xiě) GC 無(wú)關(guān),后者代表 垃圾收集(garbage collection)。
1、解析
- cmd/compile/internal/syntax( 詞法分析器(lexer)、 解析器(parser)、 語(yǔ)法樹(shù)(syntax tree))
在編譯的第一階段,源代碼被標(biāo)記化(詞法分析)、解析(語(yǔ)法分析),并為每個(gè)源文件構(gòu)造語(yǔ)法樹(shù)(譯注:這里標(biāo)記指 token,它是一組預(yù)定義的、能夠識(shí)別的字符串,通常由名字和值構(gòu)成,其中名字一般是詞法的類(lèi)別,如標(biāo)識(shí)符、關(guān)鍵字、分隔符、操作符、文字和注釋等;語(yǔ)法樹(shù),以及下文提到的 抽象語(yǔ)法樹(shù)(Abstract Syntax Tree)(AST),是指用樹(shù)來(lái)表達(dá)程序設(shè)計(jì)語(yǔ)言的語(yǔ)法結(jié)構(gòu),通常葉子節(jié)點(diǎn)是操作數(shù),其它節(jié)點(diǎn)是操作碼)。
每個(gè)語(yǔ)法樹(shù)都是相應(yīng)源文件的確切表示,其中節(jié)點(diǎn)對(duì)應(yīng)于源文件的各種元素,例如表達(dá)式、聲明和語(yǔ)句。語(yǔ)法樹(shù)還包括位置信息,用于錯(cuò)誤報(bào)告和創(chuàng)建調(diào)試信息。
2、類(lèi)型檢查和 AST 變換
- cmd/compile/internal/gc(創(chuàng)建編譯器 AST, 類(lèi)型檢查(type-checking), AST 變換(AST transformation))
gc 包中包含一個(gè)繼承自(早期)C 語(yǔ)言實(shí)現(xiàn)的版本的 AST 定義。所有代碼都是基于它編寫(xiě)的,所以 gc 包必須做的第一件事就是將 syntax 包(定義)的語(yǔ)法樹(shù)轉(zhuǎn)換為編譯器的 AST 表示法。這個(gè)額外步驟可能會(huì)在將來(lái)重構(gòu)。
然后對(duì) AST 進(jìn)行類(lèi)型檢查。第一步是名字解析和類(lèi)型推斷,它們確定哪個(gè)對(duì)象屬于哪個(gè)標(biāo)識(shí)符,以及每個(gè)表達(dá)式具有的類(lèi)型。類(lèi)型檢查包括特定的額外檢查,例如“聲明但未使用”以及確定函數(shù)是否會(huì)終止。
特定變換也基于 AST 完成。一些節(jié)點(diǎn)被基于類(lèi)型信息而細(xì)化,例如把字符串加法從算術(shù)加法的節(jié)點(diǎn)類(lèi)型中拆分出來(lái)。其它一些例子是 死代碼消除(dead code elimination), 函數(shù)調(diào)用內(nèi)聯(lián)(function call inlining)和 逃逸分析(escape analysis)(譯注:逃逸分析是一種分析指針有效范圍的方法)。
3、通用 SSA
- cmd/compile/internal/gc(轉(zhuǎn)換成 SSA)
- cmd/compile/internal/ssa(SSA 相關(guān)的 環(huán)節(jié)(pass)和規(guī)則)
(譯注:許多常見(jiàn)高級(jí)語(yǔ)言的編譯器無(wú)法通過(guò)一次掃描源代碼或 AST 就完成所有編譯工作,取而代之的做法是多次掃描,每次完成一部分工作,并將輸出結(jié)果作為下次掃描的輸入,直到最終產(chǎn)生目標(biāo)代碼。這里每次掃描稱(chēng)作一個(gè) 環(huán)節(jié)(pass);最后一個(gè)環(huán)節(jié)之前所有的環(huán)節(jié)得到的結(jié)果都可稱(chēng)作中間表示法,本文中 AST、SSA 等都屬于中間表示法。SSA,靜態(tài)單賦值形式,是中間表示法的一種性質(zhì),它要求每個(gè)變量只被賦值一次且在使用前被定義)。
在此階段,AST 將被轉(zhuǎn)換為 靜態(tài)單賦值(Static Single Assignment)(SSA)形式,這是一種具有特定屬性的低級(jí) 中間表示法(intermediate representation),可以更輕松地實(shí)現(xiàn)優(yōu)化并最終從它生成機(jī)器碼。
在這個(gè)轉(zhuǎn)換過(guò)程中,將完成 內(nèi)置函數(shù)(function intrinsics)的處理。這些是特殊的函數(shù),編譯器被告知逐個(gè)分析這些函數(shù)并決定是否用深度優(yōu)化的代碼替換它們(譯注:內(nèi)置函數(shù)指由語(yǔ)言本身定義的函數(shù),通常編譯器的處理方式是使用相應(yīng)實(shí)現(xiàn)函數(shù)的指令序列代替對(duì)函數(shù)的調(diào)用指令,有點(diǎn)類(lèi)似內(nèi)聯(lián)函數(shù))。
在 AST 轉(zhuǎn)化成 SSA 的過(guò)程中,特定節(jié)點(diǎn)也被低級(jí)化為更簡(jiǎn)單的組件,以便于剩余的編譯階段可以基于它們工作。例如,內(nèi)建的拷貝被替換為內(nèi)存移動(dòng),range 循環(huán)被改寫(xiě)為 for 循環(huán)。由于歷史原因,目前這里面有些在轉(zhuǎn)化到 SSA 之前發(fā)生,但長(zhǎng)期計(jì)劃則是把它們都移到這里(轉(zhuǎn)化 SSA)。
然后,一系列機(jī)器無(wú)關(guān)的規(guī)則和編譯環(huán)節(jié)會(huì)被執(zhí)行。這些并不考慮特定計(jì)算機(jī)體系結(jié)構(gòu),因此對(duì)所有 GOARCH 變量的值都會(huì)運(yùn)行。
這類(lèi)通用的編譯環(huán)節(jié)的一些例子包括,死代碼消除、移除不必要的空值檢查,以及移除無(wú)用的分支等。通用改寫(xiě)規(guī)則主要考慮表達(dá)式,例如將一些表達(dá)式替換為常量,優(yōu)化乘法和浮點(diǎn)操作。
4、生成機(jī)器碼
- cmd/compile/internal/ssa(SSA 低級(jí)化和架構(gòu)特定的環(huán)節(jié))
- cmd/internal/obj(機(jī)器碼生成)
編譯器中機(jī)器相關(guān)的階段開(kāi)始于“低級(jí)”的編譯環(huán)節(jié),該階段將通用變量改寫(xiě)為它們的特定的機(jī)器碼形式。例如,在 amd64 架構(gòu)中操作數(shù)可以在內(nèi)存中操作,這樣許多 加載-存儲(chǔ)(load-store)操作就可以被合并。
注意低級(jí)的編譯環(huán)節(jié)運(yùn)行所有機(jī)器特定的重寫(xiě)規(guī)則,因此當(dāng)前它也應(yīng)用了大量?jī)?yōu)化。
一旦 SSA 被“低級(jí)化”并且更具體地針對(duì)目標(biāo)體系結(jié)構(gòu),就要運(yùn)行最終代碼優(yōu)化的編譯環(huán)節(jié)了。這包含了另外一個(gè)死代碼消除的環(huán)節(jié),它將變量移動(dòng)到更靠近它們使用的地方,移除從來(lái)沒(méi)有被讀過(guò)的局部變量,以及 寄存器(register)分配。
本步驟中完成的其它重要工作包括 堆棧布局(stack frame layout),它將堆棧偏移位置分配給局部變量,以及 指針活性分析(pointer liveness analysis),后者計(jì)算每個(gè)垃圾收集安全點(diǎn)上的哪些堆棧上的指針仍然是活動(dòng)的。
在 SSA 生成階段結(jié)束時(shí),Go 函數(shù)已被轉(zhuǎn)換為一系列 obj.Prog 指令。它們被傳遞給匯編程序(cmd/internal/obj),后者將它們轉(zhuǎn)換為機(jī)器碼并輸出最終的目標(biāo)文件。目標(biāo)文件還將包含反射數(shù)據(jù),導(dǎo)出數(shù)據(jù)和調(diào)試信息。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
您可能感興趣的文章:- golang flag簡(jiǎn)單用法
- Golang中定時(shí)器的陷阱詳解
- 在golang中操作mysql數(shù)據(jù)庫(kù)的實(shí)現(xiàn)代碼
- golang設(shè)置http response響應(yīng)頭與填坑記錄
- 詳解Golang實(shí)現(xiàn)http重定向https的方式
- Golang學(xué)習(xí)之平滑重啟