主頁(yè) > 知識(shí)庫(kù) > gbk utf8如何選擇 正確理解和使用GBK及UTF-8網(wǎng)頁(yè)編碼

gbk utf8如何選擇 正確理解和使用GBK及UTF-8網(wǎng)頁(yè)編碼

熱門(mén)標(biāo)簽:電銷(xiāo)機(jī)器人外呼失敗怎么回事 吃雞地圖標(biāo)注設(shè)置 400電話座機(jī)怎么辦理 400電話申請(qǐng)好不好 縣域地圖標(biāo)注點(diǎn) 南寧銷(xiāo)售外呼系統(tǒng)線路商 天津銷(xiāo)售電銷(xiāo)機(jī)器人公司 齊齊哈爾地圖標(biāo)注地點(diǎn) 邵陽(yáng)市地圖標(biāo)注app
網(wǎng)頁(yè)編碼英文譯為web page encoding,是在網(wǎng)頁(yè)中指定其特定的字符編碼格式的庫(kù)。
GBK是國(guó)家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)。GBK的文字編碼是用雙字節(jié)來(lái)表示的,即不論中、英文字符均使用雙字節(jié)來(lái)表示,為了區(qū)分中文,將其最高位都設(shè)定成1。GBK包含全部中文字符,是國(guó)家編碼,通用性比UTF8差,不過(guò)UTF8占用的數(shù)據(jù)庫(kù)比GBK大。

UTF-8:Unicode TransformationFormat-8bit,允許含BOM,但通常不含BOM。是用以解決國(guó)際上字符的一種多字節(jié)編碼,它對(duì)英文使用8位(即一個(gè)字節(jié)),中文使用24為(三個(gè)字節(jié))來(lái)編碼。UTF-8包含全世界所有國(guó)家需要用到的字符,是國(guó)際編碼,通用性強(qiáng)。UTF-8編碼的文字可以在各國(guó)支持UTF8字符集的瀏覽器上顯示。如果是UTF8編碼,則在外國(guó)人的英文IE上也能顯示中文,他們無(wú)需下載IE的中文語(yǔ)言支持包。
UTF-8版本雖然具有良好的國(guó)際兼容性,但中文需要比GBK/BIG5版本多占用50%的數(shù)據(jù)庫(kù)存儲(chǔ)空間,因此并非推薦使用,僅供對(duì)國(guó)際兼容性有特殊要求的用戶使用。簡(jiǎn)單地說(shuō):對(duì)于中文較多的網(wǎng)站,適宜用GBK編碼節(jié)省數(shù)據(jù)庫(kù)空間。對(duì)于英文較多的網(wǎng)站,適宜用UTF-8節(jié)省數(shù)據(jù)庫(kù)空間。

GBK、GB2312等與UTF8如何轉(zhuǎn)換?GBK、GB2312等與UTF8之間都必須通過(guò)Unicode編碼才能相互轉(zhuǎn)換:GBK、GB2312——Unicode——UTF8;UTF8——Unicode——GBK、GB2312。使用Windows記事本的“另存為”,可以在GBK、Unicode、Unicode big endian和UTF-8這幾種編碼方式間相互轉(zhuǎn)換。

如何讓瀏覽器正確識(shí)別網(wǎng)頁(yè)編碼?一般在網(wǎng)頁(yè)中都要有如下一句:<meta http-equiv="Content-Type" content="text/html; charset=gb2312">,指示此網(wǎng)頁(yè)的字符集編碼是GB2312。(或者UTF-8)
頁(yè)面有時(shí)候指定了編碼為什么有時(shí)會(huì)出現(xiàn)亂碼?這可能是頁(yè)面申明編碼與文件本身編碼不一致,更多時(shí)候是以錯(cuò)誤編碼打開(kāi)頁(yè)面然后保存導(dǎo)致的,或者是用某些FTP軟件直接在線修改文件,比如CuteFTP,由于軟件編碼配置錯(cuò)誤而導(dǎo)致轉(zhuǎn)換錯(cuò)了編碼。這時(shí)候使用window的記事本打開(kāi),用“另存為”保存為對(duì)應(yīng)的編碼即可解決問(wèn)題。

在windows操作系統(tǒng)上使用IE作為瀏覽器時(shí),常常會(huì)發(fā)生這樣的問(wèn)題:在瀏覽使用UTF-8編碼的網(wǎng)頁(yè)時(shí),瀏覽器無(wú)法自動(dòng)識(shí)別該頁(yè)面所用的編碼,即使網(wǎng)頁(yè)已經(jīng)聲明過(guò)編碼格式:<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />,由此造成某些含有中文UTF-8編碼的頁(yè)面產(chǎn)生空白輸出。如果使用的是Firefox、Sarafi的瀏覽器這不會(huì)造成這個(gè)問(wèn)題。這是由于IE解析網(wǎng)頁(yè)編碼時(shí)以HTML內(nèi)的標(biāo)簽優(yōu)先,而后才是HTTP header內(nèi)的訊息,而mozilla系列的瀏覽器則剛剛相反。

由于UTF-8為3個(gè)字節(jié)表示一個(gè)漢子,而普通的GB2312或BIG5是兩個(gè)。頁(yè)面輸出時(shí),由于上述原因,使瀏覽器解析、輸出<title></title>的內(nèi)容時(shí),如果在</title>前有奇數(shù)個(gè)全角字符,IE把UTF-8當(dāng)作兩個(gè)字節(jié)解析時(shí)出現(xiàn)半個(gè)漢字的情況,這時(shí)該半個(gè)漢字會(huì)和</title>的<結(jié)合成一個(gè)亂碼字,導(dǎo)致IE無(wú)法讀完<title>部分,使整個(gè)頁(yè)面為空百輸出,而這個(gè)時(shí)候如果察看源文件的話,會(huì)發(fā)現(xiàn)實(shí)際上整個(gè)頁(yè)面全部已經(jīng)輸出了,但瀏覽器不顯示內(nèi)容。最簡(jiǎn)單的解決辦法是把<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 放在<title></title>之前。

標(biāo)簽:延安 贛州 衡水 日照 濟(jì)寧 ???/a> 寧波 寧夏

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《gbk utf8如何選擇 正確理解和使用GBK及UTF-8網(wǎng)頁(yè)編碼》,本文關(guān)鍵詞  gbk,utf8,如何,選擇,正確理解,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《gbk utf8如何選擇 正確理解和使用GBK及UTF-8網(wǎng)頁(yè)編碼》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于gbk utf8如何選擇 正確理解和使用GBK及UTF-8網(wǎng)頁(yè)編碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章