1.
前幾天,我才知道有一種簡(jiǎn)化的數(shù)據(jù)交換格式,叫做yaml。
我翻了一遍它的文檔,看懂的地方不多,但是有一句話令我茅塞頓開(kāi)。
它說(shuō),從結(jié)構(gòu)上看,所有的數(shù)據(jù)最終都可以分成三種類(lèi)型:
第一種類(lèi)型是scalar(標(biāo)量),也就是一個(gè)單獨(dú)的string(字符串)或數(shù)字(numbers),比如“北京”這個(gè)單獨(dú)的詞。
第二種類(lèi)型是sequence(序列),也就是若干個(gè)相關(guān)的數(shù)據(jù)按照一定順序并列在一起,又叫做array(數(shù)組)或List(列表),比如“北京,東京”。
第三種類(lèi)型是mapping(映射),也就是一個(gè)名/值對(duì)(Name/value),即數(shù)據(jù)有一個(gè)名稱(chēng),還有一個(gè)與之相對(duì)應(yīng)的值,這又稱(chēng)作hash(散列)或dictionary(字典),比如“首都:北京”。
我恍然大悟,數(shù)據(jù)構(gòu)成的最小單位原來(lái)如此簡(jiǎn)單!難怪在編程語(yǔ)言中,只要有了數(shù)組(array)和對(duì)象(object)就能夠儲(chǔ)存一切數(shù)據(jù)了。
2.
我馬上想到了json。
21世紀(jì)初,Douglas Crockford尋找一種簡(jiǎn)便的數(shù)據(jù)交換格式,能夠在服務(wù)器之間交換數(shù)據(jù)。這其實(shí)需要二步,第一步是將各種數(shù)據(jù)轉(zhuǎn)化為一個(gè)字符串,也就是數(shù)據(jù)的串行化(serialization),第二步才是交換這個(gè)字符串。
當(dāng)時(shí)通用的數(shù)據(jù)交換語(yǔ)言是XML,但是Douglas Crockford覺(jué)得XML的生成和解析都太麻煩,所以他提出了一種簡(jiǎn)化格式,也就是Json。
Json的規(guī)格非常簡(jiǎn)單,只用一個(gè)頁(yè)面、幾百個(gè)字就能說(shuō)清楚,而且Douglas Crockford聲稱(chēng)這個(gè)規(guī)格永遠(yuǎn)不必升級(jí),因?yàn)樵撘?guī)定的都規(guī)定了。
1) 并列的數(shù)據(jù)之間用逗號(hào)(“,”)分隔。
2) 映射用冒號(hào)(“:”)表示。
3) 并列數(shù)據(jù)的集合(數(shù)組)用方括號(hào)("[]")表示。
4) 映射的集合(對(duì)象)用大括號(hào)(“{}”)表示。
上面四條規(guī)則,就是Json格式的所有內(nèi)容。
比如,下面這句話:
“北京市的面積為16800平方公里,常住人口1600萬(wàn)人。上海市的面積為6400平方公里,常住人口1800萬(wàn)?!?/P>
寫(xiě)成json格式就是這樣:
[
{"城市":"北京","面積":16800,"人口":1600},
{"城市":"上海","面積":6400,"人口":1800}
]
如果事先知道數(shù)據(jù)的結(jié)構(gòu),上面的寫(xiě)法還可以進(jìn)一步簡(jiǎn)化:
[
["北京",16800,1600],
["上海",6400,1800]
]
由此可以看到,json非常易學(xué)易用。所以,在短短幾年中,它就取代xml,成為了互聯(lián)網(wǎng)上最受歡迎的數(shù)據(jù)交換格式。
我猜想,Douglas Crockford一定事先就知道,數(shù)據(jù)結(jié)構(gòu)可以簡(jiǎn)化成三種形式,否則怎么可能將json定義得如此精煉呢!
3.
我還記得,在學(xué)習(xí)javascript的時(shí)候,我一度搞不清楚“數(shù)組”(array)和“對(duì)象”(object)的根本區(qū)別在哪里,兩者都可以用來(lái)表示數(shù)據(jù)的集合。
比如有一個(gè)數(shù)組a=[1,2,3,4],還有一個(gè)對(duì)象a={0:1,1:2,2:3,3:4},然后你運(yùn)行alert(a[1]),兩種情況下的運(yùn)行結(jié)果是相同的!這就是說(shuō),數(shù)據(jù)集合既可以用數(shù)組表示,也可以用對(duì)象表示,那么我到底該用哪一種呢?
我后來(lái)才知道,數(shù)組表示有序數(shù)據(jù)的集合,而對(duì)象表示無(wú)序數(shù)據(jù)的集合。如果數(shù)據(jù)的順序很重要,就用數(shù)組,否則就用對(duì)象。
4.
當(dāng)然,數(shù)組和對(duì)象的另一個(gè)區(qū)別是,數(shù)組中的數(shù)據(jù)沒(méi)有“名稱(chēng)”(name),對(duì)象中的數(shù)據(jù)有“名稱(chēng)”(name)。
但是問(wèn)題是,很多編程語(yǔ)言中,都有一種叫做“關(guān)聯(lián)數(shù)組”(associative array)的東西。這種數(shù)組中的數(shù)據(jù)是有名稱(chēng)的。
比如在javascript中,可以這樣定義一個(gè)對(duì)象:
var a={"城市":"北京","面積":16800,"人口":1600};
但是,也可以定義成一個(gè)關(guān)聯(lián)數(shù)組:
a["城市"]="北京";
a["面積"]=16800;
a["人口"]=1600;
這起初也加劇了我對(duì)數(shù)組和對(duì)象的混淆,后來(lái)才明白,在Javascript語(yǔ)言中,關(guān)聯(lián)數(shù)組就是對(duì)象,對(duì)象就是關(guān)聯(lián)數(shù)組。這一點(diǎn)與php語(yǔ)言完全不同,在php中,關(guān)聯(lián)數(shù)組也是數(shù)組。
比如運(yùn)行下面這段javascript:
var a=[1,2,3,4];
a['foo']='Hello World';
alert(a.length);
最后的結(jié)果是4,也就是說(shuō),數(shù)組a的元素個(gè)數(shù)是4個(gè)。
但是,運(yùn)行同樣內(nèi)容的php代碼就不一樣了:
$a=array(1,2,3,4);
$a["foo"]="Hello world";
echo count($a);
最后的結(jié)果是5,也就是說(shuō),數(shù)組a的元素個(gè)數(shù)是5個(gè)。