在SQL Server中Count(*)或者Count(1)或者Count([列])或許是最常用的聚合函數(shù)。很多人其實(shí)對(duì)這三者之間是區(qū)分不清的。本文會(huì)闡述這三者的作用,關(guān)系以及背后的原理。
往常我經(jīng)常會(huì)看到一些所謂的優(yōu)化建議不使用Count(* )而是使用Count(1),從而可以提升性能,給出的理由是Count( *)會(huì)帶來(lái)全表掃描。而實(shí)際上如何寫(xiě)Count并沒(méi)有區(qū)別。
Count(1)和Count(*)實(shí)際上的意思是,評(píng)估Count()中的表達(dá)式是否為NULL,如果為NULL則不計(jì)數(shù),而非NULL則會(huì)計(jì)數(shù)。比如我們看代碼1所示,在Count中指定NULL(優(yōu)化器不允許顯式指定NULL,因此需要賦值給變量才能指定)。
DECLARE @xx INT
SET @xx=NULL
SELECT COUNT(@xx) FROM [AdventureWorks2012].[Sales].[SalesOrderHeader]
代碼清單1.Count中指定NULL
由于所有行都為NULL,則結(jié)果全不計(jì)數(shù)為0,結(jié)果如圖1所示。
圖1.顯而易見(jiàn),結(jié)果為0
因此當(dāng)你指定Count(*) 或者Count(1)或者無(wú)論Count(‘a(chǎn)nything')時(shí)結(jié)果都會(huì)一樣,因?yàn)檫@些值都不為NULL,如圖2所示。
圖2.只要在Count中指定非NULL表達(dá)式,結(jié)果沒(méi)有任何區(qū)別
那Count列呢?
對(duì)于Count(列)來(lái)說(shuō),同樣適用于上面規(guī)則,評(píng)估列中每一行的值是否為NULL,如果為NULL則不計(jì)數(shù),不為NULL則計(jì)數(shù)。因此Count(列)會(huì)計(jì)算列或這列的組合不為空的計(jì)數(shù)。
那Count(*)具體如何執(zhí)行?
前面提到Count( )有不為NULL的值時(shí),在SQL Server中只需要找出具體表中不為NULL的行數(shù)即可,也就是所有行(如果一行值全為NULL則該行相當(dāng)于不存在)。那么最簡(jiǎn)單的執(zhí)行辦法是找一列NOT NULL的列,如果該列有索引,則使用該索引,當(dāng)然,為了性能,SQL Server會(huì)選擇最窄的索引以減少I(mǎi)O。
我們?cè)贏dventureworks2012示例數(shù)據(jù)庫(kù)的[Person].[Address]表上刪除所有的非聚集索引,在ModifyDate這個(gè)數(shù)據(jù)類(lèi)型為DateTime的列上建立索引,我們看執(zhí)行計(jì)劃,如圖3所示:
圖3.使用了CreateDate的索引
我們繼續(xù)在StateProvinceID列上建立索引,該列為INT列,占4字節(jié),相比之前8字節(jié) DateTime類(lèi)型的列更短,因此SQL Server選擇了StateProvinceID索引。如圖4所示。
圖4.選擇了更短的StateProvinceID索引
因此,如果某個(gè)表上Count(*)用的比較多時(shí),考慮在一個(gè)最短的列建立一個(gè)單列索引,會(huì)極大的提升性能。
您可能感興趣的文章:- select count()和select count(1)的區(qū)別和執(zhí)行方式講解
- MySQL中count(*)、count(1)和count(col)的區(qū)別匯總
- Select count(*)、Count(1)和Count(列)的區(qū)別及執(zhí)行方式
- count(1)、count(*)與count(列名)的執(zhí)行區(qū)別詳解