主要講 except 和 not in 的性能上的區(qū)別。
復(fù)制代碼 代碼如下:
CREATE TABLE tb1(ID int)
CREATE TABLE tb2(ID int)
BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i -1
end
COMMIT我測(cè)試的時(shí)候tb1 是1000,tb2 是500
復(fù)制代碼 代碼如下:
DBCC FREESYSTEMCACHE ('ALL','default');
SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF
執(zhí)行計(jì)劃:
復(fù)制代碼 代碼如下:
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
|--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
|--Table Scan(OBJECT:([master1].[dbo].[tb1]))
復(fù)制代碼 代碼如下:
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
|--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
|--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Nested Loops(Left Anti Semi Join)
|--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
| |--Top(TOP EXPRESSION:((1)))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Row Count Spool
|--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))
SQL Server 執(zhí)行時(shí)間:
CPU 時(shí)間 = 0 毫秒,占用時(shí)間 = 0 毫秒。
(500 行受影響)
表 'tb1'。掃描計(jì)數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預(yù)讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預(yù)讀 0 次。
表 'tb2'。掃描計(jì)數(shù) 1,邏輯讀取 1 次,物理讀取 0 次,預(yù)讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預(yù)讀 0 次。
(6 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時(shí)間:
CPU 時(shí)間 = 0 毫秒,占用時(shí)間 = 528 毫秒。
(500 行受影響)
表 'Worktable'。掃描計(jì)數(shù) 0,邏輯讀取 0 次,物理讀取 0 次,預(yù)讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預(yù)讀 0 次。
表 'tb2'。掃描計(jì)數(shù) 3,邏輯讀取 1002 次,物理讀取 0 次,預(yù)讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預(yù)讀 0 次。
表 'tb1'。掃描計(jì)數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預(yù)讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預(yù)讀 0 次。
(10 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時(shí)間:
CPU 時(shí)間 = 16 毫秒,占用時(shí)間 = 498 毫秒。
SQL Server 執(zhí)行時(shí)間:
CPU 時(shí)間 = 0 毫秒,占用時(shí)間 = 0 毫秒。
結(jié)論:通過(guò)較多數(shù)據(jù) 和 較少數(shù)據(jù)的測(cè)試,在較少數(shù)據(jù)的情況下 not in 比 except 性能好,但是在較多數(shù)據(jù)情況下 execpt 比 not in 出色。
看執(zhí)行計(jì)劃可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的執(zhí)行計(jì)劃開可以得到優(yōu)化。
如果大家有興趣可以看看 not exists 的執(zhí)行計(jì)劃。建議:
大家不要迷信測(cè)試結(jié)果,因?yàn)樗械男阅芏际呛蛨?zhí)行計(jì)劃密切相關(guān)的。而執(zhí)行計(jì)劃和統(tǒng)計(jì)數(shù)據(jù)又密不可分。
所以過(guò)度的迷信測(cè)試結(jié)果,可能會(huì)對(duì)生產(chǎn)庫(kù)造成性能的影響達(dá)不到預(yù)期的性能效果。