【原文地址】New "Orcas" Language Feature: Query Syntax
【原文發(fā)表日期】 Saturday, April 21, 2007 2:12
上個月我開始了一個貼子系列,討論作為Visual Studio和.NET框架Orcas版本一部分發(fā)布的一些新的VB和C#語言特性。下面是該系列的前三篇貼子的鏈接:
- 自動屬性,對象初始化器,和集合初始化器
- 擴展方法
- Lambda表達式
今天的貼子要討論另一個基礎性的新語言特性:查詢句法(Query Syntax)。
什么是查詢句法(Query Syntax)?
查詢句法是使用標準的LINQ查詢運算符來表達查詢時一個方便的聲明式簡化寫法。該句法能在代碼里表達查詢時增進可讀性和簡潔性,讀起來容易,也容易讓人寫對。Visual Studio 對查詢句法提供了完整的intellisense和編譯時檢查支持。
在底下,C#和VB編譯器則把查詢句法的表達式翻譯成明確的方法調用代碼,這樣的代碼利用了Orcas中的新的擴展方法和Lambda表達式語言特性。
查詢句法的例子:
在我以前的語言系列貼子里,我示范了你可以象下面這樣聲明一個Person類:
然后我們可以使用下面這樣的代碼,用一些個人信息來生成一個ListPerson>集合實例,然后使用查詢句法來對該集合做一個LINQ查詢,只取出那些姓(last name)的首字母為G的人,按名字(first name)來排序(升序):
上面查詢句法的表達式在語意上與下面明確使用LINQ擴展方法和Lambda表達式的代碼是等同的:
使用查詢句法方法的好處是,結果會是稍微容易讀寫些,這在表達式變得更繁復時尤其如此。
查詢句法 - 理解from和select子句:
在C#中,每個查詢表達式的句法從from子句開始,以select或group子句結束。from子句表示你要查詢什么數據。select子句則表示你要返回什么數據,且應該以什么構形返回。
譬如,讓我們再來看一下我們對ListPerson>集合的查詢:
在上面的代碼片段里,"from p in people"表示了我要對"people" 這個集合做一個LINQ查詢,我將用參數"p"代表我正查詢的輸入序列的每個項。我們將參數命名為"p" 這個事實是無關緊要的,我完全可以很容易地將其命名為"o", "x", "person"或我想要的任何名字。
在上面的代碼片段里,語句結尾的"select p"子句表示,作為查詢的結果,我要返回一個Person對象的IEnumerable序列。這是因為"people"集合包含了Person類型的對象,而參數p則代表了輸入序列中的Person對象。因此,該查詢句法表達式的結果數據類型是IEnumerablePerson>。
假如不是返回Person對象,我想返回該集合中的人的名字,我可以把查詢改寫成這樣:
注意上面我不再說"select p",而是說"select p.FirstName"。這表示我不想返回一串Person對象,而是想返回一串字符串,由Person對象的FirstName屬性(該屬性是個字符串)填充而來。 因此,該查詢句法表達式的結果類型是 IEnumerablestring>。
針對數據庫的查詢句法的例子
LINQ的妙處在于,我可以針對任何數據類型使用完全一樣的查詢句法。譬如,我可以使用Orcas提供的新LINQ到SQL對象關系映射器支持,對SQL服務器的Northwind數據庫進行建模,生成下面這些類(請觀看我這里的錄像來學習該如何實現):
在上面定義好類模型之后(以及它與數據庫間的映射關系),然后我就可以寫個查詢句法的表達式取出那些單價大于99元的產品:
在上面的代碼片段里,我表示我要對NorthwindDataContext類的Products表進行一個LINQ查詢,NorthwindDataContext類是由Visual Studio orcas的ORM設計器生成的。"select p"表示我要返回匹配我的查詢的一串Product對象,因此,該查詢句法表達式的結果數據類型是IEnumerableProduct>。
就象前面ListPerson>查詢句法的例子一樣,C# 編譯器會把我們的聲明式查詢句法翻譯成明確的擴展方法調用(使用Lambda表達式作為參數)。在上面的LINQ到SQL的例子的情形下,這些Lambda表達式會被轉化成SQL命令,然后在SQL服務器上做運算(這樣,只有那些匹配查詢條件的Product記錄行會返回到我們的應用中)。促成這個Lambda->SQL 轉化的機制的細節(jié)可見于我的Lambda表達式博客貼子的"Lambda表達式樹"部分。
查詢句法 - 理解where和orderby子句:
在一個查詢句法表達式開頭的"from" 子句和結尾的"select"子句之間,你可以使用最常見的LINQ查詢運算符來過濾和轉換你在查詢的數據。兩個最常用的子句是"where"和"orderby"。這兩個子句處理對結果集的過濾和排序。
譬如,要從Northwind數據庫里返回按字母降序排列的分類名稱列表,過濾條件是只包括那些含有5個以上產品的分類,我們可以編寫下面這樣的查詢句法來用LINQ到SQL對我們的數據庫做查詢:
在上面的表達式里,我們加了 "where c.Products.Count > 5" 子句來表示我們只要那些含有5個以上產品的分類。這利用了數據庫中產品和分類間的LINQ到SQL的ORM映射的關聯。在上面的表達式中,我也加了"order by c.CategoryName descending"子句來表示我要將結果集按名稱降序排列。
LINQ到SQL然后就會在使用這個表達式查詢數據庫時,生成下列SQL:
Select [t0].[CategoryName] FROM [dbo].[Categories] AS [t0]
Where ((
Select COUNT(*)
FROM [dbo].[Products] AS [t1]
Where [t1].[CategoryID] = [t0].[CategoryID]
)) > 5
ORDER BY [t0].[CategoryName] DESC
注意,LINQ到SQL很聰明,只返回了我們所需的單個字段(分類名稱), 而且它是在數據庫層做了所有的過濾和排序,使得該查詢效率非常高。
查詢句法 - 用投影(Projection)來轉換數據
先前我指出的一個要點是,"select" 子句表示了你要返回的數據,以及這個數據的構形是什么。
譬如,假如你有個象下面這樣的"select p" 子句,這里p的類型是Person,然后,它就會返回一串Person對象:
LINQ和查詢句法提供的一個非常強大的功能是允許你定義跟被查詢的數據分開的新的類型,然后用新的類型來控制查詢返回的數據的形狀和結構。
譬如,假設我們定義了一個新的AlternatePerson類,內含一個FullName屬性,而不是我們原先的Person類內的分開的FirstName和LastName屬性:
然后我就可以使用下面的LINQ查詢句法來查詢我原先的ListPerson>集合,用下面的查詢句法將結果轉換成一串AlternatePerson對象:
注意看,我們是如何在上面的表達式里的"select"子句里,使用我的語言系列的第一個貼子里討論過的新的對象初始化器句法來創(chuàng)建新的AlternatePerson實例,同時設置它的屬性的。也注意我是如何連接我們原先Person類的FirstName和LastName屬性,然后將其賦值給FullName屬性的。
對數據庫使用查詢句法投影
這個投影特性在操作從象數據庫這樣一個遠程數據提供器那里取回的數據時,會變得難以置信地有用,因為它提供給我們一個優(yōu)雅的方式,來表示我們的ORM應該從數據庫實際取回哪些數據字段。
譬如,假設我用了LINQ到SQL的ORM提供器對Northwind數據庫建模,生成下面這些類:
通過編寫下面這個LINQ查詢,我告訴LINQ到SQL我要返回一串Product對象:
填充Product類所需的所有字段都將作為上面查詢的一部分從數據庫中返回,由LINQ到SQL orM執(zhí)行的raw SQL看上去象下面這樣:
Select [t0].[ProductID], [t0].[ProductName], [t0].[SupplierID], [t0].[CategoryID],
[t0].[QuantityPerUnit], [t0].[UnitPrice], [t0].[UnitsInStock],
[t0].[UnitsOnOrder], [t0].[ReorderLevel], [t0].[Discontinued]
FROM [dbo].[Products] AS [t0]
Where [t0].[UnitPrice] > 99
在一些場景下,我不需要也不用所有這些字段,我可以定義一個下面這樣的新的MyProduct類,只擁有Product類具有的部分屬性,以及一個Product類并不具有的額外屬性,TotalRevenue (注: 對那些不熟悉C#的,Decimal?句法表示我們的UnitPrice屬性是個nullable值):
然后我就可以使用下面這個查詢,使用查詢句法的投影功能來構造我要從數據庫返回的數據的形狀:
這表明,不是返回一串Product對象,我要MyProduct對象,我只要其中三個屬性被賦值,LINQ到SQL就會很聰明地調整要執(zhí)行的raw SQL語句,從數據庫只返回那三個需要的產品字段:
Select [t0].[ProductID], [t0].[ProductName], [t0].[UnitPrice]
FROM [dbo].[Products] AS [t0]
Where [t0].[UnitPrice] > 99
為炫耀起見,我也可以填充MyProduct類的第四個屬性,即TotalRevenue屬性。我要這個值等于我們產品目前的銷售額的總量。這個值在Northwind數據庫中并沒有作為一個預先算好的字段而存在。而是,你需要在Products表和Order Details表間做一個關聯,然后計算出一個給定產品對應的所有的Order Detail 行的總量。
非??岬氖牵铱梢栽赑roduct類的OrderDetails關聯上使用LINQ的 Sum 這個擴展方法,編寫一個作為我的查詢句法投影一部分的乘法Lambda表達式,來計算這個值:
LINQ到SQL就會非常聰明地使用下面這個SQL在SQL數據庫里做運算:
Select [t0].[ProductID], [t0].[ProductName], [t0].[UnitPrice], (
Select SUM([t2].[value])
FROM (
Select [t1].[UnitPrice] * (CONVERT(Decimal(29,4),[t1].[Quantity])) AS [value], [t1].[ProductID]
FROM [dbo].[Order Details] AS [t1]
) AS [t2]
Where [t2].[ProductID] = [t0].[ProductID]
) AS [value]
FROM [dbo].[Products] AS [t0]
Where [t0].[UnitPrice] > 99
查詢句法 - 理解延遲執(zhí)行(Deferred Execution)和使用ToList() 和ToArray()
在默認情形下,查詢句法表達式的結果的類型是IEnumerableT>。在上面的例子里,你會注意到所有的查詢句法賦值是給IEnumerableProduct>, IEnumerablestring>, IEnumerablePerson>, IEnumerableAlternatePerson>, 和 IEnumerableMyProduct> 變量的。
IEnumerableT>接口的一個很好的特征是,實現它們的對象可以把實際的查詢運算延遲到開發(fā)人員第一次試圖對返回值進行迭代(這是通過使用最早在VS 2005中C# 2.0 中引進的yield構造來達成的)時才進行。LINQ和查詢句法表達式利用了這個特性,將查詢的實際運算延遲到了你第一次對返回值進行循環(huán)時才進行。假如你對IEnumerableT>的結果從不進行迭代的話,那么查詢根本就不會執(zhí)行。
譬如,考慮下面這個LINQ到SQL的例子:
不是在查詢句法表達式聲明的時候,而是在我們第一次試圖對結果進行循環(huán)(上面紅箭頭標志的地方),才會去訪問數據庫以及取出填充Category對象所需的值。
這個延遲運算的行為結果變得非常有用,因為它促成了一些把多個LINQ查詢和表達式鏈在一起的強有力的組合場景。譬如,我們可以把一個表達式的結果喂給另一個表達式,然后通過延遲運算,允許象LINQ 到SQL這樣的ORM根據整個表達式樹來優(yōu)化raw SQL。我將在以后的一個博客貼子里對這樣的場景做示范說明。
如何立刻對查詢句法表達式做運算
如果你不要延遲查詢運算,而是要對它們立刻就執(zhí)行運算,你可以使用內置的ToList() 和ToArray() 運算符來返回一個包括了結果集的ListT>或者數組。
譬如,要返回一個基于范型的 ListT> 集合的話:
要返回一個數組的話:
在上面兩種情形下,會立刻訪問數據庫,填充Category對象。
結語
查詢句法在使用標準的LINQ查詢運算符來表達查詢時,提供了非常方便的聲明式簡化寫法。它提供的句法可讀性非常高,可以針對任何類型的數據(內存中的集合,數組,XML內容,以及象數據庫這樣的遠程數據提供器,web服務等等)進行查詢。一旦你熟悉這個句法后,你可以在任何地方應用這個知識。
在不遠的將來,我將結束本語言系列的最后一部分,該部分將討論新的匿名類型特性。然后我將轉而討論在實際應用中使用所有這些語言特性的一些非常實用的例子(特別是針對數據庫和XML文件使用LINQ的例子)。
希望本文對你有所幫助,
Scott