基本含義
從技術角度而言,LINQ定義了大約40個查詢操作符,如select、from、in、where以及order by(C#中)。使用這些操作符可以編寫查詢語句。不過,這些查詢還可以基於很多類型的數據,每個數據類型都需要一個單獨的LINQ類型。
經過了最近 20 年,面向對象編程技術( object-oriented (OO) programming technologies )在工業領域的套用已經進入了一個穩定的發展階段。程式設計師現在都已經認同像 類(classes)、對象(objects)、方法(methods)這樣的語言特性。考察現在和下一代的技術,一個新的編程技術的重大挑戰開始呈現出來,即面向對象技術誕生以來並沒有解決降低訪問和整合信息數據( accessing and integrating information )的複雜度的問題。其中兩個最主要訪問的數據源與資料庫(database)和XML(標準通用標記語言下的一個套用)相關。
LINQ 提供了一條更常規的途徑即給.Net Framework添加一些可以套用於所有信息源( all sources of information )的具有多種用途( general-purpose )的語法查詢特性( query facilities ),這是比向開發語言和運行時( runtime )添加一些關係數據( relational )特性或者類似 XML 特性( XML-specific )更好的方式。這些語法特性就叫做 .NET Language Integrated Query (LINQ) 。
包含 DLinq 和 XLinq。
基礎知識
1. LINQ的讀法:(1)lin k (2)lin q
2. LINQ的關鍵字:from, select, in, where, group by, orderby, …
3. LINQ的注意點:必須以select或者是group by 結束。
4. LINQ的寫法:
1)from 臨時變數 in 實現IEnumerable接口的對象
where條件表達式
[orderby條件]
[group by 條件]
select 臨時變數中被查詢的值
2) 實現IEnumerable接口的對象.LINQ方法名(lambda表達式)。如:
string input = "hellow world";
int count = input.Count(w=>w == 'o'); //查詢字母o出現的次數
能夠使用LINQ的對象需要實現IEnumerable接口。並且LINQ的查詢表達式是在一次創建對象時才被編譯的。
4. LINQ的全稱:Language-Integrated Query
5. 命名空間:System.Linq;
注意:Linq是在.NET Framework 3.5 中出現的技術,所以在創建新項目的時候必須要選3.5或者更高版本,否則無法使用。
選擇3.5或更高版本的.NET Framework之後,創建的新項目中會自動包含System.Linq的命名空間。
語法實例
C#3.0 LINQ 查詢語法
首先來看一個很簡單的LINQ查詢例子,查詢一個int數組中小於5的數字,並按照大小順序排列:
static void Main(string[] args)
{
int[] arr = new int[] { 8, 5, 89, 41, 1, 2, 3, 65, 1 };
var m = from n in arr where n < 5 orderby n descending select n;//小於5,並且倒敘排列顯示
foreach (var n in m)
{
Console.WriteLine(n);
}
Console.ReadLine();
}
上述代碼除了LINQ查詢語法外,其他都是我們所熟悉的語法,而LINQ查詢語法跟SQL查詢語法很相似,除了先後順序。
Q:為何 LINQ 查詢語法是以 from 關鍵字開頭的,而不是以 select 關鍵字開頭的?select 開頭這種寫法跟SQL的寫法更接近,更易懂呀?
A:簡單來說,為了IDE的智慧型感知(Intellisence)這個功能,select 關鍵字放在後面了。
程式語言以 select 開頭寫LINQ查詢語法不是沒出現過,你如果使用過2005年的VB9 CTP 版本,那時候VB9的LINQ查詢語法就是 select 關鍵字在前面,但是 select 關鍵字在前面,在做智慧型感知(Intelisence)時候就很頭大。經過微軟IDE組的權衡,確定了把 from 關鍵字放在最前面。
那時候 VB9 LINQ的查詢語法還是 select 參數在最前面。不過後來 VB9 測試版改成了跟 C# 一樣的做法, from 關鍵字放在最前面了。
更詳細的解釋,來自裝配腦袋
假設你要書寫這樣的代碼:Select p. Name, p.Age From p In persons Where xxx ,代碼是一個個字元輸入的。
我們在寫到 p in persons 之前,p 的類型是無法推測的,所以寫 Select p. 的時候,Name之類的屬性不會彈出智慧型提示來。
這樣就需要先去寫 From 這句,再回來寫 Select。
微軟IDE組經過反覆考慮決定,還不如就把 Select 寫到後面了。於是程式語言中的寫法就確定這樣來寫了。
VB9 的這個變化可以參看這篇部落格:
Select/From vs. From/Select revisited...
我們再來看一個稍稍複雜的LINQ查詢:
在我們列舉的語言字元串中,我們希望按照字元長短,分類列舉出來,實現代碼如下:
static void Main(string[] args)
{
string[] languages = { "Java", "C#", "C++", "Delphi", "VB.net", "VC.net", "C++Builder", "Kylix", "Perl", "Python" };
var query = from item in languages
group item by item.Length into lengthGroups
orderby lengthGroups.Key
select lengthGroups;
foreach (var item in query)
{
Console.WriteLine("strings of length{0}", item.Key);
foreach (var val in item)
{
Console.WriteLine(val);
}
}
Console.ReadLine();
}
其中的 into 關鍵字表示 將前一個查詢的結果視為後續查詢的生成器,這裡是跟 group by 一起使用的。
LINQ中的Group by不要跟 SQL 中的Group by 混淆,SQL由於是二維結構,Group by 的一些邏輯受二維結構的約束,無法像 LINQ 中的Group by 這么靈活。
事實上,LINQ的查詢語法存在以下兩種形式:
查詢方法方式:(Methord Syntax)
主要利用System.Linq.Enumerable類中定義的擴展方法和Lambda表達式方式進行查詢
查詢語句方式:(Query Syntax)一種更接近SQL語法的查詢方式,可讀性更好。
原理淺析
LINQ(Language Integrated Query)是Visual Studio 2008中的領軍人物。藉助於LINQ技術,我們可以使用一種類似SQL的語法來查詢任何形式的數據。目前為止LINQ所支持的數據源有SQL Server、Oracle、XML(標準通用標記語言下的一個套用)以及記憶體中的數據集合。開發人員也可以使用其提供的擴展框架添加更多的數據源,例如MySQL、Amazon甚至是GoogleDesktop。
一般來講,這類查詢語句的一個重要特點就是可以並行化執行。雖然有些情況下並行可能會帶來一些問題,但這種情況非常少見。這樣也就水到渠成地引出了PLINQ這個並行處理的LINQ類庫。
PLINQ原名為Parallel LINQ,支持XML和記憶體中的數據集合。執行於遠程伺服器上的查詢語句(例如LINQ to SQL)顯然無法實現這個功能。
將LINQ語句轉換為PLINQ語句極為簡單——只需要在查詢語句中From子句所指定的數據源的最後添加.AsParallel()即可。隨後Where、OrderBy和Select子句將自動改為調用這個並行的LINQ版本。
據MSDN Magazine介紹,PLINQ可以以三種方式執行。第一種是管道處理:一個執行緒用來讀取數據源,而其他的執行緒則用來處理查詢語句,二者同步進行——雖然這個單一的消費執行緒可能並不那么容易與多個生產執行緒同步。不過若是能夠仔細配置好負載平衡的話,仍然會極大地減少記憶體占用。
第二種模式叫做“stop and go”,用於處理結果集需要被一次返回時(例如調用ToList、ToArray或對結果排序)的情況。在這種模式下,將依次完成各個處理過程,並將結果統一返回給消費執行緒。這個模式在性能上將優於第一種模式,因為它省去了用來保持執行緒同步所花費的開銷。
最後一種方法叫做“inverted enumeration”。該方法並不需要實現收集到所有的輸出,然後在單一的執行緒中處理,而是將最終調用的函式通過ForAll擴展傳遞到每個執行緒中。這是目前為止最快的一種處理模式,不過這需要傳遞到ForAll中的函式是執行緒安全的,且最好不包含任何lock之類的互斥語句。
若是PLINQ中任意的一個執行緒拋出異常,那么所有的其他執行緒將會被終止。若是拋出了多個異常,那么這些異常將被組合成一個MultipleFailuresException類型的異常,但每個異常的調用堆疊仍會被保留。
使用優點
1、無需複雜學習過程即可上手
2、編寫更少代碼即可創建完整套用。
3、更快開發錯誤更少的應用程式。
4、無需求助奇怪的編程技巧就可合併數據源。
5、能夠大幅減少過程控制語句的代碼塊,使代碼的可讀性和可維護性大幅提高。
6、任何對象或數據源都可以定製實現Linq適配器,為數據互動帶來真正方便。
函式支持
支持以下公共語言運行時 (CLR) 方法和屬性,因為它們可以在查詢表達式中進行轉換以包含在OData服務的請求 URI 中:
String成員 | 支持的 OData 函式 |
---|---|
Concat | string concat(string p0, string p1) |
Contains | bool substringof(string p0, string p1) |
EndsWith | bool endswith(string p0, string p1) |
IndexOf | int indexof(string p0, string p1) |
Length | int length(string p0) |
Replace | string replace(string p0, string find, string replace) |
Substring | string substring(string p0, int pos) |
Substring | string substring(string p0, int pos, int length) |
ToLower | string tolower(string p0) |
ToUpper | string toupper(string p0) |
Trim | string trim(string p0) |
DateTime成員1 | 支持的 OData 函式 |
---|---|
Day | int day(DateTime p0) |
Hour | int hour(DateTime p0) |
Minute | int minute(DateTime p0) |
Month | int month(DateTime p0) |
Second | int second(DateTime p0) |
Year | int year(DateTime p0) |
1也支持Visual Basic中等效的Microsoft.VisualBasic.DateAndTime的日期和時間屬性以及DatePart方法。
Math成員 | 支持的 OData 函式 |
---|---|
Ceiling | decimal ceiling(decimal p0) |
Ceiling | double ceiling(double p0) |
Floor | decimal floor(decimal p0) |
Floor | double floor(double p0) |
Round | decimal round(decimal p0) |
Round | double round(double p0) |
Expression成員 | 支持的 OData 函式 |
---|---|
TypeIs | bool isof(type p0) |
客戶端或許還可以在客戶端上計算其他 CLR 函式。對於無法在客戶端上計算以及無法轉換為有效請求URI以便在伺服器上計算的任何表達式,將引發NotSupportedException。