SELECT 基礎查詢
1 查詢資料前的基本概念
1.1 表格、紀錄與欄位
表格是資料庫儲存資料的基本元件,它是由一些欄位組合而成的,儲存在表格中的每一筆紀錄就擁有這些欄位的資料。以儲存城市資料的表格「city」來說,設計這個表格的人希望一個城市資料需要包含編號、名稱、國家代碼、區域和人口數量,所以他為「city」表格設計了這些「欄位(column)」:
儲存在表格中的每一筆資料稱為「列(row)」或「紀錄(record)」:
在設計表格的時候,通常會指定一個欄位為「主索引鍵(primary key)」:
註:
主索引鍵會在「第八章、表格與索引」中詳細的討論。
1.2 認識資料型態
資料庫中可以儲存各種不同的資料,SQL提供許多不同的「資料型態」讓你應付這些不同的需求。在開始查詢資料之前,你要先認識最常見、也是最基本的資料型態。第一種是數值,為了更精準的保存數值資料,SQL提供整數與小數兩種數值型態:
你可以依照自己的需求,使用儲存的數值資料執行數學運算:
常用的資料型態還有「字串」與「日期」:
在SQL敘述中使用字串資料的時候,字串資料的前後要使用單引號或雙引號:
使用日期資料的時候,MySQL資料庫預設的日期格式是「年-月-日」。與字串資料一樣,前後也要使用單引號或雙引號:
註:
字串與日期資料型態會在「第七章、儲存引擎與資料型態、欄位資料型態」中詳細的討論。
另外一種在資料庫中比較特殊的資料型態是「NULL」,它不像數值、字串或日期資料型態是一個明確的資料,「NULL」是用來表示「不確定」、「未知」或「沒有」的資料:
2 查詢敘述
在執行資料庫的操作中,查詢算是最常見也是最複雜的工作,所以一個查詢敘述所使用到的子句也最多,下列是查詢敘述的基本語法:
這一章會討論「SELECT」、「FROM」、「WHERE」、「ORDER BY」和「LIMIT」五個子句組合起來的查詢敘述。其它的子句會在下一章繼續討論。
在你使用「SELECT」搭配各種子句來查詢資料時,要特別注意子句使用的順序:
就算你每一個子句的寫法都沒有出錯,如果順序不對了:
2.1 指定使用中的資料庫
一個資料庫伺服器可以建立許多需要的資料庫,所以在你執行任何資料庫的操作前,通常要先指定使用的資料庫。下列是指定資料庫的指令:
如果你使用「MySQL Workbench」這類的工具軟體,畫面上看起來會像這樣:
2.2 只有SELECT
一個SQL查詢敘述一定要以「SELECT」子句開始,再搭配其它的子句完成查詢資料的工作。你可以單獨使用「SELECT」子句,只不過這樣的用法跟資料庫一點關係都沒有,它只不過把你輸入的內容顯示出來而已:
例如下列的查詢敘述,只是簡單的顯示字串和計算結果,並不會查詢資料庫中的資料:
SELECT 'My name is Simon Johnson', 35` `* 12
2.3 指定欄位與表格
一般所謂的查詢敘述,通常是查詢資料庫中的資料,所以「SELECT」子句會搭配「FROM」子句來使用,而「SELECT」後面可以指定「*」表示要查詢指定表格的所有欄位:
如果目前使用中的資料庫為「world」,下列的敘述可以查詢「world」資料庫中,「city」表格的所有資料:
SELECT * FROM city
一個資料庫伺服器可以建立許多需要的資料庫,所以在你執行任何資料庫的操作前,都要使用「USE」敘述指定一個使用中的資料庫。不過你也可以在SQL敘述中使用下列的語法來指定資料庫:
如果目前使用中的資料庫是「world」,你不用先使用「USE cmdev」敘述切換使用中的資料庫,可以使用下列的語法查詢「cmdev」資料庫中的「emp」表格:
SELECT * FROM cmdev.emp
2.4 指定需要的欄位
有時候你並不需要查詢一個表格中所有的欄位,所以你可以在「SELECT」子句後面自己指定需要的欄位:
如果你在「SELECT」後面使用「*」的話:
你可以依照自己的需要決定要查詢哪些欄位和順序:
2.5 數學運算
除了查詢表格中的欄位外,你可以加入任何需要的運算,這裡先討論一般常見的數學運算。下列是很常用來執行數學運算的運算子:
優先順序 | 運算子 | 說明 | 範例 | 運算結果 |
---|---|---|---|---|
1 | % | 餘數 | 7 % 3 | 1 |
1 | MOD | 餘數 | 7 MOD 3 | 1 |
1 | * | 乘 | 7 * 3 | 21 |
1 | / | 除 | 7 / 3 | 2.333 |
1 | DIV | 除(整數) | 7 DIV 3 | 2 |
2 | + | 加 | 7 + 3 | 10 |
2 | - | 減 | 7 – 3 | 4 |
註:
優先順序的數字從1開始,1表示優先權比較高,2比較低,以此類推。就跟一般數學運算的先乘除後加減一樣: 在一個運算式中,優先權高的先算完,再換低優先權繼續算;同樣優先權的就由左到右計算。你也可以在運算式中使用左右括號,括號中的運算會先執行。
以「cmdev」資料庫中的員工表格(emp)來說,想要計算員工的年薪,就可以使用這些運算子來完成你的查詢工作:
2.6 別名
你可以另外為「SELECT」後面查詢的資料取一個自己想要的名稱,這個作法稱為「別名(alias name)」:
取欄位別名會讓執行查詢後的結果,使用你自己取的名稱為欄位名稱:
註:
幫一般欄位取一個欄位別名是比較沒有必要的,如果是運算式的話,通常就要幫它取一個欄位別名來取代原來一大串的運算式。
在取欄位別名的時候要特別注意下列的狀況:
另外如果你「堅持」要使用SQL語法中的保留字來當作欄位別名的話:
如果違反上列兩個規定,執行敘述以後會發生錯誤。
3 條件查詢
使用「SELECT」和「FROM」執行的查詢敘述,是把你在「FROM」子句指定表格裡所有的紀錄傳回來。資料庫最大的好處就是可以隨時依照需要查詢部份紀錄資料,你可以搭配「WHERE」子句執行查詢條件的設定:
3.1 比較運算子
要使用「WHERE」執行查詢條件的設定,你會使用下列基礎的比較運算子:
優先順序 | 運算子 | 說明 |
---|---|---|
1 | = | 等於 |
1 | <=> | 等於 |
1 | != | 不等於 |
1 | < | 小於 |
1 | <= | 小於等於 |
1 | > | 大於 |
1 | >= | 大於等於 |
註:
「<=>」運算子在後面「NULL值的判斷」會討論。
使用這些基礎的比較運算子就可以完成一些簡單的條件設定:
設定日期資料型態的條件也是很常見的:
3.2 邏輯運算子
查詢條件的設定,有時候會像前面討論的單一條件一樣,並不會太複雜;不過也很常遇到在一個查詢的需求中,需要設定一個以上的條件,那你就會用到下列的運算子:
優先順序 | 運算子 | 說明 |
---|---|---|
1 | NOT | 非 |
2 | && | 而且 |
2 | AND | 而且 |
3 | \\ | 或 |
3 | OR | 或 |
3 | XOR | 互斥 |
「NOT」運算子比較特殊一些,在一般的需求中,比較不會用到它。以下列的需求來說:
如果想要查詢國家代碼是「TWN」,而且人口數量小於十萬的城市,就必須設定兩個條件,而兩個條件之間,依照「而且」的需求,使用「AND」來結合兩個條件:
如果想要查詢國家代碼是「TWN」或是「USA」的城市,在兩個條件之間依照「或」的需求,使用「OR」來結合兩個條件:
在邏輯運算子的介紹中,它們也同樣有「優先順序」的。如果你想要查詢在歐洲(Europe)或非洲(Aftica)國家,而且人口數要小於一萬。使用下列的查詢條件所得到的資料,跟你想要的卻不一樣:
如果有多個查詢條件的設定,全部都是「AND」或全部都是「OR」的話,就沒有這類問題;如果查詢條件中,有「AND」和「OR」同時出現的話,就要依照你的需要,視情況加上左右刮號來控制條件的設定:
3.3 其它條件運算子
一般的條件和邏輯運算子,已經可以應付大部份的查詢條件需求。下列還有一些可以用在特殊用途或是提供替代寫法的條件設定:
BETWEEN … AND … : 範圍比較
IN (…) : 成員比較
IS : 是…
IS NOT : 不是…
LIKE : 像…
「BETWEEN … AND …」用來執行一個指定範圍條件的設定:
如果要查詢人口數量在八萬到九萬之間的城市資料,可以有下列兩種條件的寫法,它們執行以後的結果是完全一樣的:
使用「BETWEEN … AND …」的條件設定會包含指定的資料,所以下列兩個查詢條件所得到的結果就不一樣了:
「BETWEEN … AND …」使用在日期資料時,也可以完成某一個日期範圍的判斷:
「IN (…)」使用在一組成員資料的比對條件設定:
下列兩個查詢敘述,都可以得到國家代碼是「TWN、USA、JPN、ITA和KOR」的城市資料,可是使用「IN (…)」來設定條件的話,看起來會簡潔很多:
3.4 NULL值的判斷
在國家表格中,有一個儲存平均壽命的欄位「LifeExpectancy」,不過資料庫中的資料並沒有很完整,所以有一些國家是沒有這個資料的,所以會使用「NULL」值來表示:
如果想要查詢沒有平均壽命資料的國家,也就是平均壽命的欄位值是「NULL」,你可能會使用下列的敘述:
SELECT Name, LifeExpectancy
FROM country
WHERE LifeExpectancy = NULL
上列的敘述執行以後,並沒有傳回任何紀錄,這表示並沒有資料符合你設定的查詢條件。
所以「NULL」值的判斷,不可以使用判斷一般資料的條件設定:
註: 「<=>」在判斷一般資料的時候,跟「=」完全一樣;不過它用在判斷「NULL」資料的時候,效果跟「IS」一樣。
如果換成要查詢「有」平均壽命資料的國家,也就是平均壽命的欄位值不是「NULL」:
3.5 字串樣式
在使用字串資料的條件判斷時,會有一種很常見、也比較特殊的需求,像是「想要查詢名稱以w字元開始的城市」,如果你使用下列的查詢敘述:
SELECT Name FROM city WHERE Name = 'w'
這樣的查詢條件,當然不是「名稱以w字元開始的城市」,而是名稱只有一個「w」字元的城市。所以這類的查詢就會使用下列這個特殊的條件設定:
上列語法中,在「LIKE」後面的「樣版」字串中,會使用到下列兩種「樣版字元」:
% : 0到多個任何字元
_ : 一個任何字元
所以要查詢「名稱以w字元開始的城市」的話:
參考上列的作法,就可以延伸出其它的查詢條件設定了:
上列的查詢條件中,「w%」表示第一個字元是「w」就符合條件;「%w」表示最後一個字元是「w」就符合條件;最後一個「%w%」表示不論在什麼位置有「w」字元,都符合條件。
另外一種樣版字元「_」表示一個任何字元:
把這些樣版中的底線換到後面的話:
你也可以搭配兩種樣版字元完成條件的設定:
甚至像查詢「名稱是三十(包含)個字元以上的城市」:
註: 其實完成上列的查詢條件的需求是不用這麼麻煩的,在後面的章節會討論比較簡單的方式。
4 排序
在你執行任何一個查詢以後,MySQL傳回的資料是依照「自然」的順序排列的。所謂的自然順序,通常是資料新增到表格中的順序,可是在資料庫運作一段時間後,陸續會有各種不同的操作,所以這個「自然」順序對你來說,通常是沒什麼意義的。
一般的查詢通常會有資料排序上的需求,所以你會使用「ORDER BY」子句:
如果你希望在查詢城市資料的時候,資料庫會依照國家代碼幫你排序的話:
你也可以指定資料排列的順序為由大到小:
「ORDER BY」子句後面可以依照需求指定多個排序的資料:
「ORDER BY」子句後面指定多個排序資料的時候,都可以依照需求,各自指定資料排列的方式:
「ORDER BY」子句指定的資料可以是欄位名稱、編號、運算式或是欄位別名:
雖然比較不會有下列這樣的需求,不過你還是可以這樣作:
註: 資料排列的順序在「第六章、字元集與資料庫」與「第七章、儲存引擎與資料型態」中進一步詳細的討論。
5 限制查詢
5.1 指定回傳紀錄數量
在你執行一個查詢敘述後,資料庫會將你查詢的資料傳回來給你;如果你使用「WHERE」子句設定查詢條件的話,資料庫就只會傳回符合條件的資料;除了上列的狀況外,你也可以另外使用「LIMIT」子句指定回傳紀錄的數量:
如果你在「LIMIT」子句後面指定一個數字:
「LIMIT」子句後面也可以指定兩個數字:
在查詢敘述中,使用「ORDER BY」子句搭配「LIMIT」子句,就可以完成下列查詢「排名」的工作:
註: 如果出現類似「… LIMIT 1000000, 10」這樣的查詢敘述,雖然你只會得到十筆資料,資料庫總共會查詢一百萬零一十筆資料,只不過資料庫會幫你跳過前一百萬筆;類似這樣的需求,還是要使用「WHERE」子句先挑出想要的資料會比較好一些。
5.2 排除重複紀錄
在一個查詢敘述執行以後,資料庫不會幫你檢查回傳的資料是否重複(回傳的兩筆紀錄資料完全一樣),在「SELECT」子句後面可以讓你設定「回傳的資料是否重複」:
沒有使用「ALL」或「DISTINCT」的效果,跟你自己加上「ALL」的查詢效果是一樣的,資料庫會依照你的查詢傳回所有的資料:
使用「DISTINCT」的話,資料庫會特別執行回傳紀錄是否重複的檢查: