**目錄**
[TOC]
# 1 查詢資料前的基本概念
## 1.1 表格、紀錄與欄位
表格是資料庫儲存資料的基本元件,它是由一些欄位組合而成的,儲存在表格中的每一筆紀錄就擁有這些欄位的資料。以儲存城市資料的表格「city」來說,設計這個表格的人希望一個城市資料需要包含編號、名稱、國家代碼、區域和人口數量,所以他為「city」表格設計了這些「欄位(column)」:

儲存在表格中的每一筆資料稱為「列(row)」或「紀錄(record)」:

在設計表格的時候,通常會指定一個欄位為「主索引鍵(primary key)」:

注:主索引鍵會在「第八章、表格與索引」中詳細的討論。
## 1.2 認識資料型態
資料庫中可以儲存各種不同的資料,SQL提供許多不同的「資料型態」讓你應付這些不同的需求。在開始查詢資料之前,你要先認識最常見、也是最基本的資料型態。第一種是數值,為了更精準的保存數值資料,SQL提供整數與小數兩種數值型態:

你可以依照自己的需求,使用儲存的數值資料執行數學運算:

常用的資料型態還有「字串」與「日期」:

在SQL敘述中使用字串資料的時候,字串資料的前后要使用單引號或雙引號:

使用日期資料的時候,MySQL資料庫預設的日期格式是「年-月-日」。與字串資料一樣,前后也要使用單引號或雙引號:

注:字串與日期資料型態會在「第七章、儲存引擎與資料型態、欄位資料型態」中詳細的討論。
另外一種在資料庫中比較特殊的資料型態是「NULL」,它不像數值、字串或日期資料型態是一個明確的資料,「NULL」是用來表示「不確定」、「未知」或「沒有」的資料:

# 2 查詢敘述
在執行資料庫的操作中,查詢算是最常見也是最復雜的工作,所以一個查詢敘述所使用到的子句也最多,下列是查詢敘述的基本語法:

這一章會討論「SELECT」、「FROM」、「WHERE」、「ORDER BY」和「LIMIT」五個子句組合起來的查詢敘述。其它的子句會在下一章繼續討論。
在你使用「SELECT」搭配各種子句來查詢資料時,要特別注意子句使用的順序:

就算你每一個子句的寫法都沒有出錯,如果順序不對了:

## 2.1 指定使用中的資料庫
一個資料庫伺服器可以建立許多需要的資料庫,所以在你執行任何資料庫的操作前,通常要先指定使用的資料庫。下列是指定資料庫的指令:

如果你使用「MySQL Workbench」這類的工具軟體,畫面上看起來會像這樣:

## 2.2 只有SELECT
一個SQL查詢敘述一定要以「SELECT」子句開始,再搭配其它的子句完成查詢資料的工作。你可以單獨使用「SELECT」子句,只不過這樣的用法跟資料庫一點關系都沒有,它只不過把你輸入的內容顯示出來而已:

例如下列的查詢敘述,只是簡單的顯示字串和計算結果,并不會查詢資料庫中的資料:
~~~
SELECT 'My name is Simon Johnson', 35 * 12
~~~
## 2.3 指定欄位與表格
一般所謂的查詢敘述,通常是查詢資料庫中的資料,所以「SELECT」子句會搭配「FROM」子句來使用,而「SELECT」后面可以指定「*」表示要查詢指定表格的所有欄位:

如果目前使用中的資料庫為「world」,下列的敘述可以查詢「world」資料庫中,「city」表格的所有資料:
~~~
SELECT * FROM city
~~~
一個資料庫伺服器可以建立許多需要的資料庫,所以在你執行任何資料庫的操作前,都要使用「USE」敘述指定一個使用中的資料庫。不過你也可以在SQL敘述中使用下列的語法來指定資料庫:

如果目前使用中的資料庫是「world」,你不用先使用「USE cmdev」敘述切換使用中的資料庫,可以使用下列的語法查詢「cmdev」資料庫中的「emp」表格:
~~~
SELECT * FROM cmdev.emp
~~~
## 2.4 指定需要的欄位
有時候你并不需要查詢一個表格中所有的欄位,所以你可以在「SELECT」子句后面自己指定需要的欄位:

如果你在「SELECT」后面使用「*」的話:

你可以依照自己的需要決定要查詢哪些欄位和順序:

## 2.5 數學運算
除了查詢表格中的欄位外,你可以加入任何需要的運算,這里先討論一般常見的數學運算。下列是很常用來執行數學運算的運算子:
| 優先順序 | 運算子 | 說明 | 范例 | 運算結果 |
| --- | --- | --- | --- | --- |
| 1 | % | 余數 | 7 % 3 | 1 |
| 1 | MOD | 余數 | 7 MOD 3 | 1 |
| 1 | * | 乘 | 7 * 3 | 21 |
| 1 | / | 除 | 7 / 3 | 2.333 |
| 1 | DIV | 除(整數) | 7 DIV 3 | 2 |
| 2 | + | 加 | 7 + 3 | 10 |
| 2 | - | 減 | 7 – 3 | 4 |
注:優先順序的數字從1開始,1表示優先權比較高,2比較低,以此類推。就跟一般數學運算的先乘除后加減一樣:在一個運算式中,優先權高的先算完,再換低優先權繼續算;同樣優先權的就由左到右計算。你也可以在運算式中使用左右括號,括號中的運算會先執行。
以「cmdev」資料庫中的員工表格(emp)來說,想要計算員工的年薪,就可以使用這些運算子來完成你的查詢工作:

## 2.6 別名
你可以另外為「SELECT」后面查詢的資料取一個自己想要的名稱,這個作法稱為「別名(alias?
name)」:

取欄位別名會讓執行查詢后的結果,使用你自己取的名稱為欄位名稱:

注:幫一般欄位取一個欄位別名是比較沒有必要的,如果是運算式的話,通常就要幫它取一個欄位別名來取代原來一大串的運算式。
在取欄位別名的時候要特別注意下列的狀況:

另外如果你「堅持」要使用SQL語法中的保留字來當作欄位別名的話:

如果違反上列兩個規定,執行敘述以后會發生錯誤。
# 3 條件查詢
使用「SELECT」和「FROM」執行的查詢敘述,是把你在「FROM」子句指定表格里所有的紀錄傳回來。資料庫最大的好處就是可以隨時依照需要查詢部份紀錄資料,你可以搭配「WHERE」子句執行查詢條件的設定:

## 3.1 比較運算子
要使用「WHERE」執行查詢條件的設定,你會使用下列基礎的比較運算子:
|優先順序 |運算子| 說明|?
|1| =| 等于|?
|1| ?```| 等于|
|1|?``!=`| 不等于|
|1|?``| 大于|
|1|?`>=`| 大于等于|
注:``運算子在后面「NULL值的判斷」會討論。
使用這些基礎的比較運算子就可以完成一些簡單的條件設定:

設定日期資料型態的條件也是很常見的:

## 3.2 邏輯運算子
查詢條件的設定,有時候會像前面討論的單一條件一樣,并不會太復雜;不過也很常遇到在一個查詢的需求中,需要設定一個以上的條件,那你就會用到下列的運算子:
| 優先順序 | 運算子 | 說明 |
| --- | --- | --- |
| 1 | NOT | 非 |
| 2 | && | 而且 |
| 2 | AND | 而且 |
| 3 | ` | | ` | 或 |
| 3 | OR | 或 |
| 3 | XOR | 互斥 |
「NOT」運算子比較特殊一些,在一般的需求中,比較不會用到它。以下列的需求來說:

如果想要查詢國家代碼是「TWN」,而且人口數量小于十萬的城市,就必須設定兩個條件,而兩個條件之間,依照「而且」的需求,使用「AND」來結合兩個條件:

如果想要查詢國家代碼是「TWN」或是「USA」的城市,在兩個條件之間依照「或」的需求,使用「OR」來結合兩個條件:

在邏輯運算子的介紹中,它們也同樣有「優先順序」的。如果你想要查詢在歐洲(Europe)或非洲(Aftica)國家,而且人口數要小于一萬。使用下列的查詢條件所得到的資料,跟你想要的卻不一樣:

如果有多個查詢條件的設定,全部都是「AND」或全部都是「OR」的話,就沒有這類問題;如果查詢條件中,有「AND」和「OR」同時出現的話,就要依照你的需要,視情況加上左右刮號來控制條件的設定:

## 3.3 其它條件運算子
一般的條件和邏輯運算子,已經可以應付大部份的查詢條件需求。下列還有一些可以用在特殊用途或是提供替代寫法的條件設定:
* BETWEEN … AND …:范圍比較
* IN (…):成員比較
* IS:是…
* IS NOT:不是…
* LIKE:像…
「BETWEEN … AND …」用來執行一個指定范圍條件的設定:

如果要查詢人口數量在八萬到九萬之間的城市資料,可以有下列兩種條件的寫法,它們執行以后的結果是完全一樣的:

使用「BETWEEN … AND …」的條件設定會包含指定的資料,所以下列兩個查詢條件所得到的結果就不一樣了:

「BETWEEN … AND …」使用在日期資料時,也可以完成某一個日期范圍的判斷:

「IN (…)」使用在一組成員資料的比對條件設定:

下列兩個查詢敘述,都可以得到國家代碼是「TWN、USA、JPN、ITA和KOR」的城市資料,可是使用「IN (…)」來設定條件的話,看起來會簡潔很多:

## 3.4 NULL值的判斷
在國家表格中,有一個儲存平均壽命的欄位「LifeExpectancy」,不過資料庫中的資料并沒有很完整,所以有一些國家是沒有這個資料的,所以會使用「NULL」值來表示:

如果想要查詢沒有平均壽命資料的國家,也就是平均壽命的欄位值是「NULL」,你可能會使用下列的敘述:
~~~
SELECT Name, LifeExpectancy
FROM country
WHERE LifeExpectancy = NULL
~~~
上列的敘述執行以后,并沒有傳回任何紀錄,這表示并沒有資料符合你設定的查詢條件。
所以「NULL」值的判斷,不可以使用判斷一般資料的條件設定:

注:``在判斷一般資料的時候,跟「=」完全一樣;不過它用在判斷「NULL」資料的時候,效果跟「IS」一樣。
如果換成要查詢「有」平均壽命資料的國家,也就是平均壽命的欄位值不是「NULL」:

## 3.5 字串樣式
在使用字串資料的條件判斷時,會有一種很常見、也比較特殊的需求,像是「想要查詢名稱以w字元開始的城市」,如果你使用下列的查詢敘述:
~~~
SELECT Name FROM city WHERE Name = 'w'
~~~
這樣的查詢條件,當然不是「名稱以w字元開始的城市」,而是名稱只有一個「w」字元的城市。所以這類的查詢就會使用下列這個特殊的條件設定:

上列語法中,在「LIKE」后面的「樣版」字串中,會使用到下列兩種「樣版字元」:
* %:0到多個任何字元
* _ :一個任何字元
所以要查詢「名稱以w字元開始的城市」的話:

參考上列的作法,就可以延伸出其它的查詢條件設定了:

上列的查詢條件中,「w%」表示第一個字元是「w」就符合條件;「%w」表示最后一個字元是「w」就符合條件;最后一個「%w%」表示不論在什么位置有「w」字元,都符合條件。
另外一種樣版字元「_」表示一個任何字元:

把這些樣版中的底線換到后面的話:

你也可以搭配兩種樣版字元完成條件的設定:

甚至像查詢「名稱是三十(包含)個字元以上的城市」:

注:其實完成上列的查詢條件的需求是不用這么麻煩的,在后面的章節會討論比較簡單的方式。
# 4 排序
在你執行任何一個查詢以后,MySQL傳回的資料是依照「自然」的順序排列的。所謂的自然順序,通常是資料新增到表格中的順序,可是在資料庫運作一段時間后,陸續會有各種不同的操作,所以這個「自然」順序對你來說,通常是沒什么意義的。
一般的查詢通常會有資料排序上的需求,所以你會使用「ORDER BY」子句:

如果你希望在查詢城市資料的時候,資料庫會依照國家代碼幫你排序的話:

你也可以指定資料排列的順序為由大到小:

「ORDER BY」子句后面可以依照需求指定多個排序的資料:

「ORDER BY」子句后面指定多個排序資料的時候,都可以依照需求,各自指定資料排列的方式:

「ORDER BY」子句指定的資料可以是欄位名稱、編號、運算式或是欄位別名:

雖然比較不會有下列這樣的需求,不過你還是可以這樣作:

注:資料排列的順序在「第六章、字元集與資料庫」與「第七章、儲存引擎與資料型態」中進一步詳細的討論。
# 5 限制查詢
## 5.1 指定回傳紀錄數量
在你執行一個查詢敘述后,資料庫會將你查詢的資料傳回來給你;如果你使用「WHERE」子句設定查詢條件的話,資料庫就只會傳回符合條件的資料;除了上列的狀況外,你也可以另外使用「LIMIT」子句指定回傳紀錄的數量:

如果你在「LIMIT」子句后面指定一個數字:

「LIMIT」子句后面也可以指定兩個數字:

在查詢敘述中,使用「ORDER BY」子句搭配「LIMIT」子句,就可以完成下列查詢「排名」的工作:

注:如果出現類似「… LIMIT 1000000, 10」這樣的查詢敘述,雖然你只會得到十筆資料,資料庫總共會查詢一百萬零一十筆資料,只不過資料庫會幫你跳過前一百萬筆;類似這樣的需求,還是要使用「WHERE」子句先挑出想要的資料會比較好一些。
## 5.2 排除重復紀錄
在一個查詢敘述執行以后,資料庫不會幫你檢查回傳的資料是否重復(回傳的兩筆紀錄資料完全一樣),在「SELECT」子句后面可以讓你設定「回傳的資料是否重復」:

沒有使用「ALL」或「DISTINCT」的效果,跟你自己加上「ALL」的查詢效果是一樣的,資料庫會依照你的查詢傳回所有的資料:

使用「DISTINCT」的話,資料庫會特別執行回傳紀錄是否重復的檢查:
