[TOC]
## 排序算法
### 介紹
排序也是在程序中經常用到的算法。無論使用冒泡排序還是快速排序,排序的核心是比較兩個元素的大小。如果是數字,我們可以直接比較,但如果是字符串或者兩個`dict`呢?直接比較數學上的大小是沒有意義的,因此,比較的過程必須通過函數抽象出來。
### 使用
Python內置的`sorted()`函數就可以對`list`進行排序:
~~~
>>> sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
~~~
此外,`sorted()`函數也是一個高階函數,它還可以接收一個`key`函數來實現自定義的排序,例如按絕對值大小排序:
~~~
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
~~~
`key`指定的函數將作用于`list`的每一個元素上,并根據`key`函數返回的結果進行排序。對比原始的`list`和經過`key=abs`處理過的`list`:
~~~
list = [36, 5, -12, 9, -21]
keys = [36, 5, 12, 9, 21]
~~~
然后`sorted()`函數按照`keys`進行排序,并按照對應關系返回`list`相應的元素:
| | | |
| | | |
|keys排序結果| =>|` [5, 9, 12, 21, 36]`|
|最終結果 | => |`[5, 9, -12, -21, 36]`|
我們再看一個字符串排序的例子:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
~~~
默認情況下,對字符串排序,是按照ASCII的大小比較的,由于`'Z' < 'a'`,結果,大寫字母`Z`會排在小寫字母`a`的前面。
現在,我們提出排序應該忽略大小寫,按照字母序排序。要實現這個算法,不必對現有代碼大加改動,只要我們能用一個`key`函數把字符串映射為忽略大小寫排序即可。忽略大小寫來比較兩個字符串,實際上就是先把字符串都變成大寫(或者都變成小寫),再比較。
這樣,我們給`sorted`傳入`key`函數,即可實現忽略大小寫的排序:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
~~~
要進行反向排序,不必改動`key`函數,可以傳入第三個參數`reverse=True`:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
~~~
從上述例子可以看出,高階函數的抽象能力是非常強大的,而且,核心代碼可以保持得非常簡潔。
### 小結
`sorted()`也是一個高階函數。用`sorted()`排序的關鍵在于實現一個映射函數。
### 練習
假設我們用一組`tuple`表示學生名字和成績:
`L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]`
請用`sorted()`對上述列表分別按名字排序:
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
pass
L2 = sorted(L, key=by_name)
print(L2)
~~~
#### 參考源碼
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
return t[0][0].lower()
L2 = sorted(L, key=by_name)
print(L2)
~~~
>[info]制書作者提示:str.lower 是打印地址,str.lower() 是打印結果,比如:
t = 'TEST'
print(t.lower)
會輸出如下結果:
<built-in method lower of str object at 0x000002ADF615EF48>
而通過 str.lower() 則會輸出如下:
test
### 練習 2:
再按成績從高到低排序:
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_score(t):
pass
L2 = ???
print(L2)
~~~
#### 參考源碼
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
return t[0][0].lower()
def by_score(t):
return t[1]
L2 = sorted(L, key=by_name)
L2 = sorted(L2, key=by_score)
print(L2)
~~~
- Python教程
- Python簡介
- 安裝Python
- Python解釋器
- 第一個 Python 程序
- 使用文本編輯器
- Python代碼運行助手
- 輸入和輸出
- 源碼
- learning.py
- Python基礎
- 數據類型和變量
- 字符串和編碼
- 使用list和tuple
- 條件判斷
- 循環
- 使用dict和set
- 函數
- 調用函數
- 定義函數
- 函數的參數
- 遞歸函數
- 高級特性
- 切片
- 迭代
- 列表生成式
- 生成器
- 迭代器
- 函數式編程
- 高階函數
- map/reduce
- filter
- sorted
- 返回函數
- 匿名函數
- 裝飾器
- 偏函數
- Python函數式編程——偏函數(來自博客)
- 模塊
- 使用模塊
- 安裝第三方模塊
- 面向對象編程
- 類和實例
- 訪問限制
- 繼承和多態
- 獲取對象信息
- 實例屬性和類屬性
- 面向對象高級編程
- 使用__slots__
- 使用@property
- 多重繼承
- 定制類
- 使用枚舉類
- 使用元類
- 錯誤、調試和測試
- 錯誤處理
- 調試
- 單元測試
- 文檔測試
- IO編程
- 文件讀寫
- StringIO和BytesIO
- 操作文件和目錄
- 序列化
- 進程和線程
- 多進程
- 多線程
- ThreadLocal
- 進程 vs. 線程
- 分布式進程
- 正則表達式
- 常用內建模塊
- datetime
- collections
- base64
- struct
- hashlib
- itertools
- contextlib
- XML
- HTMLParser
- urllib
- 常用第三方模塊
- PIL
- virtualenv
- 圖形界面
- 網絡編程
- TCP/IP簡介
- TCP編程
- UDP編程
- 電子郵件
- SMTP發送郵件
- POP3收取郵件
- 訪問數據庫
- 使用SQLite
- 使用MySQL
- 使用SQLAlchemy
- Web開發
- HTTP協議簡介
- HTML簡介
- WSGI接口
- 使用Web框架
- 使用模板
- 異步IO
- 協程
- asyncio
- async/await
- aiohttp
- 實戰
- Day 1 - 搭建開發環境
- Day 2 - 編寫Web App骨架
- Day 3 - 編寫ORM
- Day 4 - 編寫Model
- Day 5 - 編寫Web框架
- Day 6 - 編寫配置文件
- Day 7 - 編寫MVC
- Day 8 - 構建前端
- Day 9 - 編寫API
- Day 10 - 用戶注冊和登錄
- Day 11 - 編寫日志創建頁
- Day 12 - 編寫日志列表頁
- Day 13 - 提升開發效率
- Day 14 - 完成Web App
- Day 15 - 部署Web App
- Day 16 - 編寫移動App
- FAQ
- 期末總結