### 6.2.2 列表
我們先回顧第 2 章中介紹的關于列表的知識。 列表是由多個數據組成的序列,可以通過索引(位置序號)來訪問列表中的數據。與很
多編程語言提供的數組(array)類型不同,Python 列表具有兩個特點:第一,列表成員可 以由任意類型的數據構成,不要求各成員具有相同類型;第二,列表長度是不定的,隨時可 以增加和刪除成員。另外,與 Python 字符串類型不同,Python 列表是可以修改的,修改方 式包括向列表添加成員、從列表刪除成員以及對列表的某個成員進行修改。
作為序列的一種,我們可以對列表施加序列的基本操作,如索引、合并和復制等(參見 表 6.1)。另外由于列表是可以修改的,Python 還為列表提供了修改操作,見表 6.3。
| 修改方式 | 含義 |
| --- | --- |
| a[i] = x | 將列表 a 中索引為 i 的成員改為 x |
| a[i:j] = b | 將列表 a 中索引從 i 到 j(不含)的片段改為列表 b |
| del a[i] | 將列表 a 中索引為 i 的成員刪除 |
| del a[i:j] | 將列表 a 中索引從 i 到 j(不含)的片段刪除 |
表 6.3 列表的修改
本節要引入的是面向對象方式的列表操作。和字符串一樣,Python 列表實際上也是對 象,提供了很多有用的方法。例如,append()方法用于向列表尾部添加成員數據:
```
>>> a = ['hi']
>>> a.append('there')
>>> a
['hi', 'there']
```
利用 append()方法,我們可以將用戶輸入的一批數據存儲到一個列表中:
```
data = []
x = raw_input('Enter a number: ')
while x != "":
data.append(eval(x))
x = raw_input("Enter a number: ")
```
這段代碼實際上是累積算法,其中的列表 data 就是累積器:首先初始化為空列表,然后通 過循環來逐步累積(添加成員數據)。
表 6.4 列出了列表對象的常用方法。
| 方法 | 含義 |
| --- | --- |
| <列表>.append(x) | 將 x 添加到<列表>的尾部 |
| <列表>.sort() | 對<列表>排序(使用缺省比較函數 cmp) |
| <列表>.sort(mycmp) | 對<列表>排序(使用自定義比較函數 mycmp) |
| <列表>.reverse() | 將<列表>次序顛倒 |
| <列表>.index(x) | 返回 x 在<列表>中第一次出現處的索引 |
| <列表>.insert(i,x) | 在<列表>中索引 i 處插入成員 x |
| <列表>.count(x) | 返回<列表>中 x 的出現次數 |
| <列表>.remove(x) | 刪除<列表>中 x 的第一次出現 |
| <列表>.pop() | 刪除<列表>中最后一個成員并返回該成員 |
| <列表>.pop(i) | 刪除<列表>中第 i 個成員并返回該成員 |
表 6.4 列表對象的方法
下面通過例子來說明對列表對象的處理:
```
>>> a = ['Irrational',[3.14,2.718],'pi and e']
>>> a.sort()
>>> a
[[3.14, 2.718], 'Irrational', 'pi and e']
>>> a[0].reverse()
>>> a
[[2.718, 3.14], 'Irrational', 'pi and e']
>>> a.insert(2,'number')
>>> a
[[2.718, 3.14], 'Irrational', 'number', 'pi and e']
>>> print a.pop(0)
[2.718, 3.14]
>>> a
['Irrational', 'number', 'pi and e']
```
編程案例:一個統計程序 對大量數據進行統計、分析是實際應用中常見的問題,通過計算一些統計指標可以獲得有關這批數據的多側面的特征。常用的統計指標包括總和、算術平均值、中位數、眾數、標 準差和方差等,這些指標的計算過程具有不同的特性。
“總和”是可以累積計算的,即可以先計算部分數據的和 sum,當有了新數據再加入 sum 并形成新的 sum。重復上述步驟直至所有數據都已加入 sum,這時所得即總和。利用我 們介紹過的累積算法模式,很容易實現求總和的代碼:
```
sum = 0
data = raw_input("輸入新數據: ")
while data != "":
x = eval(data)
sum = sum + x
```
從以上代碼可以看到,雖然用戶輸入了很多數據,但程序中卻始終只用一個簡單變量data 來存儲輸入的數據。為什么不怕后面輸入的數據將前面輸入的數據覆蓋掉呢?巧妙之處 在于,累積算法每次接收一個輸入數據就立即使用該數據(將新數據加到累加變量 sum 中), 從而使變量 data 可以用于存儲下一個輸入數據。我們沒有采用“先將所有輸入數據存儲起 來,然后再求和”的處理策略,因為這個策略需要大量存儲空間,更麻煩的是我們預先并不 知道需要多少存儲空間。類似地,輸入數據的“個數”也可以利用累積算法來求得。
再看“算術平均值”指標,雖然它本身不能直接累積計算,但根據公式“平均值=總和÷數據個數”可見,可以通過累積算法求得“總和”和“數據個數”,然后直接算出平均值。 推而廣之,如果某個統計指標可以表示成某些累積類型指標的代數式,那么這個指標就可以 利用累積算法進行計算,無需保存所有輸入數據。
再看一個統計指標——中位數(median)。中位數將全體數據劃分為小于和大于它的兩 部分,并且兩部分的數據個數相等。如果全體數據從小到大有序排列,則處于中間位置的那 個數據就是中位數①。例如,數據集合{3,4,22,50,64}的中位數是 22。中位數的計算與總和、 算術平均值都不同,因為它不能通過累積來計算,如{3,4}的中位數與{3,4,22}的中位數直至{3,4,22,50,64}的中位數基本沒什么關系。因此,為了對用戶輸入的一組數據求中位數,必須 將每個數據先保存起來,等全體數據都到位后才能計算。與中位數類似的、不具有累積計算 性質的統計指標還有眾數、標準差等,可以稱之為“整體型”指標,即它們都需要針對全體 數據進行計算。那么,如何存儲所有輸入數據呢?顯然,定義許多獨立變量來存儲輸入數據 是不合適的,因為我們不知道用戶會輸入多少個數據;即使知道用戶將輸入 n 個數據,定義 n 個獨立變量來存儲這些數據也是非常笨拙的做法。其實問題很容易解決,列表可以將所有 輸入數據組合成單個數據,這樣既保存了所有數據,又不需要定義許多獨立變量。
下面我們來編寫一個統計程序,其功能是獲得用戶輸入的數值數據,并求出這批數據的 總和、算術平均值和中位數。如前所述,這三個指標分別代表三種類型的統計指標,因此我 們的統計程序雖然簡單,但具有一般的意義。
按照模塊化設計思想,我們分別為數據輸入及每個指標的計算設計一個函數。 首先設計獲得輸入數據的函數。由于整體型指標中位數的計算需要用到全體輸入數據,因此我們先將所有輸入數據存儲到一個列表中。獲得用戶輸入的關鍵代碼是一個哨兵循環, 數據列表是一個累積器,在循環中逐個接收數據。代碼如下:
> ① 若數據個數為偶數,則取處于中間位置的兩個數據的平均值。
```
def getInput(): data = []
x = raw_input("Enter a number (<Enter> to quit): ")
while x != "":
data.append(eval(x))
x = raw_input("Enter a number (<Enter> to quit): ")
return data
```
接著設計三個統計指標的函數。這些函數的參數都是列表 aList,調用時將存儲輸入數 據的 data 作為實參傳遞給 aList 即可。總和及算術平均值很容易計算,只要先對輸入列表利 用累積求得總和,然后再除以列表長度即得平均值。列表長度可以用 len()直接求得,不需 要另外寫一個累積循環。代碼如下:
```
def sum(aList):
s = 0.0
for x in aList:
s = s + x
return s
def mean(aList):
return sum(aList) / len(aList)
```
中位數的計算沒有代數公式可用,我們先將全體數據從小到大排序,然后取中間位置的 數據值。當數據個數為奇數時,有唯一的中間位置,故中位數很容易找到;當數據個數為偶 數時,中位數是處于中間位置的兩個數據的平均值。列表數據的排序可以利用現成的列表對 象方法 sort()實現,而奇偶性可以利用余數運算的結果來判斷。代碼如下:
```
def median(aList):
aList.sort()
size = len(aList)
mid = size / 2
if size % 2 == 1:
m = aList[mid]
else:
m = (aList[mid] + aList[mid-1]) / 2.0
return m
```
利用以上四個模塊,再加上主控模塊 main(),就完成了我們的統計程序。完整代碼見程 序 6.1。
【程序 6.1】statistics.py
```
def getInputs(): d = []
x = raw_input("Enter a number (<Enter> to quit): ")
while x != "":
d.append(eval(x))
x = raw_input("Enter a number (<Enter> to quit): ")
return d
def sum(aList): s = 0.0
for x in aList:
s = s + x
return s
def mean(aList):
return sum(aList) / len(aList)
def median(aList): aList.sort()
size = len(aList)
mid = size / 2
if size % 2 == 1:
m = aList[mid]
else:
m = (aList[mid] + aList[mid-1]) / 2.0
return m
def main():
print "This program computes sum, mean and median."
data = getInputs()
sigma = sum(data)
xbar = mean(data)
med = median(data)
print "Sum:", sigma
print "Average:", xbar
print "Median:", med
main()
```
- 前言
- 第 1 章 計算與計算思維
- 1.1 什么是計算?
- 1.1.1 計算機與計算
- 1.1.2 計算機語言
- 1.1.3 算法
- 1.1.4 實現
- 1.2 什么是計算思維?
- 1.2.1 計算思維的基本原則
- 1.2.2 計算思維的具體例子
- 1.2.3 日常生活中的計算思維
- 1.2.4 計算思維對其他學科的影響
- 1.3 初識 Python
- 1.3.1 Python 簡介
- 1.3.2 第一個程序
- 1.3.3 程序的執行方式
- 1.3.4 Python 語言的基本成分
- 1.4 程序排錯
- 1.5 練習
- 第 2 章 用數據表示現實世界
- 2.1 數據和數據類型
- 2.1.1 數據是對現實的抽象
- 2.1.1 常量與變量
- 2.1.2 數據類型
- 2.1.3 Python 的動態類型*
- 2.2 數值類型
- 2.2.1 整數類型 int
- 2.2.2 長整數類型 long
- 2.2.3 浮點數類型 float
- 2.2.4 數學庫模塊 math
- 2.2.5 復數類型 complex*
- 2.3 字符串類型 str
- 2.3.1 字符串類型的字面值形式
- 2.3.2 字符串類型的操作
- 2.3.3 字符的機內表示
- 2.3.4 字符串類型與其他類型的轉換
- 2.3.5 字符串庫 string
- 2.4 布爾類型 bool
- 2.4.1 關系運算
- 2.4.2 邏輯運算
- 2.4.3 布爾代數運算定律*
- 2.4.4 Python 中真假的表示與計算*
- 2.5 列表和元組類型
- 2.5.1 列表類型 list
- 2.5.2 元組類型 tuple
- 2.6 數據的輸入和輸出
- 2.6.1 數據的輸入
- 2.6.2 數據的輸出
- 2.6.3 格式化輸出
- 2.7 編程案例:查找問題
- 2.8 練習
- 第 3 章 數據處理的流程控制
- 3.1 順序控制結構
- 3.2 分支控制結構
- 3.2.1 單分支結構
- 3.2.2 兩路分支結構
- 3.2.3 多路分支結構
- 3.3 異常處理
- 3.3.1 傳統的錯誤檢測方法
- 3.3.2 傳統錯誤檢測方法的缺點
- 3.3.3 異常處理機制
- 3.4 循環控制結構
- 3.4.1 for 循環
- 3.4.2 while 循環
- 3.4.3 循環的非正常中斷
- 3.4.4 嵌套循環
- 3.5 結構化程序設計
- 3.5.1 程序開發過程
- 3.5.2 結構化程序設計的基本內容
- 3.6 編程案例:如何求 n 個數據的最大值?
- 3.6.1 幾種解題策略
- 3.6.2 經驗總結
- 3.7 Python 布爾表達式用作控制結構*
- 3.8 練習
- 第 4 章 模塊化編程
- 4.1 模塊化編程基本概念
- 4.1.1 模塊化設計概述
- 4.1.2 模塊化編程
- 4.1.3 編程語言對模塊化編程的支持
- 4.2 Python 語言中的函數
- 4.2.1 用函數減少重復代碼 首先看一個簡單的用字符畫一棵樹的程序:
- 4.2.2 用函數改善程序結構
- 4.2.3 用函數增強程序的通用性
- 4.2.4 小結:函數的定義與調用
- 4.2.5 變量的作用域
- 4.2.6 函數的返回值
- 4.3 自頂向下設計
- 4.3.1 頂層設計
- 4.3.2 第二層設計
- 4.3.3 第三層設計
- 4.3.4 第四層設計
- 4.3.5 自底向上實現與單元測試
- 4.3.6 開發過程小結
- 4.4 Python 模塊*
- 4.4.1 模塊的創建和使用
- 4.4.2 Python 程序架構
- 4.4.3 標準庫模塊
- 4.4.4 模塊的有條件執行
- 4.5 練習
- 第 5 章 圖形編程
- 5.1 概述
- 5.1.1 計算可視化
- 5.1.2 圖形是復雜數據
- 5.1.3 用對象表示復雜數據
- 5.2 Tkinter 圖形編程
- 5.2.1 導入模塊及創建根窗口
- 5.2.2 創建畫布
- 5.2.3 在畫布上繪圖
- 5.2.4 圖形的事件處理
- 5.3 編程案例
- 5.3.1 統計圖表
- 5.3.2 計算機動畫
- 5.4 軟件的層次化設計:一個案例
- 5.4.1 層次化體系結構
- 5.4.2 案例:圖形庫 graphics
- 5.4.3 graphics 與面向對象
- 5.5 練習
- 第 6 章 大量數據的表示和處理
- 6.1 概述
- 6.2 有序的數據集合體
- 6.2.1 字符串
- 6.2.2 列表
- 6.2.3 元組
- 6.3 無序的數據集合體
- 6.3.1 集合
- 6.3.2 字典
- 6.4 文件
- 6.4.1 文件的基本概念
- 6.4.2 文件操作
- 6.4.3 編程案例:文本文件分析
- 6.4.4 緩沖
- 6.4.5 二進制文件與隨機存取*
- 6.5 幾種高級數據結構*
- 6.5.1 鏈表
- 6.5.2 堆棧
- 6.5.3 隊列
- 6.6 練習
- 第 7 章 面向對象思想與編程
- 7.1 數據與操作:兩種觀點
- 7.1.1 面向過程觀點
- 7.1.2 面向對象觀點
- 7.1.3 類是類型概念的發展
- 7.2 面向對象編程
- 7.2.1 類的定義
- 7.2.2 對象的創建
- 7.2.3 對象方法的調用
- 7.2.4 編程實例:模擬炮彈飛行
- 7.2.5 類與模塊化
- 7.2.6 對象的集合體
- 7.3 超類與子類*
- 7.3.1 繼承
- 7.3.2 覆寫
- 7.3.3 多態性
- 7.4 面向對象設計*
- 7.5 練習
- 第 8 章 圖形用戶界面
- 8.1 圖形用戶界面概述
- 8.1.1 程序的用戶界面
- 8.1.2 圖形界面的組成
- 8.1.3 事件驅動
- 8.2 GUI 編程
- 8.2.1 UI 編程概述
- 8.2.2 初識 Tkinter
- 8.2.3 常見 GUI 構件的用法
- 8.2.4 布局
- 8.2.5 對話框*
- 8.3 Tkinter 事件驅動編程
- 8.3.1 事件和事件對象
- 8.3.2 事件處理
- 8.4 模型-視圖設計方法
- 8.4.1 將 GUI 應用程序封裝成對象
- 8.4.2 模型與視圖
- 8.4.3 編程案例:匯率換算器
- 8.5 練習
- 第 9 章 模擬與并發
- 9.1 模擬
- 9.1.1 計算機建模
- 9.1.2 隨機問題的建模與模擬
- 9.1.3 編程案例:乒乓球比賽模擬
- 9.2 原型法
- 9.3 并行計算*
- 9.3.1 串行、并發與并行
- 9.3.2 進程與線程
- 9.3.3 多線程編程的應用
- 9.3.4 Python 多線程編程
- 9.3.5 小結
- 9.4 練習
- 第 10 章 算法設計和分析
- 10.1 枚舉法
- 10.2 遞歸
- 10.3 分治法
- 10.4 貪心法
- 10.5 算法分析
- 10.5.1 算法復雜度
- 10.5.2 算法分析實例
- 10.6 不可計算的問題
- 10.7 練習
- 第 11 章 計算+X
- 11.1 計算數學
- 11.2 生物信息學
- 11.3 計算物理學
- 11.4 計算化學
- 11.5 計算經濟學
- 11.6 練習
- 附錄
- 1 Python 異常處理參考
- 2 Tkinter 畫布方法
- 3 Tkinter 編程參考
- 3.1 構件屬性值的設置
- 3.2 構件的標準屬性
- 3.3 各種構件的屬性
- 3.4 對話框
- 3.5 事件
- 參考文獻