# set 數據結構
# `set`(集合)數據結構
`set`(集合)是一個非常有用的數據結構。它與列表(`list`)的行為類似,區別在于`set`不能包含重復的值。
這在很多情況下非常有用。例如你可能想檢查列表中是否包含重復的元素,你有兩個選擇,第一個需要使用`for`循環,就像這樣:
~~~
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:
if some_list.count(value) > 1:
if value not in duplicates:
duplicates.append(value)
print(duplicates)
### 輸出: ['b', 'n']
~~~
但還有一種更簡單更優雅的解決方案,那就是使用`集合(sets)`,你直接這樣做:
~~~
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
### 輸出: set(['b', 'n'])
~~~
集合還有一些其它方法,下面我們介紹其中一部分。
### 交集
你可以對比兩個集合的交集(兩個集合中都有的數據),如下:
~~~
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
### 輸出: set(['red'])
~~~
### 差集
你可以用差集(difference)找出無效的數據,相當于用一個集合減去另一個集合的數據,例如:
~~~
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
### 輸出: set(['brown'])
~~~
你也可以用符號來創建集合,如:
~~~
a_set = {'red', 'blue', 'green'}
print(type(a_set))
### 輸出: <type 'set'>
~~~
集合還有一些其它方法,我會建議訪問官方文檔并做個快速閱讀。
- 簡介
- 序
- 譯后感
- 原作者前言
- *args 和 **kwargs
- *args 的用法
- **kwargs 的用法
- 使用 *args 和 **kwargs 來調用函數
- 啥時候使用它們
- 調試 Debugging
- 生成器 Generators
- 可迭代對象(Iterable)
- 迭代器(Iterator)
- 迭代(Iteration)
- 生成器(Generators)
- Map和Filter
- Map
- Filter
- set 數據結構
- 三元運算符
- 裝飾器
- 一切皆對象
- 在函數中定義函數
- 從函數中返回函數
- 將函數作為參數傳給另一個函數
- 你的第一個裝飾器
- 使用場景
- 授權
- 日志
- 帶參數的裝飾器
- 在函數中嵌入裝飾器
- 裝飾器類
- Global和Return
- 多個return值
- 對象變動 Mutation
- slots魔法
- 虛擬環境
- 容器 Collections
- 枚舉 Enumerate
- 對象自省
- dir
- type和id
- inspect模塊
- 推導式 Comprehension
- 列表推導式
- 字典推導式
- 集合推導式
- 異常
- 處理多個異常
- finally從句
- try/else從句
- lambda表達式
- 一行式
- For - Else
- else語句
- open函數
- 目標Python2+3
- 協程
- 函數緩存
- Python 3.2+
- Python 2+
- 上下文管理器
- 基于類的實現
- 處理異常
- 基于生成器的實現