# 3.6。支持的原子操作
> 原文: [http://numba.pydata.org/numba-doc/latest/cuda/intrinsics.html](http://numba.pydata.org/numba-doc/latest/cuda/intrinsics.html)
Numba 提供了對`numba.cuda.atomic`類中 CUDA 支持的一些原子操作的訪問。
目前實施的內容如下:
```py
class numba.cuda.atomic
```
用于原子操作的命名空間
```py
class add(ary, idx, val)
```
執行原子 ary [idx] + = val。僅在 int32,float32 和 float64 操作數上受支持。
返回索引位置的舊值,就像它以原子方式加載一樣。
```py
class compare_and_swap(ary, old, val)
```
如果當前值與`old`匹配,則有條件地將`val`分配給 1D 數組`ary`的第一個元素。
返回當前值,就像它以原子方式加載一樣。
```py
class max(ary, idx, val)
```
執行原子 ary [idx] = max(ary [idx],val)。 NaN 被視為缺失值,因此 max(NaN,n)== max(n,NaN)== n。請注意,這與 Python 和 Numpy 行為不同,其中當 a 或 b 是 NaN 時,max(a,b)始終為 a。
僅在 int32,int64,uint32,uint64,float32,float64 操作數上受支持。
返回索引位置的舊值,就像它以原子方式加載一樣。
```py
class min(ary, idx, val)
```
執行原子 ary [idx] = min(ary [idx],val)。 NaN 被視為缺失值,因此 min(NaN,n)== min(n,NaN)== n。請注意,這與 Python 和 Numpy 行為不同,其中 min(a,b)始終是 a 或 b 是 NaN 時的行為。
僅在 int32,int64,uint32,uint64,float32,float64 操作數上受支持。
## 3.6.1。示例
以下代碼演示了如何使用 [`numba.cuda.atomic.max`](../cuda-reference/kernel.html#numba.cuda.atomic.max "numba.cuda.atomic.max") 查找數組中的最大值。請注意,在這種情況下,這不是找到最大值的最有效方法,但它是一個例子:
```py
from numba import cuda
import numpy as np
@cuda.jit
def max_example(result, values):
"""Find the maximum value in values and store in result[0]"""
tid = cuda.threadIdx.x
bid = cuda.blockIdx.x
bdim = cuda.blockDim.x
i = (bid * bdim) + tid
cuda.atomic.max(result, 0, values[i])
arr = np.random.rand(16384)
result = np.zeros(1, dtype=np.float64)
max_example[256,64](result, arr)
print(result[0]) # Found using cuda.atomic.max
print(max(arr)) # Print max(arr) for comparision (should be equal!)
```
使用索引的元組元組支持多維數組:
```py
@cuda.jit
def max_example_3d(result, values):
"""
Find the maximum value in values and store in result[0].
Both result and values are 3d arrays.
"""
i, j, k = cuda.grid(3)
# Atomically store to result[0,1,2] from values[i, j, k]
cuda.atomic.max(result, (0, 1, 2), values[i, j, k])
arr = np.random.rand(1000).reshape(10,10,10)
result = np.zeros((3, 3, 3), dtype=np.float64)
max_example_3d[(2, 2, 2), (5, 5, 5)](result, arr)
print(result[0, 1, 2], '==', np.max(arr))
```
- 1. 用戶手冊
- 1.1。 Numba 的約 5 分鐘指南
- 1.2。概述
- 1.3。安裝
- 1.4。使用@jit 編譯 Python 代碼
- 1.5。使用@generated_jit 進行靈活的專業化
- 1.6。創建 Numpy 通用函數
- 1.7。用@jitclass 編譯 python 類
- 1.8。使用@cfunc 創建 C 回調
- 1.9。提前編譯代碼
- 1.10。使用@jit 自動并行化
- 1.11。使用@stencil裝飾器
- 1.12。從 JIT 代碼 中回調到 Python 解釋器
- 1.13。性能提示
- 1.14。線程層
- 1.15。故障排除和提示
- 1.16。常見問題
- 1.17。示例
- 1.18。會談和教程
- 2. 參考手冊
- 2.1。類型和簽名
- 2.2。即時編譯
- 2.3。提前編譯
- 2.4。公用事業
- 2.5。環境變量
- 2.6。支持的 Python 功能
- 2.7。支持的 NumPy 功能
- 2.8。與 Python 語義的偏差
- 2.9。浮點陷阱
- 2.10。 Python 2.7 壽命終止計劃
- 3. 用于 CUDA GPU 的 Numba
- 3.1。概述
- 3.2。編寫 CUDA 內核
- 3.3。內存管理
- 3.4。編寫設備功能
- 3.5。 CUDA Python 中支持的 Python 功能
- 3.6。支持的原子操作
- 3.7。隨機數生成
- 3.8。設備管理
- 3.10。示例
- 3.11。使用 CUDA 模擬器 調試 CUDA Python
- 3.12。 GPU 減少
- 3.13。 CUDA Ufuncs 和廣義 Ufuncs
- 3.14。共享 CUDA 內存
- 3.15。 CUDA 陣列接口
- 3.16。 CUDA 常見問題
- 4. CUDA Python 參考
- 4.1。 CUDA 主機 API
- 4.2。 CUDA 內核 API
- 4.3。內存管理
- 5. 用于 AMD ROC GPU 的 Numba
- 5.1。概述
- 5.2。編寫 HSA 內核
- 5.3。內存管理
- 5.4。編寫設備功能
- 5.5。支持的原子操作
- 5.6。代理商
- 5.7。 ROC Ufuncs 和廣義 Ufuncs
- 5.8。示例
- 6. 擴展 Numba
- 6.1。高級擴展 API
- 6.2。低級擴展 API
- 6.3。示例:間隔類型
- 7. 開發者手冊
- 7.1。貢獻給 Numba
- 7.2。 Numba 建筑
- 7.3。多態調度
- 7.4。關于發電機的注意事項
- 7.5。關于 Numba Runtime 的注意事項
- 7.6。使用 Numba Rewrite Pass 獲得樂趣和優化
- 7.7。實時變量分析
- 7.8。上市
- 7.9。模板注釋
- 7.10。關于自定義管道的注意事項
- 7.11。環境對象
- 7.12。哈希 的注意事項
- 7.13。 Numba 項目路線圖
- 8. Numba 增強建議
- 9. 術語表