3.6。支持的原子操作 · Numba 0.44 中文文檔

# 3.6。支持的原子操作 > 原文： [http://numba.pydata.org/numba-doc/latest/cuda/intrinsics.html](http://numba.pydata.org/numba-doc/latest/cuda/intrinsics.html) Numba 提供了對`numba.cuda.atomic`類中 CUDA 支持的一些原子操作的訪問。目前實施的內容如下： ```py class numba.cuda.atomic ``` 用于原子操作的命名空間 ```py class add(ary, idx, val) ``` 執行原子 ary [idx] + = val。僅在 int32，float32 和 float64 操作數上受支持。返回索引位置的舊值，就像它以原子方式加載一樣。 ```py class compare_and_swap(ary, old, val) ``` 如果當前值與`old`匹配，則有條件地將`val`分配給 1D 數組`ary`的第一個元素。返回當前值，就像它以原子方式加載一樣。 ```py class max(ary, idx, val) ``` 執行原子 ary [idx] = max（ary [idx]，val）。 NaN 被視為缺失值，因此 max（NaN，n）== max（n，NaN）== n。請注意，這與 Python 和 Numpy 行為不同，其中當 a 或 b 是 NaN 時，max（a，b）始終為 a。僅在 int32，int64，uint32，uint64，float32，float64 操作數上受支持。返回索引位置的舊值，就像它以原子方式加載一樣。 ```py class min(ary, idx, val) ``` 執行原子 ary [idx] = min（ary [idx]，val）。 NaN 被視為缺失值，因此 min（NaN，n）== min（n，NaN）== n。請注意，這與 Python 和 Numpy 行為不同，其中 min（a，b）始終是 a 或 b 是 NaN 時的行為。僅在 int32，int64，uint32，uint64，float32，float64 操作數上受支持。 ## 3.6.1。示例以下代碼演示了如何使用 [`numba.cuda.atomic.max`](../cuda-reference/kernel.html#numba.cuda.atomic.max "numba.cuda.atomic.max") 查找數組中的最大值。請注意，在這種情況下，這不是找到最大值的最有效方法，但它是一個例子： ```py from numba import cuda import numpy as np @cuda.jit def max_example(result, values): """Find the maximum value in values and store in result[0]""" tid = cuda.threadIdx.x bid = cuda.blockIdx.x bdim = cuda.blockDim.x i = (bid * bdim) + tid cuda.atomic.max(result, 0, values[i]) arr = np.random.rand(16384) result = np.zeros(1, dtype=np.float64) max_example[256,64](result, arr) print(result[0]) # Found using cuda.atomic.max print(max(arr)) # Print max(arr) for comparision (should be equal!) ``` 使用索引的元組元組支持多維數組： ```py @cuda.jit def max_example_3d(result, values): """ Find the maximum value in values and store in result[0]. Both result and values are 3d arrays. """ i, j, k = cuda.grid(3) # Atomically store to result[0,1,2] from values[i, j, k] cuda.atomic.max(result, (0, 1, 2), values[i, j, k]) arr = np.random.rand(1000).reshape(10,10,10) result = np.zeros((3, 3, 3), dtype=np.float64) max_example_3d[(2, 2, 2), (5, 5, 5)](result, arr) print(result[0, 1, 2], '==', np.max(arr)) ```