# 3.12。 GPU 減少
> 原文: [http://numba.pydata.org/numba-doc/latest/cuda/reduction.html](http://numba.pydata.org/numba-doc/latest/cuda/reduction.html)
為 CUDA GPU 編寫縮減算法可能很棘手。 Numba 提供了一個`@reduce`裝飾器,用于將簡單的二進制操作轉換為簡化內核。
## 3.12.1。 `@reduce`
例:
```py
import numpy
from numba import cuda
@cuda.reduce
def sum_reduce(a, b):
return a + b
A = (numpy.arange(1234, dtype=numpy.float64)) + 1
expect = A.sum() # numpy sum reduction
got = sum_reduce(A) # cuda sum reduction
assert expect == got
```
Lambda 函數也可以在這里使用:
```py
sum_reduce = cuda.reduce(lambda a, b: a + b)
```
## 3.12.2。減少
`reduce`裝飾器創建`Reduce`類的實例。 (目前,`reduce`是`Reduce`的別名,但不保證這種行為。)
```py
class numba.cuda.Reduce(functor)
```
```py
__call__(arr, size=None, res=None, init=0, stream=0)
```
完全減少。
| 參數: |
* **arr** - 主機或設備陣列。如果給出了設備數組,則會在原地執行縮減,并覆蓋數組中的值。如果給出了主機陣列,則會自動將其復制到設備。
* **size** - 可選整數,指定要減少的`arr`中的元素數。如果未指定此參數,則會減少整個數組。
* **res** - 將減少結果寫入的可選設備數組。結果寫入此數組的第一個元素。如果指定了此參數,則不會從設備到主機進行減少輸出的通信。
* **init** - 還原的可選初始值,其類型必須與`arr.dtype`匹配。
* **流** - 執行還原的可選 CUDA 流。如果未指定流,則使用默認流 0。
|
| --- | --- |
| 返回: | 如果指定了`res`,則返回`None`。否則,返回減少的結果。 |
| --- | --- |
```py
__init__(functor)
```
創建一個使用給定二進制函數減少值的縮減對象。二進制函數編譯一次并緩存在此對象中。保持此對象存活將阻止重新編譯。
| 參數: | **binop** - 要編譯為 CUDA 設備函數的函數,該函數將用作 CUDA 設備上的二進制運算。在內部,它使用`cuda.jit(device=True)`編譯。 |
| --- | --- |
- 1. 用戶手冊
- 1.1。 Numba 的約 5 分鐘指南
- 1.2。概述
- 1.3。安裝
- 1.4。使用@jit 編譯 Python 代碼
- 1.5。使用@generated_jit 進行靈活的專業化
- 1.6。創建 Numpy 通用函數
- 1.7。用@jitclass 編譯 python 類
- 1.8。使用@cfunc 創建 C 回調
- 1.9。提前編譯代碼
- 1.10。使用@jit 自動并行化
- 1.11。使用@stencil裝飾器
- 1.12。從 JIT 代碼 中回調到 Python 解釋器
- 1.13。性能提示
- 1.14。線程層
- 1.15。故障排除和提示
- 1.16。常見問題
- 1.17。示例
- 1.18。會談和教程
- 2. 參考手冊
- 2.1。類型和簽名
- 2.2。即時編譯
- 2.3。提前編譯
- 2.4。公用事業
- 2.5。環境變量
- 2.6。支持的 Python 功能
- 2.7。支持的 NumPy 功能
- 2.8。與 Python 語義的偏差
- 2.9。浮點陷阱
- 2.10。 Python 2.7 壽命終止計劃
- 3. 用于 CUDA GPU 的 Numba
- 3.1。概述
- 3.2。編寫 CUDA 內核
- 3.3。內存管理
- 3.4。編寫設備功能
- 3.5。 CUDA Python 中支持的 Python 功能
- 3.6。支持的原子操作
- 3.7。隨機數生成
- 3.8。設備管理
- 3.10。示例
- 3.11。使用 CUDA 模擬器 調試 CUDA Python
- 3.12。 GPU 減少
- 3.13。 CUDA Ufuncs 和廣義 Ufuncs
- 3.14。共享 CUDA 內存
- 3.15。 CUDA 陣列接口
- 3.16。 CUDA 常見問題
- 4. CUDA Python 參考
- 4.1。 CUDA 主機 API
- 4.2。 CUDA 內核 API
- 4.3。內存管理
- 5. 用于 AMD ROC GPU 的 Numba
- 5.1。概述
- 5.2。編寫 HSA 內核
- 5.3。內存管理
- 5.4。編寫設備功能
- 5.5。支持的原子操作
- 5.6。代理商
- 5.7。 ROC Ufuncs 和廣義 Ufuncs
- 5.8。示例
- 6. 擴展 Numba
- 6.1。高級擴展 API
- 6.2。低級擴展 API
- 6.3。示例:間隔類型
- 7. 開發者手冊
- 7.1。貢獻給 Numba
- 7.2。 Numba 建筑
- 7.3。多態調度
- 7.4。關于發電機的注意事項
- 7.5。關于 Numba Runtime 的注意事項
- 7.6。使用 Numba Rewrite Pass 獲得樂趣和優化
- 7.7。實時變量分析
- 7.8。上市
- 7.9。模板注釋
- 7.10。關于自定義管道的注意事項
- 7.11。環境對象
- 7.12。哈希 的注意事項
- 7.13。 Numba 項目路線圖
- 8. Numba 增強建議
- 9. 術語表