# 3.4 檢測BLAS和LAPACK數學庫
**NOTE**:*此示例代碼可以在 https://github.com/dev-cafe/cmake-cookbook/tree/v1.0/chapter-03/recipe-04 中找到,有一個C++示例。該示例在CMake 3.5版(或更高版本)中是有效的,并且已經在GNU/Linux、macOS和Windows上進行過測試。*
許多數據算法嚴重依賴于矩陣和向量運算。例如:矩陣-向量和矩陣-矩陣乘法,求線性方程組的解,特征值和特征向量的計算或奇異值分解。這些操作在代碼庫中非常普遍,因為操作的數據量比較大,因此高效的實現有絕對的必要。幸運的是,有專家庫可用:基本線性代數子程序(BLAS)和線性代數包(LAPACK),為許多線性代數操作提供了標準API。供應商有不同的實現,但都共享API。雖然,用于數學庫底層實現,實際所用的編程語言會隨著時間而變化(Fortran、C、Assembly),但是也都是Fortran調用接口。考慮到調用街擴,本示例中的任務要鏈接到這些庫,并展示如何用不同語言編寫的庫。
## 準備工作
為了展示數學庫的檢測和連接,我們編譯一個C++程序,將矩陣的維數作為命令行輸入,生成一個隨機的方陣**A**,一個隨機向量**b**,并計算線性系統方程: **Ax = b**。另外,將對向量**b**的進行隨機縮放。這里,需要使用的子程序是BLAS中的DSCAL和LAPACK中的DGESV來求線性方程組的解。示例C++代碼的清單( `linear-algebra.cpp`):
```c++
#include "CxxBLAS.hpp"
#include "CxxLAPACK.hpp"
#include <iostream>
#include <random>
#include <vector>
int main(int argc, char** argv) {
if (argc != 2) {
std::cout << "Usage: ./linear-algebra dim" << std::endl;
return EXIT_FAILURE;
}
// Generate a uniform distribution of real number between -1.0 and 1.0
std::random_device rd;
std::mt19937 mt(rd());
std::uniform_real_distribution<double> dist(-1.0, 1.0);
// Allocate matrices and right-hand side vector
int dim = std::atoi(argv[1]);
std::vector<double> A(dim * dim);
std::vector<double> b(dim);
std::vector<int> ipiv(dim);
// Fill matrix and RHS with random numbers between -1.0 and 1.0
for (int r = 0; r < dim; r++) {
for (int c = 0; c < dim; c++) {
A[r + c * dim] = dist(mt);
}
b[r] = dist(mt);
}
// Scale RHS vector by a random number between -1.0 and 1.0
C_DSCAL(dim, dist(mt), b.data(), 1);
std::cout << "C_DSCAL done" << std::endl;
// Save matrix and RHS
std::vector<double> A1(A);
std::vector<double> b1(b);
int info;
info = C_DGESV(dim, 1, A.data(), dim, ipiv.data(), b.data(), dim);
std::cout << "C_DGESV done" << std::endl;
std::cout << "info is " << info << std::endl;
double eps = 0.0;
for (int i = 0; i < dim; ++i) {
double sum = 0.0;
for (int j = 0; j < dim; ++j)
sum += A1[i + j * dim] * b[j];
eps += std::abs(b1[i] - sum);
}
std::cout << "check is " << eps << std::endl;
return 0;
}
```
使用C++11的隨機庫來生成-1.0到1.0之間的隨機分布。`C_DSCAL`和`C_DGESV`分別是到BLAS和LAPACK庫的接口。為了避免名稱混淆,將在下面來進一步討論CMake模塊:
文件`CxxBLAS.hpp`用`extern "C"`封裝鏈接BLAS:
```c++
#pragma once
#include "fc_mangle.h"
#include <cstddef>
#ifdef __cplusplus
extern "C" {
#endif
extern void DSCAL(int *n, double *alpha, double *vec, int *inc);
#ifdef __cplusplus
}
#endif
void C_DSCAL(size_t length, double alpha, double *vec, int inc);
```
對應的實現文件`CxxBLAS.cpp`:
```c++
#include "CxxBLAS.hpp"
#include <climits>
// see http://www.netlib.no/netlib/blas/dscal.f
void C_DSCAL(size_t length, double alpha, double *vec, int inc) {
int big_blocks = (int)(length / INT_MAX);
int small_size = (int)(length % INT_MAX);
for (int block = 0; block <= big_blocks; block++) {
double *vec_s = &vec[block * inc * (size_t)INT_MAX];
signed int length_s = (block == big_blocks) ? small_size : INT_MAX;
::DSCAL(&length_s, &alpha, vec_s, &inc);
}
}
```
`CxxLAPACK.hpp`和`CxxLAPACK.cpp`為LAPACK調用執行相應的轉換。
## 具體實施
對應的`CMakeLists.txt`包含以下構建塊:
1. 我們定義了CMake最低版本,項目名稱和支持的語言:
```cmake
cmake_minimum_required(VERSION 3.5 FATAL_ERROR)
project(recipe-04 LANGUAGES CXX C Fortran)
```
2. 使用C++11標準:
```cmake
set(CMAKE_CXX_STANDARD 11)
set(CMAKE_CXX_EXTENSIONS OFF)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
```
3. 此外,我們驗證Fortran和C/C++編譯器是否能協同工作,并生成頭文件,這個文件可以處理名稱混亂。兩個功能都由`FortranCInterface`模塊提供:
```cmake
include(FortranCInterface)
FortranCInterface_VERIFY(CXX)
FortranCInterface_HEADER(
fc_mangle.h
MACRO_NAMESPACE "FC_"
SYMBOLS DSCAL DGESV
)
```
4. 然后,找到BLAS和LAPACK:
```cmake
find_package(BLAS REQUIRED)
find_package(LAPACK REQUIRED)
```
5. 接下來,添加一個庫,其中包含BLAS和LAPACK包裝器的源代碼,并鏈接到`LAPACK_LIBRARIES`,其中也包含`BLAS_LIBRARIES`:
```cmake
add_library(math "")
target_sources(math
PRIVATE
CxxBLAS.cpp
CxxLAPACK.cpp
)
target_include_directories(math
PUBLIC
${CMAKE_CURRENT_SOURCE_DIR}
${CMAKE_CURRENT_BINARY_DIR}
)
target_link_libraries(math
PUBLIC
${LAPACK_LIBRARIES}
)
```
6. 注意,目標的包含目錄和鏈接庫聲明為`PUBLIC`,因此任何依賴于數學庫的附加目標也將在其包含目錄中。
7. 最后,我們添加一個可執行目標并鏈接`math`:
```cmake
add_executable(linear-algebra "")
target_sources(linear-algebra
PRIVATE
linear-algebra.cpp
)
target_link_libraries(linear-algebra
PRIVATE
math
)
```
8. 配置時,我們可以關注相關的打印輸出:
```shell
$ mkdir -p build
$ cd build
$ cmake ..
...
-- Detecting Fortran/C Interface
-- Detecting Fortran/C Interface - Found GLOBAL and MODULE mangling
-- Verifying Fortran/C Compiler Compatibility
-- Verifying Fortran/C Compiler Compatibility - Success
...
-- Found BLAS: /usr/lib/libblas.so
...
-- A library with LAPACK API found.
...
```
9. 最后,構建并測試可執行文件:
```shell
$ cmake --build .
$ ./linear-algebra 1000
C_DSCAL done
C_DGESV done
info is 0
check is 1.54284e-10
```
## 工作原理
`FindBLAS.cmake`和`FindLAPACK.cmake`將在標準位置查找BLAS和LAPACK庫。對于前者,該模塊有`SGEMM`函數的Fortran實現,一般用于單精度矩陣乘積。對于后者,該模塊有`CHEEV`函數的Fortran實現,用于計算復雜厄米矩陣的特征值和特征向量。查找在CMake內部,通過編譯一個小程序來完成,該程序調用這些函數,并嘗試鏈接到候選庫。如果失敗,則表示相應庫不存于系統上。
生成機器碼時,每個編譯器都會處理符號混淆,不幸的是,這種操作并不通用,而與編譯器相關。為了解決這個問題,我們使用`FortranCInterface`模塊( https://cmake.org/cmake/help/v3.5/module/FortranCInterface.html )驗證Fortran和C/C++能否混合編譯,然后生成一個Fortran-C接口頭文件`fc_mangle.h`,這個文件用來解決編譯器性的問題。然后,必須將生成的`fc_mann .h`包含在接口頭文件`CxxBLAS.hpp`和`CxxLAPACK.hpp`中。為了使用`FortranCInterface`,我們需要在`LANGUAGES`列表中添加C和Fortran支持。當然,也可以定義自己的預處理器定義,但是可移植性會差很多。
我們將在第9章中更詳細地討論Fortran和C的互操作性。
**NOTE**:*目前,BLAS和LAPACK的許多實現已經在Fortran外附帶了一層C包裝。這些包裝器多年來已經標準化,稱為CBLAS和LAPACKE。*
## 更多信息
許多算法代碼比較依賴于矩陣代數運算,使用BLAS和LAPACK API的高性能實現就非常重要了。供應商為不同的體系結構和并行環境提供不同的庫,`FindBLAS.cmake`和` FindLAPACK.cmake`可能的無法定位到當前庫。如果發生這種情況,可以通過`-D`選項顯式地從CLI對庫進行設置。
- Introduction
- 前言
- 第0章 配置環境
- 0.1 獲取代碼
- 0.2 Docker鏡像
- 0.3 安裝必要的軟件
- 0.4 測試環境
- 0.5 上報問題并提出改進建議
- 第1章 從可執行文件到庫
- 1.1 將單個源文件編譯為可執行文件
- 1.2 切換生成器
- 1.3 構建和鏈接靜態庫和動態庫
- 1.4 用條件句控制編譯
- 1.5 向用戶顯示選項
- 1.6 指定編譯器
- 1.7 切換構建類型
- 1.8 設置編譯器選項
- 1.9 為語言設定標準
- 1.10 使用控制流
- 第2章 檢測環境
- 2.1 檢測操作系統
- 2.2 處理與平臺相關的源代碼
- 2.3 處理與編譯器相關的源代碼
- 2.4 檢測處理器體系結構
- 2.5 檢測處理器指令集
- 2.6 為Eigen庫使能向量化
- 第3章 檢測外部庫和程序
- 3.1 檢測Python解釋器
- 3.2 檢測Python庫
- 3.3 檢測Python模塊和包
- 3.4 檢測BLAS和LAPACK數學庫
- 3.5 檢測OpenMP的并行環境
- 3.6 檢測MPI的并行環境
- 3.7 檢測Eigen庫
- 3.8 檢測Boost庫
- 3.9 檢測外部庫:Ⅰ. 使用pkg-config
- 3.10 檢測外部庫:Ⅱ. 自定義find模塊
- 第4章 創建和運行測試
- 4.1 創建一個簡單的單元測試
- 4.2 使用Catch2庫進行單元測試
- 4.3 使用Google Test庫進行單元測試
- 4.4 使用Boost Test進行單元測試
- 4.5 使用動態分析來檢測內存缺陷
- 4.6 預期測試失敗
- 4.7 使用超時測試運行時間過長的測試
- 4.8 并行測試
- 4.9 運行測試子集
- 4.10 使用測試固件
- 第5章 配置時和構建時的操作
- 5.1 使用平臺無關的文件操作
- 5.2 配置時運行自定義命令
- 5.3 構建時運行自定義命令:Ⅰ. 使用add_custom_command
- 5.4 構建時運行自定義命令:Ⅱ. 使用add_custom_target
- 5.5 構建時為特定目標運行自定義命令
- 5.6 探究編譯和鏈接命令
- 5.7 探究編譯器標志命令
- 5.8 探究可執行命令
- 5.9 使用生成器表達式微調配置和編譯
- 第6章 生成源碼
- 6.1 配置時生成源碼
- 6.2 使用Python在配置時生成源碼
- 6.3 構建時使用Python生成源碼
- 6.4 記錄項目版本信息以便報告
- 6.5 從文件中記錄項目版本
- 6.6 配置時記錄Git Hash值
- 6.7 構建時記錄Git Hash值
- 第7章 構建項目
- 7.1 使用函數和宏重用代碼
- 7.2 將CMake源代碼分成模塊
- 7.3 編寫函數來測試和設置編譯器標志
- 7.4 用指定參數定義函數或宏
- 7.5 重新定義函數和宏
- 7.6 使用廢棄函數、宏和變量
- 7.7 add_subdirectory的限定范圍
- 7.8 使用target_sources避免全局變量
- 7.9 組織Fortran項目
- 第8章 超級構建模式
- 8.1 使用超級構建模式
- 8.2 使用超級構建管理依賴項:Ⅰ.Boost庫
- 8.3 使用超級構建管理依賴項:Ⅱ.FFTW庫
- 8.4 使用超級構建管理依賴項:Ⅲ.Google Test框架
- 8.5 使用超級構建支持項目
- 第9章 語言混合項目
- 9.1 使用C/C++庫構建Fortran項目
- 9.2 使用Fortran庫構建C/C++項目
- 9.3 使用Cython構建C++和Python項目
- 9.4 使用Boost.Python構建C++和Python項目
- 9.5 使用pybind11構建C++和Python項目
- 9.6 使用Python CFFI混合C,C++,Fortran和Python
- 第10章 編寫安裝程序
- 10.1 安裝項目
- 10.2 生成輸出頭文件
- 10.3 輸出目標
- 10.4 安裝超級構建
- 第11章 打包項目
- 11.1 生成源代碼和二進制包
- 11.2 通過PyPI發布使用CMake/pybind11構建的C++/Python項目
- 11.3 通過PyPI發布使用CMake/CFFI構建C/Fortran/Python項目
- 11.4 以Conda包的形式發布一個簡單的項目
- 11.5 將Conda包作為依賴項發布給項目
- 第12章 構建文檔
- 12.1 使用Doxygen構建文檔
- 12.2 使用Sphinx構建文檔
- 12.3 結合Doxygen和Sphinx
- 第13章 選擇生成器和交叉編譯
- 13.1 使用CMake構建Visual Studio 2017項目
- 13.2 交叉編譯hello world示例
- 13.3 使用OpenMP并行化交叉編譯Windows二進制文件
- 第14章 測試面板
- 14.1 將測試部署到CDash
- 14.2 CDash顯示測試覆蓋率
- 14.3 使用AddressSanifier向CDash報告內存缺陷
- 14.4 使用ThreadSaniiser向CDash報告數據爭用
- 第15章 使用CMake構建已有項目
- 15.1 如何開始遷移項目
- 15.2 生成文件并編寫平臺檢查
- 15.3 檢測所需的鏈接和依賴關系
- 15.4 復制編譯標志
- 15.5 移植測試
- 15.6 移植安裝目標
- 15.7 進一步遷移的措施
- 15.8 項目轉換為CMake的常見問題
- 第16章 可能感興趣的書
- 16.1 留下評論——讓其他讀者知道你的想法