# 原生字符串標識
比如,你用標準regex庫來寫一個正則表達式,但正則表達式中的反斜杠’\’其實卻是一個“轉義(escape)”操作符(用于特殊字符),這相當令人討厭。考慮如何去寫_“由反斜杠隔開的兩個詞語”_這樣一個模式(\w\\\w):
```
string s = "\\w\\\\\\w"; // 希望它是對的(譯注:不直觀、不美觀,且容易出錯)
```
請注意,在正則表達式和普通C++字符串中,各自都需要使用連續兩個反斜杠來表示反斜杠本身。然而,假如使用C++11的原生字符串,_**反斜杠本身**_僅需一個反斜杠就可以表示。因而,上述的例子簡化為:
```
string s = R"(\w\\\w)"; // 這次百分百正確
```
引發原生字符串標識提議的是這樣一個“驚天地泣鬼神”的例子:
```
"('(?:[^\\\\']|\\\\.)*'|\"(?:[^\\\\\"]|\\\\.)*\")|" // 這五個反斜杠是否正確?
// 即使是專家,也很容易被這么多反斜杠搞得暈頭轉向
```
**R”(…)”**記法相比于”…”會有一點點的冗長,但為了不必使用煩瑣的“轉義(escape)”符號,“多一點”是必要的。
那么,如何將雙引號**‘”‘**本身放到原生字符串里呢?只要它不是正好跟在_**右括弧’)’**_之后,那么非常簡單:
```
R"("quoted string")" // 這個字符串是 “quoted string”
```
但是,假如我們偏要在原生字符串中表達_**右括弧后跟雙引號 )”** _這樣一個奇葩組合呢?首先,幸運地是,這種情況一般很少碰到;其次,”(…)”分隔法只不過是默認的分隔語法罷了。通過在**“(…)”**的**(…)**前后添加顯式的自定義分隔號(譯注:例如下面例子中的三個星號***),我們還可以創造出任何我們想要的分隔語法。
```
// 字符串為:"quoted string containing the usual terminator (")"
R"***("quoted string containing the usual terminator (")")***"
```
在右括弧之后的字符序列(即:自定義分隔號)必須與左括弧之前的字符序列相同。通過這種方式,我們幾乎可以處理任意復雜的模式。
參考:
* Standard 2.13.4
* [N2053=06-0123] Beman Dawes: [Raw string literals](http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2006/n2053.html) . (original proposal)
* [N2442=07-0312] Lawrence Crowl and Beman Dawes: [Raw and Unicode String Literals; Unified Proposal (Rev. 2)](http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2007/n2442.htm) . (final proposal combined with the [User-defined literals](http://www2.research.att.com/%7Ebs/C++0xFAQ.html#UD-literals) proposal).
(翻譯:張瀟,dabaitu)
- C++11 FAQ中文版 - C++11 FAQ
- Stroustrup先生關于中文版的授權許可郵件
- Stroustrup先生關于C++11 FAQ的一些說明
- 關于C++11的一般性的問題
- 您是如何看待C++11的?
- 什么時候C++0x會成為一部正式的標準呢?
- 編譯器何時將會實現C++11標準呢?
- 我們何時可以用到新的標準庫文件?
- C++0x將提供何種新的語言特性呢?
- C++11會提供哪些新的標準庫文件呢?
- C++0x努力要達到的目標有哪些?
- 指導標準委員會的具體設計目標是什么?
- 在哪里可以找到標準委員會的報告?
- 從哪里可以獲得有關C++11的學術性和技術性的參考資料?
- 還有哪些地方我可以讀到關于 C++0x的資料?
- 有關于C++11的視頻嗎?
- C++0x難學嗎?
- 標準委員會是如何運行的?
- 誰在標準委員會里?
- 實現者應以什么順序提供C++11特性?
- 將會是C++1x嗎?
- 標準中的"concepts"怎么了?
- 有你不喜歡的C++特性嗎?
- 關于獨立的語言特性的問題
- __cplusplus宏
- alignment(對齊方式)
- 屬性(Attributes)
- atomic_operations
- auto – 從初始化中推斷數據類型
- C99功能特性
- 枚舉類——具有類域和強類型的枚舉
- carries_dependency
- 復制和重新拋出異常
- 常量表達式(constexpr)
- decltype – 推斷表達式的數據類型
- 控制默認函數——默認或者禁用
- 控制默認函數——移動(move)或者復制(copy)
- 委托構造函數(Delegating constructors)
- 并發性動態初始化和析構
- noexcept – 阻止異常的傳播與擴散
- 顯式轉換操作符
- 擴展整型
- 外部模板聲明
- 序列for循環語句
- 返回值類型后置語法
- 類成員的內部初始化
- 繼承的構造函數
- 初始化列表
- 內聯命名空間
- Lambda表達式
- 用作模板參數的局部類型
- long long(長長整數類型)
- 內存模型
- 預防窄轉換
- nullptr——空指針標識
- 對重載(override)的控制: override
- 對重載(override)的控制:final
- POD
- 原生字符串標識
- 右角括號
- 右值引用
- Simple SFINAE rule
- 靜態(編譯期)斷言 — static_assert
- 模板別名(正式的名稱為"template typedef")
- 線程本地化存儲 (thread_local)
- unicode字符
- 統一初始化的語法和語義
- (廣義的)聯合體
- 用戶定義數據標識(User-defined literals)
- 可變參數模板(Variadic Templates)
- 關于標準庫的問題
- abandoning_a_process
- 算法方面的改進
- array
- async()
- atomic_operations
- 條件變量(Condition variables)
- 標準庫中容器方面的改進
- std::function 和 std::bind
- std::forward_list
- std::future和std::promise
- 垃圾回收(應用程序二進制接口)
- 無序容器(unordered containers)
- 鎖(locks)
- metaprogramming(元編程)and type traits
- 互斥
- 隨機數的產生
- 正則表達式(regular expressions)
- 具有作用域的內存分配器
- 共享資源的智能指針——shared_ptr
- smart pointers
- 線程(thread)
- 時間工具程序
- 標準庫中的元組(std::tuple)
- unique_ptr
- weak_ptr
- system error