## 1.4 形式語言和自然語言
自然語言是指人類表達的語言,比如,英語、西班牙語和法語。自然語言不是由人類設計(盡管人類嘗試對其強加某些命令)的,而是通過自然演化的。
__形式語言__則是由人類為了某些特殊應用而設計的語言。例如,數學中使用的記號法就是一種特別擅長表示數字和符號間關系的形式語言。化學家使用某種形式語言來表示分子間的化學結構。而最重要的是:
__編程語言是用于表達計算過程的形式語言。__
正如我之前提到的,形式語言具有嚴格的語法規則。例如,3+3=6是一個語法正確的數學表達式,但是3=+6$就不是。同樣,H2O是一個語法正確的化學名詞,但是2Zz就不是。
語法規則有兩種:與標識有關的規則或者與結構有關的規則。標識是語言的基本元素,如單詞、數字以及化學元素。3=+6$的問題之一是$不是數學里合法的標識(至少據我所知是這樣)。類似地,因為化學里沒有縮寫為Zz的元素,所以 2Zz也是不合法的。
第二種語法錯誤是表達式結構的問題。所謂結構,就是標識的順序。表達式3=+6$在結構上就不合法,因為不能在等號之后直接使用加號。類似地,分子表達式需要在元素名之后添加下標而不是之前。
當你閱讀一句英文或者形式語言的一條語句,你需要找到它的結構(盡管這一行為在閱讀自然語言時是無意識的)。這一過程稱為__語法分析__。
舉個例子,當你聽到一句話:“另一只鞋掉了,”你會知道“另一只鞋”是主語而“掉”是動詞。一旦你解析了一個句子的語法,你會了解它是什么意思,就是句子的語義。假設你知道鞋是什么意思和掉了是什么意思,你就會明白這句話的大致含義。
盡管形式語言和自然語言有很多共同的特性,但是他們在標識、結構、語法以及語義上有很多不同。
__二義性:__自然語言充滿了二義性,需要人們根據上下文線索和其他信息理解。而形式語言幾乎沒有二義性,即形式語言的任何表達式都僅有一個含義,無關上下文。
__冗余性:__為了彌補歧義和減少誤解,自然語言引入了很多冗余,結果自然語言通常都很啰嗦。形式語言則更簡明扼要。
__文學性:__在自然語言中有很多習語和暗喻。如果我說另一只鞋掉了,很有可能指的不是鞋,也沒有什么東西掉了。而形式語言則精確地描述了它們表達的意思。
習慣于自然語言的人們(每個人)要適應形式語言通常都很艱難。在某些方面形式語言和自然語言的差別就像是詩歌和散文,但是更甚。
__詩歌:__詞匯的發音和意義都十分重要,而整首詩歌創造某種效果或者情感回應。詩歌中隨處可見精心設計的雙關語。
__散文:__相較于詩歌,散文中文字本身的含義更為重要,同時結構也具有更大的意義。散文雖然也有二義性,但是比詩歌容易分析。
__程序:__計算機程序的含義是純字面且無歧義的,并且可以通過分析標識和結構將其完整理解。
關于閱讀程序(還有其他一些形式語言)的幾條建議如下。首先,形式語言比自然語言難以理解得多,需要花費更長時間來閱讀。其次,形式語言的結構很重要。所以從頭到尾的完整閱讀并不是一個好方法。應該學會先將程序解析,識別標識和解釋結構。最后,記住細節決定成敗。像自然語言中無關大礙的錯誤拼寫和標點符號等,在形式語言中可能產生很大的影響。
- 譯者簡介
- 作者簡介
- 第1章 編程方式
- 1.1 什么是編程語言
- 1.2 什么是程序
- 1.3 什么是調試
- 1.4 形式語言和自然語言
- 1.5 第一個程序
- 1.6 術語
- 第2章 變量和類型
- 2.1 輸出更多
- 2.2 值
- 2.3 變量
- 2.4 賦值
- 2.5 輸出變量
- 2.6 關鍵字
- 2.7 運算符
- 2.8 計算順序
- 2.9 字符類型的運算符
- 2.10 組合
- 2.11 術語
- 第3章 函數
- 3.1 浮點數
- 3.2 從double轉換為int
- 3.3 數學函數
- 3.4 復合表達式
- 3.5 添加新的函數
- 3.6 定義和用法
- 3.7 多函數程序
- 3.8 形參和實參
- 3.9 形參和局部變量
- 3.10 多參數函數
- 3.11 帶返回值的函數
- 3.12 術語
- 第4章 條件和遞歸
- 4.1 模運算符
- 4.2 條件執行
- 4.3 選擇執行
- 4.4 鏈式條件
- 4.5 嵌套條件
- 4.6 return語句
- 4.7 遞歸
- 4.8 無限遞歸
- 4.9 遞歸函數的調用棧圖
- 4.10 術語
- 第5章 帶返回值的函數
- 5.1 返回值
- 5.2 程序開發
- 5.3 復合用法
- 5.4 重載
- 5.5 布爾值
- 5.6 布爾型變量
- 5.7 邏輯操作符
- 5.8 布爾函數
- 5.9 main函數返回值
- 5.10 多重遞歸
- 5.11信心的跳躍
- 5.12 更多的例子
- 5.13 術語
- 第6章 迭代
- 6.1 多次賦值
- 6.2 迭代
- 6.3 while語句
- 6.4 表格
- 6.5 二維表
- 6.6 封裝和廣義化
- 6.7 函數
- 6.8 更多封裝
- 6.9 局部變量
- 6.10 更多廣義化
- 6.11 術語
- 第7章 字符串和其他
- 7.1 字符串容器
- 7.2 apstring變量
- 7.3 字符串中的字符
- 7.4 長度
- 7.5 遍歷
- 7.6 運行時錯誤
- 7.7 find函數
- 7.8 自定義find函數
- 7.9 循環和計數
- 7.10 遞增和遞減操作符
- 7.11 字符串拼接
- 7.12 apstring的可變性
- 7.13 apstrings的可比較性
- 7.14 字符分類
- 7.15 其他apstring函數
- 7.16 術語
- 第8章 結構體
- 8.1 復合值
- 8.2 Point對象
- 8.3 訪問實例變量
- 8.4 操作結構體
- 8.5 將結構體作為參數
- 8.6 值傳遞
- 8.7 引用傳遞
- 8.8 矩形
- 8.9 返回結構體類型
- 8.10 將其他類型按引用傳遞
- 8.11 獲取用戶輸入
- 8.12 術語
- 第9章 更多結構體
- 9.1 Time
- 9.2 printTime
- 9.3 對象函數
- 9.4 純函數
- 9.5 const參數
- 9.6 修改器
- 9.7 填寫函數
- 9.8 哪個最好
- 9.9 增量式開發VS規劃
- 9.10 普遍化
- 9.11 算法
- 9.12 術語
- 第10章 vector
- 10.1 訪問元素
- 10.2 復制vector
- 10.3 for循環
- 10.4 vector的長度
- 10.5 隨機數
- 10.6 統計
- 10.7 隨機數的vector
- 10.8 計數
- 10.9 檢查其他值
- 10.10 直方圖
- 10.11 單次遍歷的解決方案
- 10.12 隨機種子
- 10.13 術語
- 第11章 成員函數
- 11.1 對象和方法
- 11.2 print
- 11.3 隱式變量訪問
- 11.4 另一個例子
- 11.5 第三個例子
- 11.6 更復雜的例子
- 11.7 結構體
- 11.8 初始化還是構造
- 11.9 最后一個例子
- 11.10 頭文件
- 11.11 術語
- 第12章 包含對象的vector
- 12.1 復合形式
- 12.2 Card對象
- 12.3 printCard函數
- 12.4 equals函數
- 12.5 isGreater函數
- 12.6 包含Card對象的vector
- 12.7 printDeck函數
- 12.8 搜索
- 12.9 二分查找
- 12.10 vector和子 vector
- 12.11 術語
- 第13章 向量對象
- 13.1 枚舉類型
- 13.2 switch語句
- 13.3 Deck
- 13.4 另一個構造函數
- 13.5 Deck成員函數
- 13.6 洗牌
- 13.7 排序
- 13.8 subdeck
- 13.9 洗牌和處理
- 13.10 合并排序
- 13.11 術語
- 第14章 類和不變式
- 14.1 私有數據和私有類
- 14.2 什么是類
- 14.3 復數
- 14.4 訪問器函數
- 14.5 輸出
- 14.6 支持復數運算的函數
- 14.7 支持復數運算的其他函數
- 14.8 不變式
- 14.9 先驗條件
- 14.10 私有函數
- 14.11 術語
- 第15章 文件輸入/輸出和apmatrix
- 15.1 流
- 15.2 文件輸入
- 15.3 文件輸出
- 15.4 輸入解析
- 15.5 數字解析
- 15.6 Set數據結構
- 15.7 apmatrix
- 15.8 距離矩陣
- 15.9 合適的距離矩陣
- 15.10 術語
- 附錄A AP類的快速參考
- 版權聲明
- 版權