[TOC]
# 一切都是地址
我們知道,數據是保存在內存中的,對于計算機硬件來說,必須知道它的地址才能使用。變量名、函數名等僅僅是地址的一種助記符,目的是在編程時更加方便地使用數據,當源文件被編譯成可執行文件后,這些標識符都不存在了,它們被替換成了數據的地址。
假設變量 a、b、c 的地址分別為 `0X1000`、`0X1004`、`0X1008`,加法運算的機器指令為 1010,賦值運算的機器指令為 1110,那么在C語言中實現加法運算的代碼為:
~~~
c = a + b;
~~~
生成可執行文件后的機器碼為:
~~~
1010 ?0X1000 ?0X1004 ?//將兩個數據相加的值保存在一個臨時區域
1110 ?0X1008 ?//將臨時區域中的數據復制到地址為0X1008的內存中
~~~
**編譯器和鏈接器的一項重要任務就是將助記符替換成地址。**
# 匯編語言的誕生
任何程序的執行,最終都要依靠計算機硬件來完成。現代計算機硬件都是大規模集成電路,它只認識高低兩個電平(電壓),高電平一般為 5V,用`1`表示,低電平一般為 0V,用`0`表示。也就是說,在計算機底層,沒有文字、數字、圖像、視頻等豐富多彩的可視化元素,只有 0 和 1 兩個二進制數字,這就是機器語言。
計算機剛剛誕生的時候沒有編程語言,人們直接使用機器語言(二進制)編程。現在假設有一種跳轉指令,它的二進制形式為 0001,如果需要執行地址為 1010 的代碼,那么可以這樣寫:
~~~
0001 ?1010
~~~
> 所謂跳轉,就是在執行當前代碼塊時轉而執行其他的代碼塊。從本質上講,C語言中的函數就是一個代碼塊,當發生函數調用時,就會執行其他的代碼塊,這個過程就是通過跳轉指令來完成的。
那么現在問題來了,程序并不是一寫好就永遠不變化的,它可能會經常被修改。比如我們在地址 1010 之前插入了其他指令,那么原來的代碼就得往后移動,上面的跳轉指令的跳轉地址也得相應地調整。
在這個過程中,程序員需要人工重新計算每個子程序或者跳轉的目標地址,這種重新計算各個目標地址的過程叫做重定位(Relocation)。每次程序修改時,這些位置都要重新計算,十分繁瑣又耗時,并且很容易出錯。
如果程序包含了多個源文件,就很可能會有跨文件的跳轉,這種人工重定位的方式在程序擁有多個模塊時會導致更加嚴重的問題。
沒辦法,這種黑暗的程序員生活是沒辦法容忍的,于是先驅們發明了匯編語言(Assembly),這相比機器語言來說是個很大的進步。
匯編語言使用接近人類的各種符號和標記來幫助記憶,比如用`jmp`表示跳轉指令,用`func`表示一個子程序(C語言中的函數就是一個子程序)的起始地址,這種符號的方法使得人們從具體的機器指令和二進制地址中解放出來。
將上面的機器指令使用匯編代碼來書寫:
~~~
jmp func
~~~
這樣,不管在 func 之前增加或者減少了多少條指令導致 func 的地址發生了變化,匯編器在每次匯編程序的時候會重新計算 func 這個符號的地址,然后把所有使用到 func 的地方修正為新的地址,整個過程不需要人工參與。對于一個有成千上百個類似的符號的程序,人們終于擺脫了這種低級的繁瑣的計算地址的工作,用一句政治口號來說就是“極大地解放了生產力”。
符號(Symbol)這個概念隨著匯編語言的普及被廣泛接受,它用來表示一個地址,這個地址可能是一段子程序(后來發展為函數)的起始地址,也可以是一個變量的地址。
# C語言的誕生
匯編語言的主要作用是為機器指令提供了助記符,大部分匯編代碼和機器指令是一一對應的,這在匯編被發明的初期確實令程序員非常欣喜。
后來隨著軟件規模的日漸龐大,代碼量開始瘋長,匯編語言的缺點逐漸暴露出來。匯編雖然提供了多種符號,但它依然非常接近計算機硬件,程序員要考慮很多細節問題和邊界問題,并且不利于模塊化開發,所以后來人們發明了C語言。
C語言是比匯編更加高級的編程語言,極大地提高了開發效率,以加法為例,C語言只需要一條語句,匯編卻需要四五條。
# 模塊化開發
現代軟件的規模往往都很大,動輒數百萬行代碼,程序員需要把它們分散到成百上千個模塊中。這些模塊之間相互依賴又相互獨立,原則上每個模塊都可以單獨開發、編譯、測試,改變一個模塊中的代碼不需要編譯整個程序。
> 在C語言中,一個模塊可以認為是一個源文件(.c 文件)。
在程序被分隔成多個模塊后,需要解決的一個重要問題是如何將這些模塊組合成一個單一的可執行程序。在C語言中,模塊之間的依賴關系主要有兩種:一種是模塊間的函數調用,另外一種是模塊間的變量訪問。
函數調用需要知道函數的首地址,變量訪問需要知道變量的地址,所以這兩種方式可以歸結為一種,那就是模塊間的符號引用。
模塊間依靠符號來“通信”類似于拼圖版,定義符號的模塊多出一個區域,引用符號的模塊剛好少了那一塊區域,兩者剛好完美組合。如下圖所示:

這種通過符號將多個模塊拼接為一個獨立的程序的過程就叫做鏈接(Linking)
- c語言
- 基礎知識
- 變量和常量
- 宏定義和預處理
- 隨機數
- register變量
- errno全局變量
- 靜態變量
- 類型
- 數組
- 類型轉換
- vs中c4996錯誤
- 數據類型和長度
- 二進制數,八進制數和十六進制數
- 位域
- typedef定義類型
- 函數和編譯
- 函數調用慣例
- 函數進棧和出棧
- 函數
- 編譯
- sizeof
- main函數接收參數
- 宏函數
- 目標文件和可執行文件有什么
- 強符號和弱符號
- 什么是鏈接
- 符號
- 強引用和弱引用
- 字符串處理函數
- sscanf
- 查找子字符串
- 字符串指針
- qt
- MFC
- 指針
- 簡介
- 指針詳解
- 案例
- 指針數組
- 偏移量
- 間接賦值
- 易錯點
- 二級指針
- 結構體指針
- 字節對齊
- 函數指針
- 指針例子
- main接收用戶輸入
- 內存布局
- 內存分區
- 空間開辟和釋放
- 堆空間操作字符串
- 內存處理函數
- 內存分頁
- 內存模型
- 棧
- 棧溢出攻擊
- 內存泄露
- 大小端存儲法
- 寄存器
- 結構體
- 共用體
- 枚舉
- 文件操作
- 文件到底是什么
- 文件打開和關閉
- 文件的順序讀寫
- 文件的隨機讀寫
- 文件復制
- FILE和緩沖區
- 文件大小
- 插入,刪除,更改文件內容
- typeid
- 內部鏈接和外部鏈接
- 動態庫
- 調試器
- 調試的概念
- vs調試
- 多文件編程
- extern關鍵字
- 頭文件規范
- 標準庫以及標準頭文件
- 頭文件只包含一次
- static
- 多線程
- 簡介
- 創建線程threads.h
- 創建線程pthread
- gdb
- 簡介
- mac使用gdb
- setjump和longjump
- 零拷貝
- gc
- 調試器原理
- c++
- c++簡介
- c++對c的擴展
- ::作用域運算符
- 名字控制
- cpp對c的增強
- const
- 變量定義數組
- 盡量以const替換#define
- 引用
- 內聯函數
- 函數默認參數
- 函數占位參數
- 函數重載
- extern "C"
- 類和對象
- 類封裝
- 構造和析構
- 深淺拷貝
- explicit關鍵字
- 動態對象創建
- 靜態成員
- 對象模型
- this
- 友元
- 單例
- 繼承
- 多態
- 運算符重載
- 賦值重載
- 指針運算符(*,->)重載
- 前置和后置++
- 左移<<運算符重載
- 函數調用符重載
- 總結
- bool重載
- 模板
- 簡介
- 普通函數和模板函數調用
- 模板的局限性
- 類模板
- 復數的模板類
- 類模板作為參數
- 類模板繼承
- 類模板類內和類外實現
- 類模板和友元函數
- 類模板實現數組
- 類型轉換
- 異常
- 異常基本語法
- 異常的接口聲明
- 異常的棧解旋
- 異常的多態
- 標準異常庫
- 自定義異常
- io
- 流的概念和類庫結構
- 標準io流
- 標準輸入流
- 標準輸出流
- 文件讀寫
- STL
- 簡介
- string容器
- vector容器
- deque容器
- stack容器
- queue容器
- list容器
- set/multiset容器
- map/multimap容器
- pair對組
- 深淺拷貝問題
- 使用時機
- 常用算法
- 函數對象
- 謂詞
- 內建函數對象
- 函數對象適配器
- 空間適配器
- 常用遍歷算法
- 查找算法
- 排序算法
- 拷貝和替換算法
- 算術生成算法
- 集合算法
- gcc
- GDB
- makefile
- visualstudio
- VisualAssistX
- 各種插件
- utf8編碼
- 制作安裝項目
- 編譯模式
- 內存對齊
- 快捷鍵
- 自動補全
- 查看c++類內存布局
- FFmpeg
- ffmpeg架構
- 命令的基本格式
- 分解與復用
- 處理原始數據
- 錄屏和音
- 濾鏡
- 水印
- 音視頻的拼接與裁剪
- 視頻圖片轉換
- 直播
- ffplay
- 常見問題
- 多媒體文件處理
- ffmpeg代碼結構
- 日志系統
- 處理流數據
- linux
- 系統調用
- 常用IO函數
- 文件操作函數
- 文件描述符復制
- 目錄相關操作
- 時間相關函數
- 進程
- valgrind
- 進程通信
- 信號
- 信號產生函數
- 信號集
- 信號捕捉
- SIGCHLD信號
- 不可重入函數和可重入函數
- 進程組
- 會話
- 守護進程
- 線程
- 線程屬性
- 互斥鎖
- 讀寫鎖
- 條件變量
- 信號量
- 網絡
- 分層模型
- 協議格式
- TCP協議
- socket
- socket概念
- 網絡字節序
- ip地址轉換函數
- sockaddr數據結構
- 網絡套接字函數
- socket模型創建流程圖
- socket函數
- bind函數
- listen函數
- accept函數
- connect函數
- C/S模型-TCP
- 出錯處理封裝函數
- 多進程并發服務器
- 多線程并發服務器
- 多路I/O復用服務器
- select
- poll
- epoll
- epoll事件
- epoll例子
- epoll反應堆思想
- udp
- socket IPC(本地套接字domain)
- 其他常用函數
- libevent
- libevent簡介