## SHA
所有用來表示項目歷史信息的文件,是通過一個40個字符的(40-digit)“對象名”來索引的,對象名看起來像這樣:
~~~
6ff87c4664981e4397625791c8ea3bbb5f2279a3
~~~
你會在Git里到處看到這種“40個字符”字符串。每一個“對象名”都是對“對象”內容做SHA1哈希計算得來的,(SHA1是一種密碼學的哈希算法)。這樣就意味著兩個不同內容的對象不可能有相同的“對象名”。
這樣做會有幾個好處:
* Git只要比較對象名,就可以很快的判斷兩個對象是否相同。
* 因為在每個倉庫(repository)的“對象名”的計算方法都完全一樣,如果同樣的內容存在兩個不同的倉庫中,就會存在相同的“對象名”下。
* Git還可以通過檢查對象內容的SHA1的哈希值和“對象名”是否相同,來判斷對象內容是否正確。
## 對象
每個對象(object) 包括三個部分:**類型**,**大小**和**內容**。大小就是指內容的大小,內容取決于對象的類型,有四種類型的對象:"blob"、"tree"、 "commit" 和"tag"。
* **“blob”**用來存儲文件數據,通常是一個文件。
* **“tree”**有點像一個目錄,它管理一些**“tree”**或是?**“blob”**(就像文件和子目錄)
* 一個**“commit”**只指向一個"tree",它用來標記項目某一個特定時間點的狀態。它包括一些關于時間點的元數據,如時間戳、最近一次提交的作者、指向上次提交(commits)的指針等等。
* 一個**“tag”**是來標記某一個提交(commit) 的方法。
幾乎所有的Git功能都是使用這四個簡單的對象類型來完成的。它就像是在你本機的文件系統之上構建一個小的文件系統。
## 與SVN的區別
Git與你熟悉的大部分版本控制系統的差別是很大的。也許你熟悉Subversion、CVS、Perforce、Mercurial 等等,他們使用?_“增量文件系統”_?(Delta Storage systems), 就是說它們存儲每次提交(commit)之間的差異。Git正好與之相反,它會把你的每次提交的文件的全部內容(snapshot)都會記錄下來。這會是在使用Git時的一個很重要的理念。
## Blob對象
一個blob通常用來存儲文件的內容.

你可以使用[git show](http://www.kernel.org/pub/software/scm/git/docs/git-show.html)命令來查看一個blob對象里的內容。假設我們現在有一個Blob對象的SHA1哈希值,我們可以通過下面的的命令來查看內容:
~~~
$ git show 6ff87c4664
Note that the only valid version of the GPL as far as this project
is concerned is _this_ particular version of the license (ie v2, not
v2.2 or v3.x or whatever), unless explicitly otherwise stated.
...
~~~
一個"blob對象"就是一塊二進制數據,它沒有指向任何東西或有任何其它屬性,甚至連文件名都沒有.
因為blob對象內容全部都是數據,如兩個文件在一個目錄樹(或是一個版本倉庫)中有同樣的數據內容,那么它們將會共享同一個blob對象。Blob對象和其所對應的文件所在路徑、文件名是否改被更改都完全沒有關系。
## Tree 對象
一個tree對象有一串(bunch)指向blob對象或是其它tree對象的指針,它一般用來表示內容之間的目錄層次關系。

[git show](http://www.kernel.org/pub/software/scm/git/docs/git-show.html)命令還可以用來查看tree對象,但是[git ls-tree](http://www.kernel.org/pub/software/scm/git/docs/git-ls-tree.html)能讓你看到更多的細節。如果我們有一個tree對象的SHA1哈希值,我們可以像下面一樣來查看它:
~~~
$ git ls-tree fb3a8bdd0ce
100644 blob 63c918c667fa005ff12ad89437f2fdc80926e21c .gitignore
100644 blob 5529b198e8d14decbe4ad99db3f7fb632de0439d .mailmap
100644 blob 6ff87c4664981e4397625791c8ea3bbb5f2279a3 COPYING
040000 tree 2fb783e477100ce076f6bf57e4a6f026013dc745 Documentation
100755 blob 3c0032cec592a765692234f1cba47dfdcc3a9200 GIT-VERSION-GEN
100644 blob 289b046a443c0647624607d471289b2c7dcd470b INSTALL
100644 blob 4eb463797adc693dc168b926b6932ff53f17d0b1 Makefile
100644 blob 548142c327a6790ff8821d67c2ee1eff7a656b52 README
...
~~~
就如同你所見,一個tree對象包括一串(list)條目,每一個條目包括:mode、對象類型、SHA1值 和名字(這串條目是按名字排序的)。它用來表示一個目錄樹的內容。
一個tree對象可以指向(reference): 一個包含文件內容的blob對象, 也可以是其它包含某個子目錄內容的其它tree對象. Tree對象、blob對象和其它所有的對象一樣,都用其內容的SHA1哈希值來命名的;只有當兩個tree對象的內容完全相同(包括其所指向所有子對象)時,它的名字才會一樣,反之亦然。這樣就能讓Git僅僅通過比較兩個相關的tree對象的名字是否相同,來快速的判斷其內容是否不同。
> (注意:在submodules里,trees對象也可以指向commits對象. 請參見?**Submodules**?章節)
> 注意:所有的文件的mode位都是644 或 755,這意味著Git只關心文件的可執行位.
## Commit對象
"commit對象"指向一個"tree對象", 并且帶有相關的描述信息.

你可以用 --pretty=raw 參數來配合?[git show](http://www.kernel.org/pub/software/scm/git/docs/git-show.html)?或?[git log](http://www.kernel.org/pub/software/scm/git/docs/git-log.html)?去查看某個提交(commit):
~~~
$ git show -s --pretty=raw 2be7fcb476
commit 2be7fcb4764f2dbcee52635b91fedb1b3dcf7ab4
tree fb3a8bdd0ceddd019615af4d57a53f43d8cee2bf
parent 257a84d9d02e90447b149af58b271c19405edb6a
author Dave Watson <dwatson@mimvista.com> 1187576872 -0400
committer Junio C Hamano <gitster@pobox.com> 1187591163 -0700
Fix misspelling of 'suppress' in docs
Signed-off-by: Junio C Hamano <gitster@pobox.com>
~~~
你可以看到, 一個提交(commit)由以下的部分組成:
* 一個?**tree** 對象: tree對象的SHA1簽名, 代表著目錄在某一時間點的內容.
* **父對象**?(parent(s)): 提交(commit)的SHA1簽名代表著當前提交前一步的項目歷史. 上面的那個例子就只有一個父對象; 合并的提交(merge commits)可能會有不只一個父對象. 如果一個提交沒有父對象, 那么我們就叫它“根提交"(root commit), 它就代表著項目最初的一個版本(revision). 每個項目必須有至少有一個“根提交"(root commit). 一個項目可能有多個"根提交“,雖然這并不常見(這不是好的作法).
* **作者**?: 做了此次修改的人的名字, 還有修改日期.
* **提交者**(committer): 實際創建提交(commit)的人的名字, 同時也帶有提交日期. TA可能會和作者不是同一個人; 例如作者寫一個補丁(patch)并把它用郵件發給提交者, 由他來創建提交(commit).
-**注釋**?用來描述此次提交.
> 注意: 一個提交(commit)本身并沒有包括任何信息來說明其做了哪些修改; 所有的修改(changes)都是通過與父提交(parents)的內容比較而得出的. 值得一提的是, 盡管git可以檢測到文件內容不變而路徑改變的情況, 但是它不會去顯式(explicitly)的記錄文件的更名操作. (你可以看一下?[git diff](http://www.kernel.org/pub/software/scm/git/docs/git-diff.html)?的 -M 參數的用法)
一般用?[git commit](http://www.kernel.org/pub/software/scm/git/docs/git-commit.html)?來創建一個提交(commit), 這個提交(commit)的父對象一般是當前分支(current HEAD), 同時把存儲在當前索引(index)的內容全部提交.
## 對象模型
現在我們已經了解了3種主要對象類型(blob, tree 和 commit), 好現在就讓我們大概了解一下它們怎么組合到一起的.
如果我們一個小項目, 有如下的目錄結構:
~~~
$>tree
.
|-- README
`-- lib
|-- inc
| `-- tricks.rb
`-- mylib.rb
2 directories, 3 files
~~~
如果我們把它提交(commit)到一個Git倉庫中, 在Git中它們也許看起來就如下圖:

你可以看到: 每個目錄都創建了?**tree對象**?(包括根目錄), 每個文件都創建了一個對應的?**blob對象**?. 最后有一個?**commit對象**?來指向根tree對象(root of trees), 這樣我們就可以追蹤項目每一項提交內容.
## 標簽對象

一個標簽對象包括一個對象名(譯者注:就是SHA1簽名), 對象類型, 標簽名, 標簽創建人的名字("tagger"), 還有一條可能包含有簽名(signature)的消息. 你可以用?[git cat-file](http://www.kernel.org/pub/software/scm/git/docs/git-cat-file.html)?命令來查看這些信息:
~~~
$ git cat-file tag v1.5.0
object 437b1b20df4b356c9342dac8d38849f24ef44f27
type commit
tag v1.5.0
tagger Junio C Hamano <junkio@cox.net> 1171411200 +0000
GIT 1.5.0
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
iD8DBQBF0lGqwMbZpPMRm5oRAuRiAJ9ohBLd7s2kqjkKlq1qqC57SbnmzQCdG4ui
nLE/L9aUXdWeTFPron96DLA=
=2E+0
-----END PGP SIGNATURE-----
~~~
點擊?[git tag](http://www.kernel.org/pub/software/scm/git/docs/git-tag.html), 可以了解如何創建和驗證標簽對象. (注意:?[git tag](http://www.kernel.org/pub/software/scm/git/docs/git-tag.html)?同樣也可以用來創建 "輕量級的標簽"(lightweight tags), 但它們并不是標簽對象, 而只一些以 "refs/tags/" 開頭的引用罷了)。
- 1. 介紹
- 歡迎使用Git
- GIT對象模型
- Git目錄 與 工作目錄
- Git索引
- 2. 第一步
- 安裝Git
- 安裝與初始化
- 3. 基本用法
- 獲得一個Git倉庫
- 正常的工作流程
- 分支與合并@基礎
- 查看歷史 -Git日志
- 比較提交 - Git Diff
- 分布式的工作流程
- Git標簽
- 4. 中級技能
- 忽略某些文件
- rebase
- 交互式rebase
- 交互式添加
- 儲藏
- Git樹名
- 追蹤分支
- 使用Git Grep進行搜索
- Git的撤消操作 - 重置, 簽出 和 撤消
- 維護Git
- 建立一個公共倉庫
- 建立一個私有倉庫
- 5. 高級技能
- 創建新的空分支
- 修改你的歷史
- 高級分支與合并
- 查找問題的利器 - Git Bisect
- 查找問題的利器 - Git Blame
- Git和Email
- 定制Git
- Git Hooks
- 找回丟失的對象
- 子模塊
- 6. Git生態體系
- Git 與之 Windows
- 使用Git進行系統部署
- 與 Subversion 集成
- 從其他代碼管理工具遷移到Git
- 圖形化的Git
- Git倉庫托管
- Git的其它用法
- Git的腳本支持
- Git 與編輯器
- 7. 原理解析
- Git是如何存儲對象的
- 查看Git對象
- Git引用
- Git索引
- 打包文件
- 更底層的Git
- 傳輸協議
- 術語表