## 8.1 壓縮文件的用途與技術
你是否有過文件文件太大,導致無法以正常的 email 方式發送出去 (很多 email 都有容量大約 25MB 每封信的限制啊!)? 又或者學校、廠商要求使用 CD 或 DVD 來傳遞歸檔用的數據,但是你的單一文件卻都比這些傳統的一次性儲存媒體還要大!那怎么分成多片來燒錄呢? 還有,你是否有過要備份某些重要數據,偏偏這些數據量太大了,耗掉了你很多的磁盤空間呢? 這個時候,那個好用的“文件壓縮”技術可就派的上用場了!
因為這些比較大型的文件通過所謂的文件壓縮技術之后,可以將他的磁盤使用量降低,可以達到減低文件大小的效果。此外,有的壓縮程序還可以進行容量限制, 使一個大型文件可以分區成為數個小型文件,以方便軟盤片攜帶呢!
那么什么是“文件壓縮”呢?我們來稍微談一談他的原理好了。目前我們使用的計算機系統中都是使用所謂的 Bytes 單位來計量的!不過,事實上,計算機最小的計量單位應該是 bits 才對啊。此外,我們也知道 1 Byte = 8 bits 。但是如果今天我們只是記憶一個數字,亦即是 1 這個數字呢?他會如何記錄?假設一個 Byte 可以看成下面的模樣:
> □□□□□□□□

**Tips** 由于 1 Byte = 8 bits ,所以每個 Byte 當中會有 8 個空格,而每個空格可以是 0, 1 ,這里僅是做為一個約略的介紹, 更多的詳細數據請參考[第零章的計算機概論](../Text/index.html)吧!
由于我們記錄數字是 1 ,考慮計算機所謂的二進制喔,如此一來, 1 會在最右邊占據 1 個 bit ,而其他的 7 個 bits 將會自動的被填上 0 啰!你看看,其實在這樣的例子中,那 7 個 bits 應該是“空的”才對!不過,為了要滿足目前我們的操作系統數據的存取,所以就會將該數據轉為 Byte 的型態來記錄了!而一些聰明的計算機工程師就利用一些復雜的計算方式, 將這些沒有使用到的空間“丟”出來,以讓文件占用的空間變小!這就是壓縮的技術啦!
另外一種壓縮技術也很有趣,他是將重復的數據進行統計記錄的。舉例來說,如果你的數據為“111....”共有100個1時, 那么壓縮技術會記錄為“100個1”而不是真的有100個1的位存在!這樣也能夠精簡文件記錄的容量呢! 非常有趣吧!
簡單的說,你可以將他想成,其實文件里面有相當多的“空間”存在,并不是完全填滿的, 而“壓縮”的技術就是將這些“空間”填滿,以讓整個文件占用的容量下降! 不過,這些“壓縮過的文件”并無法直接被我們的操作系統所使用的,因此, 若要使用這些被壓縮過的文件數據,則必須將他“還原”回來未壓縮前的模樣, 那就是所謂的“解壓縮”啰!而至于壓縮后與壓縮的文件所占用的磁盤空間大小, 就可以被稱為是“壓縮比”啰!更多的技術文件或許你可以參考一下:
* [RFC 1952 文件:http://www.ietf.org/rfc/rfc1952.txt](http://www.ietf.org/rfc/rfc1952.txt)
* 鳥哥站上的備份:[http://linux.vbird.org/linux_basic/0240tarcompress/0240tarcompress_gzip.php](http://linux.vbird.org/linux_basic/0240tarcompress//0240tarcompress_gzip.php)
這個“壓縮”與“解壓縮”的動作有什么好處呢?最大的好處就是壓縮過的文件大小變小了, 所以你的硬盤容量無形之中就可以容納更多的數據。此外,在一些網絡數據的傳輸中,也會由于數據量的降低, 好讓網絡帶寬可以用來作更多的工作!而不是老是卡在一些大型的文件傳輸上面呢!目前很多的 WWW 網站也是利用文件壓縮的技術來進行數據的傳送,好讓網站帶寬的可利用率上升喔!

**Tips** 上述的WWW網站壓縮技術蠻有趣的!他讓你網站上面“看的到的數據”在經過網絡傳輸時,使用的是“壓縮過的數據”, 等到這些壓縮過的數據到達你的計算機主機時,再進行解壓縮,由于目前的計算機運算速度相當的快速, 因此其實在網頁瀏覽的時候,時間都是花在“數據的傳輸”上面,而不是 CPU 的運算啦!如此一來,由于壓縮過的數據量降低了,自然傳送的速度就會增快不少!
若你是一位軟件工程師,那么相信你也會喜歡將你自己的軟件壓縮之后提供大家下載來使用, 畢竟沒有人喜歡自己的網站天天都是帶寬滿載的吧?舉個例子來說, Linux 3.10.81 (CentOS 7 用的延伸版本) 完整的核心大小約有 570 MB 左右,而由于核心主要多是 ASCII code 的純文本體態文件,這種文件的“多余空間”最多了。而一個提供下載的壓縮過的 3.10.81 核心大約僅有 76MB 左右,差了幾倍呢?你可以自己算一算喔!
- 鳥哥的Linux私房菜:基礎學習篇 第四版
- 目錄及概述
- 第零章、計算機概論
- 0.1 電腦:輔助人腦的好工具
- 0.2 個人電腦架構與相關設備元件
- 0.3 數據表示方式
- 0.4 軟件程序運行
- 0.5 重點回顧
- 0.6 本章習題
- 0.7 參考資料與延伸閱讀
- 第一章、Linux是什么與如何學習
- 1.1 Linux是什么
- 1.2 Torvalds的Linux發展
- 1.3 Linux當前應用的角色
- 1.4 Linux 該如何學習
- 1.5 重點回顧
- 1.6 本章習題
- 1.7 參考資料與延伸閱讀
- 第二章、主機規劃與磁盤分區
- 2.1 Linux與硬件的搭配
- 2.2 磁盤分區
- 2.3 安裝Linux前的規劃
- 2.4 重點回顧
- 2.5 本章習題
- 2.6 參考資料與延伸閱讀
- 第三章、安裝 CentOS7.x
- 3.1 本練習機的規劃--尤其是分區參數
- 3.2 開始安裝CentOS 7
- 3.3 多重開機安裝流程與管理(Option)
- 3.4 重點回顧
- 3.5 本章習題
- 3.6 參考資料與延伸閱讀
- 第四章、首次登陸與線上求助
- 4.1 首次登陸系統
- 4.2 文字模式下指令的下達
- 4.3 Linux系統的線上求助man page與info page
- 4.4 超簡單文書編輯器: nano
- 4.5 正確的關機方法
- 4.6 重點回顧
- 4.7 本章習題
- 4.8 參考資料與延伸閱讀
- 第五章、Linux 的文件權限與目錄配置
- 5.1 使用者與群組
- 5.2 Linux 文件權限概念
- 5.3 Linux目錄配置
- 5.4 重點回顧
- 5.5 本章練習
- 5.6 參考資料與延伸閱讀
- 第六章、Linux 文件與目錄管理
- 6.1 目錄與路徑
- 6.2 文件與目錄管理
- 6.3 文件內容查閱
- 6.4 文件與目錄的默認權限與隱藏權限
- 6.5 指令與文件的搜尋
- 6.6 極重要的復習!權限與指令間的關系
- 6.7 重點回顧
- 6.8 本章習題:
- 6.9 參考資料與延伸閱讀
- 第七章、Linux 磁盤與文件系統管理
- 7.1 認識 Linux 文件系統
- 7.2 文件系統的簡單操作
- 7.3 磁盤的分區、格式化、檢驗與掛載
- 7.4 設置開機掛載
- 7.5 內存交換空間(swap)之創建
- 7.6 文件系統的特殊觀察與操作
- 7.7 重點回顧
- 7.8 本章習題 - 第一題一定要做
- 7.9 參考資料與延伸閱讀
- 第八章、文件與文件系統的壓縮,打包與備份
- 8.1 壓縮文件的用途與技術
- 8.2 Linux 系統常見的壓縮指令
- 8.3 打包指令: tar
- 8.4 XFS 文件系統的備份與還原
- 8.5 光盤寫入工具
- 8.6 其他常見的壓縮與備份工具
- 8.7 重點回顧
- 8.8 本章習題
- 8.9 參考資料與延伸閱讀
- 第九章、vim 程序編輯器
- 9.1 vi 與 vim
- 9.2 vi 的使用
- 9.3 vim 的額外功能
- 9.4 其他 vim 使用注意事項
- 9.5 重點回顧
- 9.6 本章練習
- 9.7 參考資料與延伸閱讀
- 第十章、認識與學習BASH
- 10.1 認識 BASH 這個 Shell
- 10.2 Shell 的變量功能
- 10.3 命令別名與歷史命令
- 10.4 Bash Shell 的操作環境:
- 10.5 數據流重導向
- 10.6 管線命令 (pipe)
- 10.7 重點回顧
- 10.8 本章習題
- 10.9 參考資料與延伸閱讀
- 第十一章、正則表達式與文件格式化處理
- 11.1 開始之前:什么是正則表達式
- 11.2 基礎正則表達式
- 11.3 延伸正則表達式
- 11.4 文件的格式化與相關處理
- 11.5 重點回顧
- 11.6 本章習題
- 11.7 參考資料與延伸閱讀
- 第十二章、學習 Shell Scripts
- 12.1 什么是 Shell scripts
- 12.2 簡單的 shell script 練習
- 12.3 善用判斷式
- 12.4 條件判斷式
- 12.5 循環 (loop)
- 12.6 shell script 的追蹤與 debug
- 12.7 重點回顧
- 12.8 本章習題
- 第十三章、Linux 帳號管理與 ACL 權限設置
- 13.1 Linux 的帳號與群組
- 13.2 帳號管理
- 13.3 主機的細部權限規劃:ACL 的使用
- 13.4 使用者身份切換
- 13.5 使用者的特殊 shell 與 PAM 模塊
- 13.6 Linux 主機上的使用者訊息傳遞
- 13.7 CentOS 7 環境下大量創建帳號的方法
- 13.8 重點回顧
- 13.9 本章習題
- 13.10 參考資料與延伸閱讀
- 第十四章、磁盤配額(Quota)與進階文件系統管理
- 14.1 磁盤配額 (Quota) 的應用與實作
- 14.2 軟件磁盤陣列 (Software RAID)
- 14.3 邏輯卷軸管理員 (Logical Volume Manager)
- 14.4 重點回顧
- 14.5 本章習題
- 14.6 參考資料與延伸閱讀
- 第十五章、例行性工作調度(crontab)
- 15.1 什么是例行性工作調度
- 15.2 僅執行一次的工作調度
- 15.3 循環執行的例行性工作調度
- 15.4 可喚醒停機期間的工作任務
- 15.5 重點回顧
- 15.6 本章習題
- 第十六章、程序管理與 SELinux 初探
- 16.1 什么是程序 (process)
- 16.2 工作管理 (job control)
- 16.3 程序管理
- 16.4 特殊文件與程序
- 16.5 SELinux 初探
- 16.6 重點回顧
- 16.7 本章習題
- 16.8 參考資料與延伸閱讀
- 第十七章、認識系統服務 (daemons)
- 17.1 什么是 daemon 與服務 (service)
- 17.2 通過 systemctl 管理服務
- 17.3 systemctl 針對 service 類型的配置文件
- 17.4 systemctl 針對 timer 的配置文件
- 17.5 CentOS 7.x 默認啟動的服務簡易說明
- 17.6 重點回顧
- 17.7 本章習題
- 17.8 參考資料與延伸閱讀
- 第十八章、認識與分析登錄文件
- 18.1 什么是登錄文件
- 18.2 rsyslog.service :記錄登錄文件的服務
- 18.3 登錄文件的輪替(logrotate)
- 18.4 systemd-journald.service 簡介
- 18.5 分析登錄文件
- 18.6 重點回顧
- 18.7 本章習題
- 18.8 參考資料與延伸閱讀
- 第十九章、開機流程、模塊管理與 Loader
- 19.1 Linux 的開機流程分析
- 19.2 核心與核心模塊
- 19.3 Boot Loader: Grub2
- 19.4 開機過程的問題解決
- 19.5 重點回顧
- 19.6 本章習題
- 19.7 參考資料與延伸閱讀
- 第二十章、基礎系統設置與備份策略
- 20.1 系統基本設置
- 20.2 服務器硬件數據的收集
- 20.3 備份要點
- 20.4 備份的種類、頻率與工具的選擇
- 20.5 鳥哥的備份策略
- 20.6 災難復原的考慮
- 20.7 重點回顧
- 20.8 本章習題
- 20.9 參考資料與延伸閱讀
- 第二十一章、軟件安裝:源代碼與 Tarball
- 20.1 開放源碼的軟件安裝與升級簡介
- 21.2 使用傳統程序語言進行編譯的簡單范例
- 21.3 用 make 進行宏編譯
- 21.4 Tarball 的管理與建議
- 21.5 函數庫管理
- 21.6 檢驗軟件正確性
- 21.7 重點回顧
- 21.8 本章習題
- 21.9 參考資料與延伸閱讀
- 第二十二章、軟件安裝 RPM, SRPM 與 YUM
- 22.1 軟件管理員簡介
- 22.2 RPM 軟件管理程序: rpm
- 22.3 YUM 線上升級機制
- 22.4 SRPM 的使用 : rpmbuild (Optional)
- 22.5 重點回顧
- 22.6 本章習題
- 22.7 參考資料與延伸閱讀
- 第二十三章、X Window 設置介紹
- 23.1 什么是 X Window System
- 23.2 X Server 配置文件解析與設置
- 23.3 顯卡驅動程序安裝范例
- 23.4 重點回顧
- 23.5 本章習題
- 23.6 參考資料與延伸閱讀
- 第二十四章、Linux 核心編譯與管理
- 24.1 編譯前的任務:認識核心與取得核心源代碼
- 24.2 核心編譯的前處理與核心功能選擇
- 24.3 核心的編譯與安裝
- 24.4 額外(單一)核心模塊編譯
- 24.5 以最新核心版本編譯 CentOS 7.x 的核心
- 24.6 重點回顧
- 24.7 本章習題
- 24.8 參考資料與延伸閱讀