Python -- 文件的讀寫 · cookbook 速查

>[success] # Python -- 文件的讀寫 ~~~ 1.一個運行中的程序會存取放在隨機存取存儲器（RAM）上的數據。RAM 讀取速度快，但價格昂貴，需要持續供電，斷電后保存在上面的數據會自動消失。磁盤速度比 RAM 慢，但容量大、費用低廉并且多次插拔電源線仍可保持數據。因此，計算機系統在數據存儲設計中做出很大的努力來權衡磁盤和 RAM。程序員需要在非易失性介質（例如磁盤）上做持久化存儲和檢索數據。 2.因此整個讀寫操作相當于是在ram 執行的，使用的是ram內存條中的內存，通俗的說是在一個文件名下的字節流，把數據從一個文件讀入內存，然后從內存寫入文件。 ~~~ >[danger] ##### 常見的讀寫模式 ~~~ 1.了解讀寫的文件分兩種，一種是普通文本文件，一種是二進制文件(圖片，音樂等)，因此在python中，也分這兩種模式，t（或者省略）代表文本類型； b 代表二進制文件。 2. 只讀(r, rb) 3. 只寫(w, wb) 4. 追加(a, ab) 5. r+讀寫 6. w+寫讀 7. a+寫讀(追加寫讀) ~~~ >[danger] ##### 使用open -- 進行讀寫操作 ~~~ 1.open(filename,mode,encoding)中常用的三個參數 ,第一個filename是文件名稱，mode使用的讀寫模式，encoding 進行編碼解碼 2.在操作文件讀寫后需要關閉句柄，也就是close 操作 ~~~ >[danger] ##### read -- (r,rb) 只讀模式 ~~~ 1.r是rt 模式的縮寫，是讀取文本類的，rb是讀取二進制類的例如圖片 2.使用 read() 函數一次讀入文件的所有內容。但在讀入文件時要格外注意， 1GB 的文件會用到相同大小的內存。因此會有更好的優化方案見案例 3.rb讀取出來的數據是bytes類型, 在rb模式下. 不能選擇encoding字符集. 4.read(n) 讀取n個字符. 需要注意的是. 如果再次讀取. 那么會在當前位置繼續去讀?而不是從頭讀, 如果使?用的是rb模式. 則讀取出來的是n個字節 ~~~ * 案例普通的讀寫案例 ~~~ f = open('../file/test', 'r', encoding='utf-8') s = f.read() #read 是當前對象的一個方法，讀出這個對象內的內容 print(s) ~~~ * 優化讀多少拿多少 ~~~ f = open('../file/test', 'r', encoding='utf-8') content = '' # 記錄所有內容 chunk = 50 # 一次讀取多少個字符 while True: s = f.read(chunk) if not s: break content += s print(content) ~~~ >[danger] ##### write -- (w, wb) 寫模式存在則刪除 ~~~ 1.寫的時候注意. 如果沒有?文件. 則會創建?文件, 如果?文件存在. 則將原件中原來的內容刪除, 再寫入新內容 2.在寫的時候注意兩個好習慣一個是刷新，一個是關閉 f.flush() /f.close() 3.這是只寫模式，不能進行讀的操作 ~~~ * 寫入案例 -- write篇章 ~~~ content = '寫入的新的內容' f = open('../file/test', 'w', encoding='utf-8') f.write(content) f.flush() f.close() ~~~ * 寫入案例 -- 萬能print ~~~ # print 因為自帶換行符，因此在使用的時候要考慮去掉默認的換行符 content = '寫入的新的內容' f = open('../file/test', 'w', encoding='utf-8') print(content, file=f, sep='', end='') f.close() ~~~ * 優化寫多少存多少 ~~~ content = '寫入的新的內容' offset = 0 chunk = 2 # 一次寫入多少 f = open('../file/test', 'w', encoding='utf-8') while len(content) > offset: f.write(content[offset:offset+chunk]) offset += chunk f.close() ~~~ * 二進制寫入 wb模式下. 可以不指定打開?文件的編碼. 但是在寫?文件的時候必須將字符串串轉化成utf-8的 bytes數據 ~~~ f = open("?小娃娃", mode="wb") f.write("?金金?毛獅王".encode("utf-8")) f.flush() f.close() ~~~ >[danger] ##### 追加(a, ab) -- 在末尾追加 ~~~ 1.在追加模式下. 我們寫入的內容會追加在?文件的結尾，必須文件存在 ~~~ * 案例 ~~~ f = open('../file/test', 'a', encoding='utf-8') f.write("追加內容") f.flush() f.close() ~~~ >[danger] ##### r+ /r+b -- 讀寫模式 ~~~ 1.對于讀寫模式. 必須是先讀. 因為默認光標是在開頭的. 準備讀取的. 當讀完了之后再進?行行寫入. 使?頻率最?高的模式就是r+ 2..在沒有任何操作之前進行寫. 在開頭寫 3. 如果讀取了一些內容. 再寫, 寫入的是最后，也就是說read(1)執行了雖然是讀一個字符，但追加的內容也會在整個文章最后 ~~~ * 必須是先讀取. 然后再寫入 ~~~ f = open("?小娃娃", mode="r+", encoding="utf-8") content = f.read() f.write("麻花藤的最愛") print(content) f.flush() f.close() ~~~ * 如果先寫后讀就會出現，追加的內容在，開頭而不是在結尾，錯誤示范如下： ~~~ f = open("?小娃娃", mode="r+", encoding="utf-8") f.write("哈哈") content = f.read() print(content) f.flush() f.close() 結果: 將開頭的內容改寫成了了"哈哈", 然后讀取的內容是后?面的內容. ~~~ >[danger] ##### readline() / readlines() -- 以行為單位讀 ~~~ 1.readline() 和 .readlines() 之間的差異是后者一次讀取整個文件 2.readline() 每次只讀取一行，通常比 .readlines() 慢得多。僅當沒有足夠內存可以一次讀取整個文件時，才應該使用 .readline()。 ~~~ * 案例 -- 直接常用寫法 ~~~ f = open("吃的", mode="r", encoding="utf-8") for line in f: # 每次讀取一行. 賦值給前面的line變量 print(line) f.close() ~~~ * 性能讀法 ~~~ poem = '' fin = open('relativity', 'rt' ) while True: line = fin.readline() if not line: break poem += line fin.close() ~~~ >[danger] ##### w+/w+b -- 寫讀 ~~~ 1. 先將所有的內容清空. 然后寫入. 最后讀取. 但是讀取的內容是空的, 不常? 2. 一開始讀取不到數據. 然后寫的時候再將原來的內容清空，不常用 ~~~ * 案例 ~~~ f = open("?小娃娃", mode="w+", encoding="utf-8") f.write("哈哈") content = f.read() print(content) f.flush() f.close() ~~~ >[danger] ##### 追加讀(a+) ~~~ 1.啥用沒有，a+模式下, 不論先讀還是后讀. 都是讀取不到數據的. ~~~ ~~~ f = open('../file/test', 'a+', encoding='utf-8') f.write("追加內容") s = f.read() print(s) ~~~ >[danger] ##### seek(n) -- 光標移動 ~~~ 1. seek(n) 光標移動到n位置, 注意, 移動的單位是byte. 所以如果是UTF-8的中?文部分要是3的倍數. 三個字節構成一個字符 2. 移動到開頭: seek(0)，移動到結尾: seek(0,2) seek的第?二個參數表 ?示的是從哪個位置進?行行偏移, 默認是0, 表 ?示開頭, 1表?示當前位置, 2表?示結尾 ~~~ * 案例 ~~~ f = open("?小娃娃", mode="r+", encoding="utf-8") f.seek(0) # 光標移動到開頭 content = f.read() # 讀取內容, 此時光標移動到結尾 print(content) f.seek(0) # 再次將光標移動到開頭 f.seek(0, 2) # 將光標移動到結尾 content2 = f.read() # 讀取內容. 什什么都沒有 print(content2) f.seek(0) # 移動到開頭 f.write("張國榮") # 寫?入信息. 此時光標在9 中?文3 * 3個 = 9 f.flush() f.close() ~~~ >[danger] ##### 使用with自動關閉文件 ~~~ 1.如果你忘記關閉已經打開的一個文件，在該文件對象不再被引用之后 Python 會關掉此文件。這也就意味著在一個函數中打開文件，沒有及時關閉它，但是在函數結束時會被關掉。然而你可能會在一直運行中的函數或者程序的主要部分打開一個文件，應該強制剩下的所有寫操作完成后再關閉文件。 Python 的上下文管理器（context manager）會清理一些資源，例如打開的文件。它的形式為 with expression as variable： with open('relativity', 'wt') as fout: ... fout.write(poem) ... 完成上下文管理器的代碼后，文件會被自動關閉。 ~~~ >[danger] ##### 修改文件內容 * 先讀在寫寫的文件，刪除讀的，重命名寫的 ~~~ import os with open("吃的", mode="r", encoding="utf-8") as f1, \ open("吃的_副本", mode="w", encoding="utf-8") as f2: for line in f1: s = line.replace("菜", "肉") f2.write(s) os.remove("吃的") #　刪除文件 os.rename("吃的_副本", "吃的") # 重命名文件 ~~~ >[danger] ##### 整合模式 ~~~ 1.使用with 2.使用for 循環 ~~~