Python 全攻略第10節：Chapter 5- I/O in Python 82~87

tzuhuangyen · 2024年11月20日09:41

82.介紹 I/O with file
83. readline, readlines, and close
84. Encoding 亂碼
85. with statement and modes
86. deleting files and folders
87. user input

Python I/O：程式與外部世界的橋樑

什麼是 I/O？

I/O（Input/Output），在這章節我們討論的

輸入（Input）： 將.txt檔案input並讀取/處理資料。
輸出（Output）： 將資料寫入/處理後並輸出.txt

Python 檔案處理方法：

功能	解釋	範例
開啟檔案`open("filename.txt")`	filename 是一個string, 會回傳一個file object
開啟檔案`open("filename.txt", "mode")`	mode常見模式有：`r` 讀取、`w` 覆寫、`a` 追加、`x` 創建新檔案、`b` 二進位模式。	`file = open("filename.txt", "r")`
讀取整個檔案 `.read()`	讀取檔案所有內容，返回為字串string。	`words = file.read()`
讀取指定數量的字元 `.read(n)`	讀取指定字元數量 `n`，返回為字串。	`word = file.read(6)`
讀取單行 `.readline()`	讀取下一行內容，返回為字串。	`first_line = file.readline()`
讀取所有行 `.readlines()`	讀取所有行並返回列表，每行作為列表的一個元素list。佔記憶體	`lines = file.readlines()`
寫入檔案 `file =open('file.txt','w') as file:`	將字串 `str` 寫入檔案（w覆蓋模式）。	`file =open('file.txt','w') as f: f.write("Hello, world!\n")`
寫入檔案 `file =open('file.txt','a') as file:`	使用`'a'` 模式來追加寫入並讀取（同一個檔案）不會覆蓋	`with open('testFile.txt', 'a', encoding='utf-8') as f: f.write("Keep learning !\n")`
寫入檔案 `with open('my_file.txt', 'x') as f:`	‘x’ 模式的主要用途是創建一個新檔案，如果檔案已經存在，就會報錯。因此，它並不能直接用於追加寫入和讀取同一個檔案。	`with open('my_file.txt', 'x') as f: f.write("第一次寫入\n")`
寫入多行 `.writelines(seq)`	將 `seq` 序列中的每個元素作為一行寫入檔案，適用於列表或元組	`lines = ["Line 1\n", "Line 2\n"]` `file.writelines(lines)`
使用 `print()` 寫入 `print(data, file=file)`	使用 `print()` 函數將 `data` 寫入到指定的檔案 `file`。	`data = "Hello, world!"` `print(data, file=file)`
使用 `with` 自動關閉`with open("filename.txt", "mode") as file`	使用 `with` 開啟檔案，程式執行完畢後會自動關閉檔案。	`with open("filename.txt", "w") as file:` `file.write("Hello, world!")`

開啟檔案open() & with open

基本語法

file = open("filename.txt", "mode")
file.close()

filename.txt: 要開啟的檔案名稱相對路徑。
mode: 開啟模式，常見的有：
r: 讀取 (預設)
w: 寫入 (覆寫)
a: 追加 (在檔案末尾追加)
x: 創建新檔案 (如果檔案已存在則報錯)

進階使用與 `with` 一起使用開啟檔案

什麼是 with 陳述式？
with 陳述式是一種上下文管理器，它讓程式碼更簡潔，並且能自動釋放資源。
為什麼要用 with 陳述式？
在處理檔案、資料庫連接等資源時，為了避免忘記關閉檔案導致的資源洩露，使用 with 陳述式能確保資源在使用完畢後被自動正確關閉檔案，即使發生異常。

with 陳述式的語法

with open(expression,"mode") as variable:
    # 在這個區塊中，可以使用 variable 來訪問資源

expression：通常是一個函式呼叫，返回一個上下文管理器物件。

variable：一個變數，用來表示上下文管理器所管理的資源。

with open("my_file.txt", "a" as file:
    file.write("This is a new line.\n")

as file 中的 file 是自定義的
as file 中的 file 並不是 Python 的關鍵字，而是一個變量名稱。
你可以將它換成任何你喜歡的變量名稱

讀取檔案 `"r"`

一次讀取所有內容.read()：

假設我有一份my_file.txt 裡面內容為：

I love python
I love Club

with open("my_file.txt","r") as file:
    words = file.read()
print(words) 

#輸出
I love python
I love Club

讀取指定數量的位元組.read(n)：

with open("my_file.txt","r") as file:
    word = file.read(6)
print(word) 
file.close()
#輸出 I love

單行讀取.readline()

with open("my_file.txt","r") as file:
    first_line = file.readline()
    second_line = file.readline()
print(second_line,first_line,sep='\n') 

#輸出
I love Club
I love python

逐行讀取.readlines()

它會將文件中的每一行讀取為一個元素，並將這些元素存儲在一個列表中。

with open("my_file.txt","r") as file:
    a = file.readlines()
print(a) 

#輸出
['I love python\n', 
'I love Club']

# 遍歷每一行
with open("my_file.txt","r") as file:
    for line in file.readlines():
        print(line)

#輸出
I love python

I love Club

86.Bonus section 編碼 (encoding)

什麼是編碼(encoding)？

想像一下，我們人類用中文、英文、日文等不同的文字來溝通，而電腦只認識 0 和 1。
為了讓電腦能理解我們輸入的文字，就需要一種「翻譯」的方式，
將文字轉換成電腦能識別為一組數字，這個轉換的過程就稱為「編碼」。

簡單來說，編碼就是將人類可讀的文字轉換成電腦可讀的數字序列。
編碼是將文字轉換成電腦可以理解的二進位數字的過程。
不同的編碼方式使用不同的對應關係，例如 ASCII、UTF-8、Big5 等。

為什麼要了解編碼？

在讀取或開啟文件時，python會根據你電腦的os預設encoding來呈現，
但如果跟其他人寫入文件的encoding不同，就有可能會看到亂碼。
所以在處理文字檔案時，必須指定正確的編碼方式，才能正確地讀取和寫入資料。

常見的編碼:

UTF-8: 最常用，一種可變長度的 Unicode 轉碼格式，幾乎可以表示世界上所有的文字。
ASCII: 主要用於顯示現代英文的字元。
cp950: 常用於繁體中文的編碼。

結合範例

with open('my_file.txt', 'r', encoding='utf-8') as f:
    for line in f:
        print(line, end='')

寫入檔案

常見寫入檔案的模式

w: 寫入模式，如果檔案存在則會覆蓋原有檔案內容。如果檔案不存在，則會創建新檔案。
a: 附加模式，用於在檔案末尾追加內容。如果檔案不存在，則會創建新檔案。
x: 排他性創建模式，如果檔案已經存在則會報錯。
b: 二進位模式，用於讀寫二進位資料。
t: 文字模式（預設），用於讀寫文字資料。

使用`'w'` 模式寫入檔案的步驟

先打開檔案寫入，再讀取（分開操作，無法同時寫入和讀取）
原因：在同一個 with 語句中，使用 ‘w’ 模式開啟檔案後，檔案就處於寫入狀態。如果你想在寫入之後立即讀取，需要重新開啟檔案，並使用 ‘r’ 模式。

# 以寫入模式開啟一個名為 testFile.txt 的檔案
with open('testFile.txt', 'w', encoding='utf-8') as file:
    #寫入檔案
    file.write("Hello, world!\n")  # 寫入一行文字
#再讀取
with open('testFile.txt', 'r', encoding='utf-8') as file:
    for line in file:
        print(line, end='')

這段程式碼做了以下事情：

開啟檔案：使用 with open() 開啟名為 my_file.txt 的檔案，以讀取模式開啟，並指定編碼為 UTF-8。

逐行讀取：使用 for 迴圈逐行讀取檔案內容，並將每一行印出。

自動關閉：離開 with 區塊時，檔案會自動關閉。

使用`'a'` 模式來追加寫入並讀取（同一個檔案）

# 追加寫入檔案
with open('my_file.txt', 'a', encoding='utf-8') as f:
    f.write("Hello, world!\n")

# 讀取檔案
with open('my_file.txt', 'r', encoding='utf-8') as f:
    for line in f:
        print(line, end='')

使用`'x'` 模式

‘x’ 模式的主要用途是創建一個新檔案，如果檔案已經存在，就會報錯。因此，它並不能直接用於追加寫入和讀取同一個檔案。

 with open('my_file.txt', 'x') as f:
        f.write("第一次寫入\n")
# 追加寫入        
 with open('my_file.txt', 'a') as f:
    f.write("追加內容\n")       
# 讀取
with open('my_file.txt', 'r') as f:
    for line in f:
        print(line, end='')

其他寫入檔案的方式 .writelines(seq)

在 Python 中，當我們想要一次性將一個序列（例如列表或元組）中的多個字符串寫入到一個檔案中時，，並且在每個字符串的末尾自動添加一個換行符。.writelines(seq) 方法是一個非常方便的選擇。

with open("my_file.txt", "w", encoding='utf-8') as file:
    lines = ["第一行\n", "第二行\n", "第三行\n", "test\n"]
    file.writelines(lines)

其他寫入檔案的方式 print(data,file=f)

在 Python 中，print() 函數通常用來將資料輸出到終端（也就是我們平常看到的命令列）。然而，透過指定 file 參數，我們可以將輸出導向到一個檔案中，而不是顯示在螢幕上。
-data: 你想要寫入檔案的資料，可以是字符串、數字、或是更複雜的資料結構。
-file: 要寫入的檔案對象。這個對象通常是透過 open() 函數取得的。

with open('my_file.txt', 'w') as file:
    data = "Hello, world!\n"
    print(data, file=file)

with open('movieList.txt', 'w', encoding='utf-8')as f:
    movies = ['movie1', 'movie2', 'movie3']
    print(movies, file=f)

option

Python 的 seek() 方法：精準控制檔案讀寫位置

seek() 函數的用途

seek() 函數在 Python 中主要用於在檔案中移動讀寫位置。想像一個檔案就像是一本書，而 seek() 就如同將書籤移動到書的任意頁面。透過這個函數，我們可以精準地控制從檔案的哪個位置開始讀取或寫入資料。

seek() 的參數

offset: 偏移量，表示要移動的位元組數。可以是正數（向後移動）、負數（向前移動）或 0（無移動）。
whence: 可選參數，表示偏移量的參考位置。
file.seek(0) ：檔案的起始位置
file.seek(1) : (os.SEEK_CUR)：當前的文件位置
file.seek(2) : (os.SEEK_END)：檔案的結尾位置

常見的使用情境

隨機存取檔案：

從任意位置開始讀取：將 offset 設為要開始讀取的位元組數，whence 設為 0。
在特定位置插入資料：將 offset 設為插入位置，whence 設為 0，然後使用 write() 方法寫入資料。

處理大型檔案：

分段讀取：對於過大的檔案，一次性讀取可能會導致記憶體不足。可以使用 seek() 分段讀取，每次只讀取一小部分。
跳過無用資料：如果檔案中包含大量無用的資料，可以使用 seek() 跳過這些部分，直接定位到需要的資料。
修改檔案內容：
- 替換特定內容：將文件指針移動到要替換的內容的起始位置，然後使用 write() 方法寫入新的內容。
- 插入新內容：將文件指針移動到插入位置，然後使用 write() 方法寫入新的內容。

with open('my_file.txt', 'r+') as f:
    # 移動到檔案末尾
    f.seek(0, 2)
    # 在末尾追加一行
    f.write('\nThis is a new line.')

    # 移動到檔案開頭
    f.seek(0)
    # 讀取前10個位元組
    data = f.read(10)
    print(data)

注意事項

二進位模式 vs. 文字模式：在二進位模式下，seek() 操作的是位元組，而在文字模式下，seek() 操作的是字元。
不同系統的換行符：在不同作業系統中，換行符的表示方式不同。Windows 使用 \r\n，而 Unix/Linux 使用 \n。
文件指針： seek() 操作會改變文件指針的位置，後續的讀寫操作都會從新的位置開始。
檔案類型：不是所有的檔案都支持隨機存取，例如壓縮檔案或資料庫檔案。

常見的應用場景：
編輯器：在編輯器中，seek() 可以用於實現光標的移動和內容的插入、刪除。
資料庫：資料庫系統中，seek() 可以用於定位到特定的記錄。
網路通訊：在網路通訊中，seek() 可以用於處理接收到的資料包。

小結

seek() 函數為我們提供了對檔案進行精細控制的能力，在處理各種檔案操作時都非常有用。通過熟練掌握 seek() 的用法，我們可以更靈活地處理檔案資料。

86. Deleting Files and Folders

在 Python 中，您可以使用內建模組 os 和 shutil 來刪除檔案和資料夾。

以下是一些關鍵的概念和方法：

刪除檔案

使用 os.remove() 方法來刪除單一檔案。
範例程式碼

import os 

file_path = "example.txt" # 檔案路徑

# 檢查檔案是否存在，然後刪除
if os.path.exists(file_path):
       os.remove(file_path)
       print(f"{file_path} 已刪除")
else:
       print(f"{file_path} 不存在")

注意
如果檔案不存在且直接執行 os.remove()，會拋出 FileNotFoundError。
確保在執行刪除前，確認檔案路徑正確。

刪除空資料夾

使用 os.rmdir() 刪除空資料夾。
範例程式碼

import os

# 資料夾路徑
folder_path = "empty_folder"

# 檢查資料夾是否存在，然後刪除
if os.path.exists(folder_path):
      os.rmdir(folder_path)
      print(f"{folder_path} 已刪除")
else:
      print(f"{folder_path} 不存在")

os.rmdir() 只能刪除空資料夾。如果資料夾中有檔案，會引發 OSError。

刪除非空資料夾

使用 shutil.rmtree() 刪除資料夾及其內容（包含檔案和子資料夾）。
範例程式碼

import shutil

# 資料夾路徑
folder_path = "non_empty_folder"

# 檢查資料夾是否存在，然後刪除
if os.path.exists(folder_path):
       shutil.rmtree(folder_path)
       print(f"{folder_path} 已刪除，包括其中的所有內容")
else:
      print(f"{folder_path} 不存在")

注意: shutil.rmtree() 是強力刪除，會移除資料夾及其所有內容，請謹慎操作。如果要在刪除前詢問用戶確認，可以結合輸入功能。

其他實用技巧

刪除特定條件的檔案
可以結合 os.listdir() 和條件判斷來刪除特定檔案，例如刪除 .txt 檔案：

import os

folder_path = "example_folder"

# 列出資料夾中的檔案
for file_name in os.listdir(folder_path):
      if file_name.endswith(".txt"): # 找到所有 .txt 檔案 
           os.remove(os.path.join(folder_path, file_name))
print(f"{file_name} 已刪除")

避免潛在問題

權限問題：確認執行程式的使用者具有刪除檔案/資料夾的權限。
不存在的路徑：在操作前使用 os.path.exists() 確保路徑有效。
不必要的遞迴操作：避免錯誤地刪除不應刪除的父資料夾。

87.User Input

1.Python `input()` 背後的操作

input() 等待用戶輸入數據。
當用戶按下enter後，Python 讀取輸入並將其作為字串返回。
與操作系統的關係：
- 在等待用戶輸入時，input() 會進入 I/O 操作階段。
- 在操作系統層面，I/O 是一種慢速操作，因為它需要等待用戶交互完成

2. OS Blocked Stage

當程式執行到 input() 時，會進入 I/O Blocked Stage：
- 什麼是 Blocked Stage：
  - CPU 將進程暫停suspend，等待 I/O 完成（例如等待鍵盤輸入）。
  - 此時，該進程處於「阻塞（Blocked）」狀態，並讓出 CPU 資源。
- 為什麼需要 Blocked：
  - 用戶輸入的速度通常比 CPU 執行的速度慢得多。如果不進入阻塞狀態，CPU 資源會浪費在等待用戶操作上。

「suspend」：這個進程會被暫停，無法繼續執行，直到特定的事件或條件達成。例如，在等待用戶輸入數據時，程式進程會進入「掛起」狀態，直到用戶完成輸入並按下enter鍵，程式才會繼續執行。

3. CPU 和標準輸出（Standard Output）

標準輸出 (stdout) 是指輸出數據到螢幕的過程，例如使用 print()。
與 input() 配合時：
1. 程式會先用標準輸出將提示文字顯示在螢幕上，告知用戶需要輸入什麼。

name = input("Enter your name: ")  # 標準輸出顯示提示文字

1. 當用戶輸入時，鍵盤的數據經操作系統傳送到程式，程式接收後進入執行狀態。

4. 簡單流程總結

input() 調用過程：

CPU 請求操作系統處理鍵盤輸入。
程式進入 Blocked Stage，等待用戶輸入。
用戶按下enter後，數據從鍵盤進入標準輸入，程式繼續執行。

print() 調用過程：

CPU 請求操作系統將數據寫入螢幕。
螢幕作為 I/O 設備，將數據顯示給用戶。

5. 關聯總結

input()：涉及操作系統的 I/O 阻塞，程式在等待用戶輸入時，進程會被掛起，釋放 CPU。
print()（標準輸出）：涉及操作系統的 I/O 輸出，數據經由操作系統傳輸到螢幕顯示。
CPU 與 I/O 的互動：
- 等待輸入時，程式進入阻塞狀態。
- 標準輸出時，CPU 僅負責傳輸數據至 I/O 設備（螢幕）。

這種設計保證了系統資源的高效利用，避免了 CPU 的閒置浪費。

Python 全攻略 第10節：Chapter 5- I/O in Python 82~87