82.介紹 I/O with file
83. readline, readlines, and close
84. Encoding 亂碼
85. with statement and modes
86. deleting files and folders
87. user input
Python I/O:程式與外部世界的橋樑
什麼是 I/O?
I/O(Input/Output),在這章節我們討論的
- 輸入(Input): 將.txt檔案input並讀取/處理資料。
- 輸出(Output): 將資料寫入/處理後並輸出.txt
Python 檔案處理方法:
功能 | 解釋 | 範例 |
---|---|---|
開啟檔案open("filename.txt") |
filename 是一個string, 會回傳一個file object | |
開啟檔案open("filename.txt", "mode") |
mode常見模式有:r 讀取、w 覆寫、a 追加、x 創建新檔案、b 二進位模式。 |
file = open("filename.txt", "r") |
讀取整個檔案 .read() |
讀取檔案所有內容,返回為字串string。 | words = file.read() |
讀取指定數量的字元 .read(n) |
讀取指定字元數量 n ,返回為字串。 |
word = file.read(6) |
讀取單行 .readline() |
讀取下一行內容,返回為字串。 | first_line = file.readline() |
讀取所有行 .readlines() |
讀取所有行並返回列表,每行作為列表的一個元素list。佔記憶體 | lines = file.readlines() |
寫入檔案 file =open('file.txt','w') as file: |
將字串 str 寫入檔案(w覆蓋模式)。 |
file =open('file.txt','w') as f: f.write("Hello, world!\n") |
寫入檔案 file =open('file.txt','a') as file: |
使用'a' 模式來追加寫入並讀取(同一個檔案)不會覆蓋 |
with open('testFile.txt', 'a', encoding='utf-8') as f: f.write("Keep learning !\n") |
寫入檔案 with open('my_file.txt', 'x') as f: |
‘x’ 模式 的主要用途是 創建一個新檔案,如果檔案已經存在,就會報錯。因此,它並不能直接用於追加寫入和讀取同一個檔案。 | with open('my_file.txt', 'x') as f: f.write("第一次寫入\n") |
寫入多行 .writelines(seq) |
將 seq 序列中的每個元素作為一行寫入檔案,適用於列表或元組 |
lines = ["Line 1\n", "Line 2\n"] file.writelines(lines) |
使用 print() 寫入 print(data, file=file) |
使用 print() 函數將 data 寫入到指定的檔案 file 。 |
data = "Hello, world!" print(data, file=file) |
使用 with 自動關閉with open("filename.txt", "mode") as file |
使用 with 開啟檔案,程式執行完畢後會自動關閉檔案。 |
with open("filename.txt", "w") as file: file.write("Hello, world!") |
開啟檔案open() & with open
基本語法
file = open("filename.txt", "mode")
file.close()
filename.txt
: 要開啟的檔案名稱相對路徑。
mode
: 開啟模式,常見的有:
r
: 讀取 (預設)
w
: 寫入 (覆寫)
a
: 追加 (在檔案末尾追加)
x
: 創建新檔案 (如果檔案已存在則報錯)
進階使用與 with
一起使用 開啟檔案
什麼是 with 陳述式?
with 陳述式是一種上下文管理器,它讓程式碼更簡潔,並且能自動釋放資源。
為什麼要用 with 陳述式?
在處理檔案、資料庫連接等資源時,為了避免忘記關閉檔案導致的資源洩露,使用 with 陳述式能確保資源在使用完畢後被自動正確關閉檔案,即使發生異常。
with 陳述式的語法
with open(expression,"mode") as variable:
# 在這個區塊中,可以使用 variable 來訪問資源
- expression:通常是一個函式呼叫,返回一個上下文管理器物件。
- variable:一個變數,用來表示上下文管理器所管理的資源。
with open("my_file.txt", "a" as file:
file.write("This is a new line.\n")
as file
中的file
是自定義的
as file
中的 file 並不是 Python 的關鍵字,而是一個變量名稱。
你可以將它換成任何你喜歡的變量名稱
讀取檔案 "r"
一次讀取所有內容.read():
假設我有一份my_file.txt 裡面內容為:
I love python
I love Club
with open("my_file.txt","r") as file:
words = file.read()
print(words)
#輸出
I love python
I love Club
讀取指定數量的位元組.read(n):
with open("my_file.txt","r") as file:
word = file.read(6)
print(word)
file.close()
#輸出 I love
單行讀取.readline()
with open("my_file.txt","r") as file:
first_line = file.readline()
second_line = file.readline()
print(second_line,first_line,sep='\n')
#輸出
I love Club
I love python
逐行讀取.readlines()
它會將文件中的每一行讀取為一個元素,並將這些元素存儲在一個列表中。
with open("my_file.txt","r") as file:
a = file.readlines()
print(a)
#輸出
['I love python\n',
'I love Club']
# 遍歷每一行
with open("my_file.txt","r") as file:
for line in file.readlines():
print(line)
#輸出
I love python
I love Club
86.Bonus section 編碼 (encoding)
什麼是編碼(encoding)?
想像一下,我們人類用中文、英文、日文等不同的文字來溝通,而電腦只認識 0 和 1。
為了讓電腦能理解我們輸入的文字,就需要一種「翻譯」的方式,
將文字轉換成電腦能識別為一組數字,這個轉換的過程就稱為「編碼」。
簡單來說,編碼就是將人類可讀的文字轉換成電腦可讀的數字序列。
編碼是將文字轉換成電腦可以理解的二進位數字的過程。
不同的編碼方式使用不同的對應關係,例如 ASCII、UTF-8、Big5 等。
為什麼要了解編碼?
在讀取或開啟文件時,python會根據你電腦的os預設encoding來呈現,
但如果跟其他人寫入文件的encoding不同,就 有可能會看到亂碼 。
所以在處理文字檔案時,必須指定正確的編碼方式,才能正確地讀取和寫入資料。
常見的編碼:
- UTF-8: 最常用,一種可變長度的 Unicode 轉碼格式,幾乎可以表示世界上所有的文字。
- ASCII: 主要用於顯示現代英文的字元。
- cp950: 常用於繁體中文的編碼。
結合範例
with open('my_file.txt', 'r', encoding='utf-8') as f:
for line in f:
print(line, end='')
寫入檔案
常見寫入檔案的模式
w
: 寫入模式,如果檔案存在則會覆蓋原有檔案內容。如果檔案不存在,則會創建新檔案。
a
: 附加模式,用於在檔案末尾追加內容。如果檔案不存在,則會創建新檔案。
x
: 排他性創建模式,如果檔案已經存在則會報錯。
b
: 二進位模式,用於讀寫二進位資料。
t
: 文字模式(預設),用於讀寫文字資料。
使用'w'
模式寫入檔案的步驟
先打開檔案寫入,再讀取(分開操作,無法同時寫入和讀取)
原因: 在同一個 with 語句中,使用 ‘w’ 模式開啟檔案後,檔案就處於寫入狀態。如果你想在寫入之後立即讀取,需要重新開啟檔案,並使用 ‘r’ 模式。
# 以寫入模式開啟一個名為 testFile.txt 的檔案
with open('testFile.txt', 'w', encoding='utf-8') as file:
#寫入檔案
file.write("Hello, world!\n") # 寫入一行文字
#再讀取
with open('testFile.txt', 'r', encoding='utf-8') as file:
for line in file:
print(line, end='')
這段程式碼做了以下事情:
- 開啟檔案: 使用 with open() 開啟名為 my_file.txt 的檔案,以讀取模式開啟,並指定編碼為 UTF-8。
- 逐行讀取: 使用 for 迴圈逐行讀取檔案內容,並將每一行印出。
- 自動關閉: 離開 with 區塊時,檔案會自動關閉。
使用'a'
模式來追加寫入並讀取(同一個檔案)
# 追加寫入檔案
with open('my_file.txt', 'a', encoding='utf-8') as f:
f.write("Hello, world!\n")
# 讀取檔案
with open('my_file.txt', 'r', encoding='utf-8') as f:
for line in f:
print(line, end='')
使用'x'
模式
‘x’ 模式 的主要用途是 創建一個新檔案,如果檔案已經存在,就會報錯。因此,它並不能直接用於追加寫入和讀取同一個檔案。
with open('my_file.txt', 'x') as f:
f.write("第一次寫入\n")
# 追加寫入
with open('my_file.txt', 'a') as f:
f.write("追加內容\n")
# 讀取
with open('my_file.txt', 'r') as f:
for line in f:
print(line, end='')
其他寫入檔案的方式 .writelines(seq)
在 Python 中,當我們想要一次性將一個序列(例如列表或元組)中的多個字符串寫入到一個檔案中時,,並且在每個字符串的末尾自動添加一個換行符。.writelines(seq) 方法是一個非常方便的選擇。
with open("my_file.txt", "w", encoding='utf-8') as file:
lines = ["第一行\n", "第二行\n", "第三行\n", "test\n"]
file.writelines(lines)
其他寫入檔案的方式 print(data,file=f)
在 Python 中,print() 函數通常用來將資料輸出到終端(也就是我們平常看到的命令列)。然而,透過指定 file 參數,我們可以將輸出導向到一個檔案中,而不是顯示在螢幕上。
-data: 你想要寫入檔案的資料,可以是字符串、數字、或是更複雜的資料結構。
-file: 要寫入的檔案對象。這個對象通常是透過 open() 函數取得的。
with open('my_file.txt', 'w') as file:
data = "Hello, world!\n"
print(data, file=file)
with open('movieList.txt', 'w', encoding='utf-8')as f:
movies = ['movie1', 'movie2', 'movie3']
print(movies, file=f)
option
Python 的 seek() 方法:精準控制檔案讀寫位置
seek() 函數的用途
seek() 函數在 Python 中主要用於在檔案中移動讀寫位置。想像一個檔案就像是一本書,而 seek() 就如同將書籤移動到書的任意頁面。透過這個函數,我們可以精準地控制從檔案的哪個位置開始讀取或寫入資料。
seek() 的參數
offset: 偏移量,表示要移動的位元組數。可以是正數(向後移動)、負數(向前移動)或 0(無移動)。
whence: 可選參數,表示偏移量的參考位置。
file.seek(0) :檔案的起始位置
file.seek(1) : (os.SEEK_CUR):當前的文件位置
file.seek(2) : (os.SEEK_END):檔案的結尾位置
常見的使用情境
隨機存取檔案:
- 從任意位置開始讀取: 將 offset 設為要開始讀取的位元組數,whence 設為 0。
- 在特定位置插入資料: 將 offset 設為插入位置,whence 設為 0,然後使用 write() 方法寫入資料。
處理大型檔案:
- 分段讀取: 對於過大的檔案,一次性讀取可能會導致記憶體不足。可以使用 seek() 分段讀取,每次只讀取一小部分。
- 跳過無用資料: 如果檔案中包含大量無用的資料,可以使用 seek() 跳過這些部分,直接定位到需要的資料。
- 修改檔案內容:
- 替換特定內容: 將文件指針移動到要替換的內容的起始位置,然後使用 write() 方法寫入新的內容。
- 插入新內容: 將文件指針移動到插入位置,然後使用 write() 方法寫入新的內容。
with open('my_file.txt', 'r+') as f:
# 移動到檔案末尾
f.seek(0, 2)
# 在末尾追加一行
f.write('\nThis is a new line.')
# 移動到檔案開頭
f.seek(0)
# 讀取前10個位元組
data = f.read(10)
print(data)
注意事項
- 二進位模式 vs. 文字模式: 在二進位模式下,seek() 操作的是位元組,而在文字模式下,seek() 操作的是字元。
- 不同系統的換行符: 在不同作業系統中,換行符的表示方式不同。Windows 使用 \r\n,而 Unix/Linux 使用 \n。
- 文件指針: seek() 操作會改變文件指針的位置,後續的讀寫操作都會從新的位置開始。
- 檔案類型: 不是所有的檔案都支持隨機存取,例如壓縮檔案或資料庫檔案。
常見的應用場景:
編輯器: 在編輯器中,seek() 可以用於實現光標的移動和內容的插入、刪除。
資料庫: 資料庫系統中,seek() 可以用於定位到特定的記錄。
網路通訊: 在網路通訊中,seek() 可以用於處理接收到的資料包。
小結
seek() 函數為我們提供了對檔案進行精細控制的能力,在處理各種檔案操作時都非常有用。通過熟練掌握 seek() 的用法,我們可以更靈活地處理檔案資料。
86. Deleting Files and Folders
在 Python 中,您可以使用內建模組 os 和 shutil 來刪除檔案和資料夾。
以下是一些關鍵的概念和方法:
刪除檔案
使用 os.remove() 方法來刪除單一檔案。
範例程式碼
import os
file_path = "example.txt" # 檔案路徑
# 檢查檔案是否存在,然後刪除
if os.path.exists(file_path):
os.remove(file_path)
print(f"{file_path} 已刪除")
else:
print(f"{file_path} 不存在")
注意
如果檔案不存在且直接執行 os.remove(),會拋出 FileNotFoundError。
確保在執行刪除前,確認檔案路徑正確。
刪除空資料夾
使用 os.rmdir() 刪除空資料夾。
範例程式碼
import os
# 資料夾路徑
folder_path = "empty_folder"
# 檢查資料夾是否存在,然後刪除
if os.path.exists(folder_path):
os.rmdir(folder_path)
print(f"{folder_path} 已刪除")
else:
print(f"{folder_path} 不存在")
os.rmdir() 只能刪除空資料夾。如果資料夾中有檔案,會引發 OSError。
刪除非空資料夾
使用 shutil.rmtree()
刪除資料夾及其內容(包含檔案和子資料夾)。
範例程式碼
import shutil
# 資料夾路徑
folder_path = "non_empty_folder"
# 檢查資料夾是否存在,然後刪除
if os.path.exists(folder_path):
shutil.rmtree(folder_path)
print(f"{folder_path} 已刪除,包括其中的所有內容")
else:
print(f"{folder_path} 不存在")
注意:
shutil.rmtree()
是強力刪除,會移除資料夾及其所有內容,請謹慎操作。如果要在刪除前詢問用戶確認,可以結合輸入功能。
其他實用技巧
刪除特定條件的檔案
可以結合 os.listdir()
和條件判斷來刪除特定檔案,例如刪除 .txt 檔案:
import os
folder_path = "example_folder"
# 列出資料夾中的檔案
for file_name in os.listdir(folder_path):
if file_name.endswith(".txt"): # 找到所有 .txt 檔案
os.remove(os.path.join(folder_path, file_name))
print(f"{file_name} 已刪除")
避免潛在問題
- 權限問題:確認執行程式的使用者具有刪除檔案/資料夾的權限。
- 不存在的路徑:在操作前使用 os.path.exists() 確保路徑有效。
- 不必要的遞迴操作:避免錯誤地刪除不應刪除的父資料夾。
87.User Input
1.Python input()
背後的操作
input()
等待用戶輸入數據。- 當用戶按下enter後,Python 讀取輸入並將其作為字串返回。
- 與操作系統的關係:
- 在等待用戶輸入時,
input()
會進入 I/O 操作階段。 - 在操作系統層面,I/O 是一種慢速操作,因為它需要等待用戶交互完成
- 在等待用戶輸入時,
2. OS Blocked Stage
- 當程式執行到
input()
時,會進入 I/O Blocked Stage:- 什麼是 Blocked Stage:
- CPU 將進程暫停suspend,等待 I/O 完成(例如等待鍵盤輸入)。
- 此時,該進程處於「阻塞(Blocked)」狀態,並讓出 CPU 資源。
- 為什麼需要 Blocked:
- 用戶輸入的速度通常比 CPU 執行的速度慢得多。如果不進入阻塞狀態,CPU 資源會浪費在等待用戶操作上。
- 什麼是 Blocked Stage:
「suspend」:這個進程會被暫停,無法繼續執行,直到特定的事件或條件達成。例如,在等待用戶輸入數據時,程式進程會進入「掛起」狀態,直到用戶完成輸入並按下enter鍵,程式才會繼續執行。
3. CPU 和標準輸出(Standard Output)
- 標準輸出 (stdout) 是指輸出數據到螢幕的過程,例如使用
print()
。 - 與
input()
配合時:- 程式會先用標準輸出將提示文字顯示在螢幕上,告知用戶需要輸入什麼。
name = input("Enter your name: ") # 標準輸出顯示提示文字
-
- 當用戶輸入時,鍵盤的數據經操作系統傳送到程式,程式接收後進入執行狀態。
4. 簡單流程總結
input()
調用過程:
- CPU 請求操作系統處理鍵盤輸入。
- 程式進入 Blocked Stage,等待用戶輸入。
- 用戶按下enter後,數據從鍵盤進入標準輸入,程式繼續執行。
print()
調用過程:
- CPU 請求操作系統將數據寫入螢幕。
- 螢幕作為 I/O 設備,將數據顯示給用戶。
5. 關聯總結
input()
:涉及操作系統的 I/O 阻塞,程式在等待用戶輸入時,進程會被掛起,釋放 CPU。print()
(標準輸出):涉及操作系統的 I/O 輸出,數據經由操作系統傳輸到螢幕顯示。- CPU 與 I/O 的互動:
- 等待輸入時,程式進入阻塞狀態。
- 標準輸出時,CPU 僅負責傳輸數據至 I/O 設備(螢幕)。
這種設計保證了系統資源的高效利用,避免了 CPU 的閒置浪費。