Python

Python常用連結

Python官方

Python 的優勢

簡潔易學的語法

Python 的語法簡單且接近自然語言，即使是程式設計新手也能快速上手，降低了學習的門檻。

豐富的標準庫與第三方資源

Python 提供了廣泛的標準函式庫，涵蓋網路、數據處理、圖形界面等多方面。此外，強大的第三方生態系如 NumPy、Pandas、TensorFlow 使 Python 成為多功能的開發工具。

跨平台的特性

Python 是跨平台的語言，無論是 Windows、macOS 還是 Linux，都能執行相同的 Python 程式，極大提高了開發的靈活性。

廣泛應用於多個領域

Python 在多個領域中發揮重要作用，例如資料科學、人工智慧、網頁開發、自動化腳本和遊戲開發等，讓開發者可以用一種語言處理多種需求。

活躍的社群支持

Python 擁有一個龐大的全球社群，無論是初學者還是資深開發者，都能輕易找到教學資源、討論群組和技術支持。

高效的開發速度

Python 提供了直觀的語法和強大的工具，讓開發者能更快地實現程式設計，縮短產品的開發週期。

Python 開發環境

Anaconda

什麼是 Anaconda？

Anaconda 是一個開放源碼的 Python 和 R 編程平台，專為科學計算設計，包括數據科學、機器學習、人工智慧和大數據分析等應用。

主要功能

整合式環境：提供簡單易用的整合開發環境（IDE），如 Jupyter Notebook 和 Spyder。
封裝管理：使用 Conda 管理工具輕鬆安裝、更新和管理數千個開源庫。
跨平台支持：支援 Windows、macOS 和 Linux。
資料可視化：內建多種工具幫助資料視覺化，如 Matplotlib 和 Seaborn。

適合對象

Anaconda 適合以下領域的使用者：

數據科學家
機器學習工程師
人工智慧研究人員
需要進行大數據分析的專業人員

如何安裝 Anaconda？

訪問 Anaconda 官方網站。
選擇適合的作業系統版本，下載對應的安裝檔案。
按照安裝向導完成安裝，並配置環境變數（可選）。

常見問題

以下是使用者常遇到的問題：

如何升級 Anaconda？

可以在終端機中輸入 conda update conda 和 conda update anaconda。

Anaconda 與 Python 有什麼區別？

Anaconda 是一個整合了 Python 的數據科學平台，內建了多種工具和庫，而 Python 是一種程式語言。

Anaconda 環境

什麼是 Anaconda 環境

Anaconda 提供了虛擬環境 (Environment) 功能，讓使用者可以在同一台電腦上建立多個彼此獨立的 Python 執行環境。每個環境可以有不同的 Python 版本與套件，避免不同專案間的依賴衝突。

建立環境


# 建立一個名為 myenv 的環境，並指定 Python 版本
conda create -n myenv python=3.10

啟動與切換環境


# 啟動環境
conda activate myenv

# 退出環境
conda deactivate

查看環境


# 列出所有環境
conda env list
# 或
conda info --envs

匯出與還原環境


# 匯出環境配置到 YAML 檔案
conda env export > environment.yml

# 從 YAML 檔案建立環境
conda env create -f environment.yml

刪除環境


# 刪除指定環境
conda remove -n myenv --all

Jupyter

什麼是 Jupyter？

Jupyter 是一個開放源碼的交互式計算環境，支援多種程式語言，主要用於數據科學、機器學習和學術研究。

Jupyter

核心特點

支持多語言：包括 Python、R、Julia 等超過 40 種語言。
交互式編程：透過 Jupyter Notebook 寫程式、執行程式碼並即時檢視結果。
資料可視化：內建支援圖形化工具，如 Matplotlib、Plotly 等。
分享功能：Notebook 可匯出為 HTML、PDF 或通過 Jupyter Hub 分享。

主要組件

Jupyter Notebook：一個基於網頁的編輯器，讓用戶撰寫和運行程式碼。
JupyterLab：下一代用戶界面，提供更強的功能和擴展性。
Jupyter Hub：支持多用戶的 Jupyter 平台，適用於團隊或學術機構。

應用範圍

Jupyter 被廣泛應用於以下領域：

數據科學與分析
機器學習與深度學習模型開發
學術研究與教育
資料可視化與報告

如何使用 Jupyter？

安裝 Anaconda 或獨立安裝 Jupyter。
在終端機輸入 jupyter notebook 啟動 Jupyter Notebook。
透過瀏覽器進入編輯介面，創建和運行 Notebook。

優勢與挑戰

優勢：即時執行、結果可視化、支援多語言。
挑戰：對大型項目支持有限，執行效率可能不如傳統 IDE。

VS Code Python 開發環境

安裝Visual Studio Code

前往 Visual Studio Code官方網站，下載並安裝適合您作業系統的版本。

安裝Python擴展

在Visual Studio Code中，透過以下步驟安裝Python擴展：

點擊左側的擴展圖示。
搜尋「Python」。
選擇由Microsoft提供的Python擴展並點擊「安裝」。

安裝Python

確保系統已安裝Python。可以從 Python官方網站下載並安裝。

安裝完成後，在命令列輸入以下指令確認安裝成功：

python --version
# 或
python3 --version

設定Python解譯器

打開您的Python專案或檔案，點擊Visual Studio Code右下角的「Python」狀態欄，選擇適當的Python解譯器。

執行Python程式

在編輯器中開啟Python檔案，使用以下方式執行程式：

右鍵檔案內容，選擇「Run Python File in Terminal」。
或使用快捷鍵 Ctrl + Shift + P，搜尋「Run Python File」並執行。

安裝必要套件

如果需要安裝第三方套件，可以使用內建終端機輸入：

pip install 套件名稱

啟用自動完成與除錯

透過Python擴展提供的功能，可享受自動完成與強大的除錯工具：

點擊左側的除錯圖示。
選擇「Create a launch.json file」，選擇Python。
設置完成後即可按F5啟用除錯模式。

常用快捷鍵

以下是幾個常用快捷鍵：

執行程式： Ctrl + F5
開啟命令面板： Ctrl + Shift + P
格式化程式碼： Shift + Alt + F
開啟終端機： Ctrl + `

VS Code

vscode/Vidual Studio Code

VS Code設定Python執行參數

修改launch.json

若需要在執行Python程式時傳遞參數，可以透過設定 launch.json 完成：

點擊左側的「Run and Debug」圖示。
點擊「create a launch.json file」或「Add Configuration」。
選擇「Python」作為環境。
在生成的 launch.json 文件中修改相關設定。

設定program與args參數

以下是一個範例配置，包含程式路徑和執行時的參數：

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: Run with Arguments",
            "type": "python",
            "request": "launch",
            "program": "${workspaceFolder}/main.py",  // 程式路徑
            "console": "integratedTerminal",         // 終端類型
            "args": ["arg1", "arg2", "--option", "value"]  // 傳遞參數
        }
    ]
}

args的用途

在 args 中可以傳遞命令列參數，例如：

arg1 和 arg2 為位置參數。
--option 和 value 為帶有選項的參數。

在程式中讀取參數

使用 sys.argv 來讀取命令列傳遞的參數：

import sys

print("所有參數:", sys.argv)
if len(sys.argv) > 1:
    print("第一個參數:", sys.argv[1])
    print("第二個參數:", sys.argv[2])

執行範例

假設程式為：

python main.py arg1 arg2 --option value

執行結果：

所有參數: ['main.py', 'arg1', 'arg2', '--option', 'value']
第一個參數: arg1
第二個參數: arg2

VS Code Python Debug 模式

啟用 Debug 模式

1. 安裝 Python Extension 擴展。

2. 在 VS Code 中開啟您的 Python 專案。

3. 按下 F5 或點擊左側活動欄的 Debug 圖示。

設定 launch.json

1. 點擊 Debug 面板中的「新增配置」。

2. 選擇 Python，系統會自動生成一個 launch.json。

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: Current File",
            "type": "python",
            "request": "launch",
            "program": "${file}",
            "console": "integratedTerminal"
        }
    ]
}

設置中斷點

1. 在程式碼行號旁點擊以新增中斷點。

2. 可使用條件中斷點：右鍵點擊中斷點並選擇「編輯條件」。

調試功能

步進執行 (Step Over): 按 F10 跳過函式。
逐步執行 (Step Into): 按 F11 進入函式內部。
跳出函式 (Step Out): 按 Shift+F11 跳出函式。

檢查變數

1. 在 Debug 面板的「變數」區域檢視目前變數狀態。

2. 可在「監視」區域手動加入特定表達式。

使用 Debug Console

1. 在 Debug Console 中輸入 Python 指令以即時檢查程式狀態。

2. 可執行變數查詢、呼叫函式等操作。

VS Code 設定 Python 路徑

步驟 1：安裝 Python 與 VS Code

確保已安裝 Python 並將其加入系統環境變數，然後下載並安裝 Visual Studio Code。

步驟 2：安裝 Python 擴充套件

開啟 Visual Studio Code，點擊左側的 Extensions 圖示，搜尋 Python，然後安裝 Microsoft 提供的 Python 擴充套件。

步驟 3：檢查 Python 安裝路徑

在終端機輸入以下指令來確認 Python 的安裝路徑：

which python

或（Windows 系統）：

where python

步驟 4：設定 Python 路徑

在 Visual Studio Code 中，按 Ctrl + Shift + P，輸入並選擇 Python: Select Interpreter。

在清單中選擇正確的 Python 路徑。如果未顯示，請手動輸入完整路徑。

步驟 5：確認設定

開啟終端機並執行 python --version 來確認選定的 Python 解釋器版本正確。

附加資訊

如果需要特定專案的 Python 路徑，可以在專案根目錄新增 .vscode/settings.json 檔案，並加入以下內容：

{
  "python.pythonPath": "你的 Python 完整路徑"
}

替換 你的 Python 完整路徑 為實際路徑。

VS Code Python 環境切換

在 VS Code 中開發時，決定使用 Anaconda 或其他環境，主要透過底層的解釋器（Interpreter）設定。這能確保你的套件依賴與程式執行環境完全隔離。

1. 選擇 Python 環境的步驟

點擊右下角環境名稱：在 VS Code 視窗的最右下角，你會看到類似 Python 3.x.x 或環境名稱的文字，直接點擊即可開啟選單。
使用命令面板：按下 Ctrl + Shift + P (Windows) 或 Cmd + Shift + P (Mac)，輸入並選擇 Python: Select Interpreter。
在清單中挑選目標環境：
- 若要使用 Anaconda，請選擇標註有 Conda 字樣的路徑。
- 若要使用標準虛擬環境，請選擇標註有 Venv 的項目。

2. 如何決定使用 Anaconda 或其他環境

環境類型	適用情境	主要優勢
Anaconda	資料科學、機器學習、深度學習	預裝大量科學運算庫，對底層二進位檔案（如 DLL）管理較強。
Venv	一般網頁開發、自動化腳本	輕量、啟動速度快，僅包含執行必要的套件。

3. 在 Conda 中管理與切換環境

除了圖形介面，你也可以在 VS Code 內建的終端機使用指令來管理環境：

查看所有環境： conda env list
手動激活環境： conda activate 環境名稱
建立新環境： conda create -n 名稱 python=3.10

4. 常見問題與解決方案

找不到 Conda 環境： 若清單未顯示，請確認 Anaconda 是否已加入系統環境變數，或點擊「輸入解釋器路徑」手動指定 python.exe 的路徑。
終端機未自動激活： 在 VS Code 設定中搜尋 python.terminal.activateEnvironment，並確保該選項已勾選。
權限報錯： 在 Windows 上若無法切換，請以管理員身份執行 VS Code，或在 PowerShell 執行 Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser。

在 Chromebook 執行 Python

方法一：使用 Linux (Crostini)

在 Chromebook 設定中開啟「Linux (Beta)」或「開發人員 → Linux 開發環境」。

啟動 Linux 終端機，輸入：


sudo apt update
sudo apt install python3 python3-pip -y

輸入 python3 進入 Python 互動式環境。
若要安裝額外模組，可用 pip3 install 模組名稱。

方法二：使用線上編譯器

可直接透過瀏覽器使用線上 Python 編譯器，例如：
- Google Colab
- Replit
- Jupyter Notebook on Binder
適合不想安裝環境或臨時測試程式碼。

方法三：安裝 Android App

Chromebook 支援安裝 Android App，可透過 Google Play 下載：
- Pydroid 3：完整的 Python 開發環境。
- QPython：輕量級的 Python 腳本工具。

方法四：使用 VS Code

在 Linux (Crostini) 環境安裝 VS Code：


sudo apt install wget gpg -y
wget -qO- https://packages.microsoft.com/keys/microsoft.asc | gpg --dearmor > packages.microsoft.gpg
sudo install -o root -g root -m 644 packages.microsoft.gpg /usr/share/keyrings/
sudo sh -c 'echo "deb [arch=amd64 signed-by=/usr/share/keyrings/packages.microsoft.gpg] \
https://packages.microsoft.com/repos/code stable main" > /etc/apt/sources.list.d/vscode.list'
sudo apt update
sudo apt install code -y

在 VS Code 中安裝 Python 插件，即可進行程式開發。

結論

最快的方法是用 Linux (Crostini) 安裝 Python。
若不想動系統，可選擇 線上環境 或 Android App。
進階開發建議搭配 VS Code 或 Jupyter Notebook。

pip 使用指南

1. 什麼是 pip？

定義：pip 是 Python 的套件管理工具，全名為 "Pip Installs Packages"。
用途：用於安裝、更新、刪除和管理 Python 的套件。
來源：pip 會從 Python 官方的套件庫 PyPI (Python Package Index) 下載套件。

2. pip 的基本操作

檢查版本：
```
pip --version
```
安裝套件：
```
pip install 套件名稱
```
例如：pip install requests
升級套件：
```
pip install --upgrade 套件名稱
```
例如：pip install --upgrade requests
列出已安裝套件：
```
pip list
```
卸載套件：
```
pip uninstall 套件名稱
```
例如：pip uninstall requests
檢查過期套件：
```
pip list --outdated
```

3. 進階功能

安裝特定版本：
```
pip install 套件名稱==版本號
```
例如：pip install requests==2.26.0
安裝多個套件：
```
pip install -r requirements.txt
```
使用 requirements.txt 檔案，列出所有需要的套件名稱及版本。
生成需求檔案：
```
pip freeze > requirements.txt
```
此指令會將當前環境中的套件和版本導出為需求檔案。
清除快取：
```
pip cache purge
```
清理 pip 的快取資料夾以釋放磁碟空間。

4. 常見問題與解決方案

問題：pip 指令找不到
解決方法：檢查是否已安裝 Python，並確認 Python 的安裝目錄已加入系統的 PATH 環境變數中。
問題：安裝套件時遇到權限錯誤
解決方法：嘗試加上 --user 參數，例如：pip install 套件名稱 --user
問題：無法連接到 PyPI
解決方法：確認網路是否正常，或嘗試使用國內的鏡像源，例如：pip install 套件名稱 -i https://pypi.tuna.tsinghua.edu.cn/simple

5. pip 的最佳實踐

使用虛擬環境（如 venv 或 virtualenv），避免全域安裝套件產生衝突。
定期檢查和更新已安裝的套件以保持安全性。
在專案中使用 requirements.txt 來管理依賴關係。

pip/cache/http-v2 資料夾

1. 什麼是 pip/cache/http-v2 資料夾？

pip：Python 的套件管理工具，用於安裝、更新及管理 Python 套件。
cache：pip 的緩存目錄，用來儲存下載的套件及相關資源，以便於重複使用。
http-v2：緩存的 HTTP 請求資料，特別針對基於 HTTP/2 協議的下載請求。

2. http-v2 資料夾的用途

緩存下載的套件：當安裝套件時，pip 會下載套件的檔案並將其緩存在 http-v2 目錄中，以便未來安裝相同套件時不需要再次下載。
加速安裝過程：透過重複利用緩存中的檔案，可減少網路請求，提高安裝速度。
節省頻寬：避免每次安裝時都從網路重新下載套件，減少頻寬消耗。

3. http-v2 資料夾的管理

查看緩存位置：
- 使用指令 pip cache dir 查看目前緩存目錄。
清除緩存：
- 使用指令 pip cache purge 清除所有緩存資料。
- 僅刪除特定緩存資料：可直接刪除 http-v2 資料夾的內容，但這樣會使 pip 下次安裝相關套件時重新下載檔案。
禁用緩存：
- 若不希望使用緩存，可在安裝套件時加上 --no-cache-dir 參數，例如： pip install package_name --no-cache-dir。

4. 注意事項

緩存目錄大小：長期使用 pip 可能導致緩存資料夾變大，建議定期清理以釋放磁碟空間。
離線安裝：緩存的套件可用於離線環境下安裝，無需連接網路。
版本更新：清除緩存可能導致需要重新下載某些套件，但可以確保下載的是最新版本。

Python 基本資料結構

檢查變數型別

使用 type()

type() 函式可以回傳物件的型別。


x = 10
print(type(x))   # <class 'int'>

y = "hello"
print(type(y))   # <class 'str'>

使用 isinstance()

isinstance() 用來檢查變數是否屬於某型別，支援多型別檢查。


x = 10

print(isinstance(x, int))         # True
print(isinstance(x, str))         # False
print(isinstance(x, (int, float))) # True

差異

type() 比較嚴格，只會回傳精確的型別。
isinstance() 會考慮繼承關係，更常用於實務中。

Python 布林資料型態

Python 中的布林（Boolean）是程式設計中表示兩種邏輯狀態的基本資料型態：真 (True) 或假 (False)。它是所有條件判斷和流程控制的基礎。

1. 布林值與類型

布林值只有兩個：True 和 False。
它們必須以首字母大寫的方式書寫。
布林值的類型是 bool。

a = True
b = False
print(type(a))  # 輸出: <class 'bool'>

2. 布林與數字的關係

在 Python 內部，bool 是整數 int 的子類別，因此它們可以參與數值運算：

True 在數值上等同於 1。
False 在數值上等同於 0。

print(True + 1)   # 輸出: 2 (1 + 1)
print(False * 5)  # 輸出: 0 (0 * 5)

3. 核心用途：比較運算子

比較運算子會對兩個值進行比較，並返回一個布林結果。

運算子	描述	範例	結果
`==`	等於	`10 == 10`	`True`
`!=`	不等於	`5 != 10`	`True`
`>`	大於	`10 > 5`	`True`
`<=`	小於或等於	`5 <= 5`	`True`

4. 邏輯運算子

邏輯運算子用於結合或修改布林值或布林表達式。

and：邏輯「且」，兩邊都為 True 結果才是 True。
or：邏輯「或」，任一邊為 True 結果就是 True。
not：邏輯「非」，顛倒布林值。

print(True and False) # 輸出: False
print(True or False)  # 輸出: True
print(not True)       # 輸出: False

5. 真值測試 (Truth Value Testing)

在 Python 中，所有物件都具備真值。當物件用於條件判斷時，Python 會將其轉換為 True 或 False：

被視為 False (Falsy) 的物件包括：None、數字 0 (0, 0.0)、空字串 ("")、空列表 ([])、空元組 (())、空字典 ({}) 和空集合 (set())。
被視為 True (Truthy) 的物件包括：除了 Falsy 值之外的所有其他物件（例如非 0 的數字、任何非空的容器）。

if []: # 空列表被視為 False
    print("這不會被執行")
else:
    print("列表為空")

if "hello": # 非空字串被視為 True
    print("字串不為空")

Python 陣列

什麼是陣列？

在 Python 中，陣列是一種用於存儲多個相同類型元素的資料結構。雖然 Python 本身並沒有內建的陣列型別，但可以使用 list 或 array 模組來實現類似的功能。

使用 List 作為陣列

list 是 Python 的內建資料結構，可以儲存多種類型的資料，但也可以用來模擬陣列。

my_list = [1, 2, 3, 4, 5]
print(my_list[0])  # 輸出: 1

使用 array 模組

如果需要真正的陣列（所有元素必須是相同類型），可以使用 array 模組。

import array

my_array = array.array('i', [1, 2, 3, 4, 5])
print(my_array[0])  # 輸出: 1

在這裡，'i' 表示陣列中的元素是整數。

array 模組的基本操作

以下是一些基本操作：

新增元素：my_array.append(6)
移除元素：my_array.remove(3)
取長度：len(my_array)

陣列與 NumPy

對於需要進行數值運算的情況，numpy 提供了更強大的陣列支援。

import numpy as np

my_numpy_array = np.array([1, 2, 3, 4, 5])
print(my_numpy_array[0])  # 輸出: 1

NumPy 陣列支援多維資料與向量化運算，非常適合處理大量數據。

結論

Python 提供多種方式來實現陣列功能，list 適用於一般情況，array 模組適合需要相同類型元素的情況，而 numpy 是科學計算的首選工具。

判斷列表是否為空

對於變數 ret_value = []，在 Python 語言中判斷它是否為空列表，有幾種簡潔高效的方法。由於空列表在布林運算中會被視為 False，以下是幾種常用的判斷方式。

1. 使用布林求值 (最推薦的 Pythonic 方式)

這是最受歡迎的方法，直接檢查列表的布林值。如果列表是空的，not 運算子會使其條件判斷為真（True）。

ret_value = []

if not ret_value:
    # 列表為空時執行此處
    print("ret_value 是一個空列表")
else:
    # 列表不為空時執行此處
    print("ret_value 不是一個空列表")

2. 使用 `len()` 函數

檢查列表的長度是否等於 0。

ret_value = []

if len(ret_value) == 0:
    print("ret_value 是一個空列表")
else:
    print("ret_value 不是一個空列表")

3. 使用等值比較 `== []`

直接將變數與一個空的列表字面值 [] 進行比較。

ret_value = []

if ret_value == []:
    print("ret_value 是一個空列表")
else:
    print("ret_value 不是一個空列表")

陣列的動態增減

使用 List 進行動態操作

在 Python 中，list 是動態資料結構，可以輕鬆進行元素的新增與移除。

新增元素

可以使用以下方法新增元素：

append(): 在列表的末尾新增一個元素。
insert(): 在指定索引位置插入一個元素。
extend(): 將另一個列表的元素追加到現有列表中。

# 新增元素示例
my_list = [1, 2, 3]
my_list.append(4)  # [1, 2, 3, 4]
my_list.insert(1, 10)  # [1, 10, 2, 3, 4]
my_list.extend([5, 6])  # [1, 10, 2, 3, 4, 5, 6]

移除元素

可以使用以下方法移除元素：

pop(): 根據索引移除元素，預設移除最後一個元素。
remove(): 根據值移除第一個匹配的元素。
clear(): 移除列表中的所有元素。

# 移除元素示例
my_list = [1, 2, 3, 4, 5]
my_list.pop()  # [1, 2, 3, 4]
my_list.remove(2)  # [1, 3, 4]
my_list.clear()  # []

使用 array 模組的動態操作

對於需要相同類型元素的情況，可以使用 array 模組。

新增元素

append() 和 extend() 方法適用於 array 模組。

import array
my_array = array.array('i', [1, 2, 3])
my_array.append(4)  # [1, 2, 3, 4]
my_array.extend([5, 6])  # [1, 2, 3, 4, 5, 6]

移除元素

remove() 和 pop() 方法可用於 array 模組。

# 移除元素示例
my_array = array.array('i', [1, 2, 3, 4])
my_array.remove(2)  # [1, 3, 4]
my_array.pop()  # [1, 3]

結論

Python 提供了多種方法來實現陣列的動態增減，list 與 array 模組分別適合不同需求。對於更多功能需求，也可以考慮使用 numpy。

Python 陣列計數

在 Python 中，list.count() 是一個專門用來統計特定元素出現次數的方法。它與取得列表長度的 len() 不同，必須傳入一個參數作為比對對象。

1. list.count() 的基本語法

語法為 list.count(value)，它會回傳該值在列表中出現的整數次數。如果值不存在，則回傳 0。

fruits = ['apple', 'banana', 'apple', 'orange', 'apple']

# 統計 'apple' 出現的次數
apple_count = fruits.count('apple')
print(apple_count)  # 輸出: 3

# 統計不存在的元素
grape_count = fruits.count('grape')
print(grape_count)  # 輸出: 0

2. 常見計數需求與工具對照

根據你的需求（是找單一元素、多個元素，還是全部統計），有不同的最佳實踐：

需求	推薦方法	範例代碼
統計單一特定元素	`list.count()`	`arr.count(10)`
取得列表總長度	`len()`	`len(arr)`
統計所有元素的頻率	`collections.Counter`	`Counter(arr)`
條件計數 (如大於5)	生成器表達式	`sum(1 for x in arr if x > 5)`

3. 進階工具：collections.Counter

如果你需要一次知道列表中「所有元素」各自出現了幾次，使用 Counter 會比跑多次 count() 效率高得多（O(n) vs O(n^2)）。

from collections import Counter

data = [1, 2, 2, 3, 3, 3, 4]
counts = Counter(data)

print(counts)        # 輸出: Counter({3: 3, 2: 2, 1: 1, 4: 1})
print(counts[3])     # 取得數字 3 的次數: 3
print(counts.most_common(1)) # 取得出現次數最多的元素

4. 容易混淆的用法提醒

不要用 count 檢查是否存在： 如果只是要確認元素是否在清單中，使用 if x in list 比 if list.count(x) > 0 快非常多，因為 in 只要找到第一個就會停止。
Nested List (巢狀列表)： count() 只會進行「淺層比對」。如果列表中包含另一個列表，它不會進去子列表裡面數數。
效能注意： 在一個大型迴圈中重複對同一個長列表呼叫 list.count() 會導致效能急劇下降，此時應優先考慮 Counter。

5. 實戰技巧：條件計數

如果你想統計符合某種邏輯（例如長度大於 3 的字串）的元素個數，可以結合 sum()：

words = ['hi', 'hello', 'python', 'a', 'code']

# 統計長度 > 3 的單字數量
big_word_count = sum(1 for w in words if len(w) > 3)
print(big_word_count) # 輸出: 3

合併二維清單

需求說明

兩個二維清單，每個元素為 [key, value]。
以第一個元素 (key) 對應。
若 key 相同，則將兩邊的第二個元素合併為第二與第三欄。
順序不一定相同。

範例程式


list1 = [
    ["a", 1],
    ["b", 2],
    ["c", 3]
]

list2 = [
    ["c", 30],
    ["a", 10],
    ["d", 40]
]

# 將 list1 轉成 dict
dict1 = {k: v for k, v in list1}
dict2 = {k: v for k, v in list2}

# 找出所有的 key
all_keys = sorted(set(dict1.keys()) | set(dict2.keys()))

# 合併結果
merged = []
for k in all_keys:
    v1 = dict1.get(k)
    v2 = dict2.get(k)
    merged.append([k, v1, v2])

for row in merged:
    print(row)

輸出結果


['a', 1, 10]
['b', 2, None]
['c', 3, 30]
['d', None, 40]

結論

以字典快速比對 key。
不存在的值用 None 填補。
結果為三欄結構：[key, value1, value2]。

同時迴圈兩個list

在 Python 中，若您有兩個列表（例如 selected_fields_list 和 aSqlValuesStr_list），並需要同時遍歷它們，最常用且最 Pythonic 的方法是使用內建的 zip() 函式。

1. 使用 zip() 函式

zip() 函式會將多個可迭代對象（Iterable）打包成一個元組 (tuple) 的序列。每次迴圈迭代都會從每個列表中取出對應位置的元素。

import re

# 假設這是您 re.split() 之後得到的兩個列表
selected_fields = "name,age,city"
aSqlValuesStr = "Alice,25,Taipei"

selected_fields_list = re.split(r',', selected_fields)
aSqlValuesStr_list = re.split(r',', aSqlValuesStr)

# 執行 for 迴圈
for field, value in zip(selected_fields_list, aSqlValuesStr_list):
    print(f"欄位: {field}, 值: {value}")

2. 範例輸出

欄位: name, 值: Alice
欄位: age, 值: 25
欄位: city, 值: Taipei

3. zip() 的重要注意事項

當您使用 zip() 函式時，需要注意以下幾點：

列表長度不一致： zip() 會以最短的列表為準停止迭代。如果 selected_fields_list 有 3 個元素，而 aSqlValuesStr_list 有 4 個元素，迴圈只會執行 3 次。
需要處理長度不一致： 如果您需要確保兩個列表的長度完全匹配，或需要以較長的列表為準，則應使用 itertools.zip_longest。

# 範例：列表長度不一致
list1 = [1, 2, 3]
list2 = ['a', 'b']

for item1, item2 in zip(list1, list2):
    print(item1, item2)
# 輸出只會有:
# 1 a
# 2 b

對齊顯示二維陣列

使用 format 對齊欄位


data = [
    [1, 23, 456],
    [7890, 12, 3],
    [45, 678, 9]
]

# 計算每一欄的最大寬度
col_widths = [max(len(str(row[i])) for row in data) for i in range(len(data[0]))]

# 格式化輸出
for row in data:
    print("  ".join(str(val).rjust(col_widths[i]) for i, val in enumerate(row)))

輸出結果


   1   23  456
7890   12    3
  45  678    9

使用 tabulate 模組

第三方套件 tabulate 可直接輸出對齊的表格。


from tabulate import tabulate

data = [
    [1, 23, 456],
    [7890, 12, 3],
    [45, 678, 9]
]

print(tabulate(data, tablefmt="grid"))

輸出結果


+------+-----+-----+
|    1 |  23 | 456 |
| 7890 |  12 |   3 |
|   45 | 678 |   9 |
+------+-----+-----+

結論

內建方法：先計算欄寬，再用 rjust() 對齊。
外部套件：使用 tabulate 可快速產生漂亮表格。

二維陣列浮點數對齊輸出

說明

以下範例示範如何印出二維清單，當元素為 float 時固定顯示兩位小數，其餘元素照原樣輸出，同時保持欄位對齊。

程式範例


data = [
    [1, 23.456, 456],
    [7890.1, 12, 3.5],
    [45, 678.9, 9]
]

# 格式化每個元素字串
formatted_data = []
for row in data:
    new_row = []
    for val in row:
        if isinstance(val, float):
            s = f"{val:.2f}"   # float -> 兩位小數
        else:
            s = str(val)
        new_row.append(s)
    formatted_data.append(new_row)

# 計算每一欄最大寬度
col_widths = [max(len(row[i]) for row in formatted_data) for i in range(len(formatted_data[0]))]

# 格式化輸出
for row in formatted_data:
    print("  ".join(val.rjust(col_widths[i]) for i, val in enumerate(row)))

輸出結果


    1  23.46  456
7890.10     12  3.50
   45  678.90     9

重點

使用 isinstance(val, float) 判斷浮點數。
透過 f"{val:.2f}" 將浮點數格式化為兩位小數。
先將所有元素轉為字串後，再計算欄寬，確保欄位對齊。

從字典列表中提取所有值

您提供的資料結構是一個包含多個字典的列表，其中每個字典都代表一條時間序列記錄（例如 K 線資料）。

data = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'},
    # ...
]

如果您想要獲取所有記錄中的所有值（1759028400000, '109398.3', '109364.8' 等），並將它們收集在一個列表中，您可以使用巢狀的列表推導式（Nested List Comprehension）。

1. 提取所有值到單一列表 (扁平化處理)

使用兩層列表推導式來遍歷列表中的每一個字典，然後對每個字典調用 .values() 方法獲取值，最後將所有值收集到一個扁平的列表中。

data = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'}
]

all_values = [
    value 
    for record in data     # 遍歷外部列表中的每一個字典 record
    for value in record.values() # 遍歷字典 record 中的所有值
]

print(all_values)

2. 輸出結果

這會得到一個包含所有數值的單一列表：

[1759028400000, '109398.3', '109364.8', '109489.2', '109364.8', '518.7594', 1759024800000, '109305.6', '109398.3', '109496.4', '109296.0', '757.0290']

3. 提取特定欄位的值

如果您只需要提取特定的欄位（例如只需要所有的 open 價格），可以使用單層列表推導式：

data = [
    {'time': 1759028400000, 'open': '109398.3', ...},
    {'time': 1759024800000, 'open': '109305.6', ...}
]

open_prices = [record['open'] for record in data]

print(open_prices)

輸出結果：

['109398.3', '109305.6']

從字典列表中提取特定鍵的值

1. 使用列表推導式 (List Comprehension) (推薦) ✅

列表推導式是一種簡潔的單行語法，用於從現有列表創建新列表。

Python 實作範例

from datetime import datetime

data_list = [
    {'videoid': 'b5HxsaM_E2Y', 'publishedat': datetime(2025, 12, 7, 3, 0, 53), 'rankno': 7, 'viewcount': 913053, 'query': '棒球'}, 
    {'videoid': 'FEbMCBxsoWI', 'publishedat': datetime(2025, 11, 25, 5, 28, 6), 'rankno': 13, 'viewcount': 754598, 'query': '棒球'}, 
    {'videoid': 'nOJUI0PGB68', 'publishedat': datetime(2025, 12, 7, 3, 7, 46), 'rankno': 14, 'viewcount': 748349, 'query': '棒球'}, 
    {'videoid': 'uMHXIudw_w0', 'publishedat': datetime(2025, 12, 2, 10, 1, 38), 'rankno': 8, 'viewcount': 687949, 'query': '棒球'}
]

target_key = 'videoid'

# 使用列表推導式：對於 data_list 中的每個字典 item，取出 item[target_key]
video_ids = [item[target_key] for item in data_list]

print(f"提取的鍵: {target_key}")
print("所有 videoid 的值:")
print(video_ids)

輸出結果

['b5HxsaM_E2Y', 'FEbMCBxsoWI', 'nOJUI0PGB68', 'uMHXIudw_w0']

2. 處理鍵可能不存在的情況 (安全存取)

如果列表中某些字典可能缺少目標鍵（例如某些字典沒有 `videoid` 鍵），直接使用 `item[target_key]` 會拋出 `KeyError` 錯誤。您可以使用字典的 `.get()` 方法或條件判斷來安全處理。

Python 實作範例 (安全存取)

data_with_missing_key = [
    {'videoid': 'A1', 'query': '足球'}, 
    {'query': '籃球'}, # 缺少 'videoid' 鍵
    {'videoid': 'C3', 'query': '排球'}
]

target_key = 'videoid'

# 方案 A: 使用 .get() 設置預設值 None（或任何其他值）
safe_video_ids_A = [item.get(target_key) for item in data_with_missing_key]
# 輸出: ['A1', None, 'C3']

# 方案 B: 僅提取具有該鍵的值
safe_video_ids_B = [item[target_key] for item in data_with_missing_key if target_key in item]
# 輸出: ['A1', 'C3']

print(f"\n安全提取結果 (方案 B): {safe_video_ids_B}")

將 dict values 轉換為列表

您從 onesymbollist.values() 獲得的結果是 Python 字典的視圖物件 dict_values。雖然它看起來像一個列表，但它是一個**動態的視圖**，並不是一個可供索引或修改的標準列表（List）。

dict_values([1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523'])

要在不顯示 dict_values() 標籤的情況下獲取其內容，最簡單且最常見的方法是使用內建的 list() 函式將其強制轉換為列表。

1. 轉換為列表 (list)

將 dict_values 傳遞給 list() 函式，會立即將該視圖物件中的所有元素複製到一個新的標準列表中。

# 假設這是您獲得的 dict_values 視圖物件
dict_values_object = your_dictionary.values() # 假設 onesymbollist 是一個字典

# 步驟：使用 list() 函式轉換
result_list = list(dict_values_object)

print(result_list)

輸出結果

[1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523']

2. 轉換為元組 (tuple)

如果您的目標是創建一個不可變（immutable）的序列，您可以使用 tuple() 函式將其轉換為元組。

result_tuple = tuple(dict_values_object)

print(result_tuple)

輸出結果

(1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523')

3. 直接迭代 (不需轉換)

請注意，如果您只是想在迴圈中逐一處理這些值，您不需要將其明確轉換為列表。dict_values 本身就是一個可迭代對象（Iterable）。

# 假設這是您獲得的 dict_values 視圖物件
dict_values_object = your_dictionary.values()

print("逐一輸出元素:")
for value in dict_values_object:
    print(value)

總結來說，使用 list(your_dict.values()) 是獲取乾淨、可操作值列表的最常用方法。

將字典值轉換為逗號分隔的字串

要從 dict_values 視圖物件中提取所有的值，並將它們組合成一個不含外部括號、只用逗號和空格分隔的單一字串（例如：1763510400000, '0.00015218', ...），您需要結合以下步驟：

從字典中取得 dict_values 視圖物件。
將這個視圖物件中的所有元素轉換為字串型態。
使用 Python 的 ", ".join() 方法將這些字串連接起來。

1. Python 實作

假設您的原始字典名為 onesymbol_dict，並且您需要將非字串型的值（例如時間戳）轉換為字串，才能用 .join() 進行連接。

onesymbol_dict = {
    'time': 1763510400000, 
    'open': '0.00015218', 
    'close': '0.00015336', 
    'high': '0.00015415', 
    'low': '0.00015067', 
    'volume': '1634523'
}

# 步驟 1 & 2: 獲取值並將所有值轉換為字串
# 使用列表推導式確保所有元素都是字串
values_as_strings = [str(v) for v in onesymbol_dict.values()]

# 步驟 3: 使用 ', '.join() 連接這些字串
values_string = ", ".join(values_as_strings)

print(values_string)

2. 輸出結果

這將產生一個單一的字串，其內容僅為值，沒有任何外部括號或 dict_values 標籤：

1763510400000, 0.00015218, 0.00015336, 0.00015415, 0.00015067, 1634523

3. 關於字串引號的說明

請注意，在您期望的輸出範例中，除了時間戳以外的值都有單引號：1763510400000, '0.00015218', ...。

如果您的目標是要讓字串類型的數值在最終輸出中保留單引號，您需要在連接時手動加上引號。這通常在為 SQL 語句或特定格式準備字串時需要。

# 額外步驟：手動處理引號，假設非整數值需要引號
quoted_values = []
for v in onesymbol_dict.values():
    if isinstance(v, (str, float)) or (isinstance(v, int) and v < 1000000000000): # 假設小數字串需要引號
        quoted_values.append(f"'{v}'")
    else:
        quoted_values.append(str(v))

final_quoted_string = ", ".join(quoted_values)

print(final_quoted_string)

這樣會得到您預期的格式（假設 time 不需要引號，其他數值字串需要）：

1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523'

判斷字串是否為數字

使用 str.isdigit()

isdigit() 方法可以用於檢查字串是否只包含數字字符。

# 示例
string = "12345"
if string.isdigit():
    print("是數字")
else:
    print("不是數字")

注意：isdigit() 無法處理小數點或負號。

使用 str.replace() 處理小數

如果需要檢查帶有小數點的字串，可以先移除小數點再使用 isdigit()。

# 示例
string = "123.45"
if string.replace(".", "").isdigit():
    print("是數字")
else:
    print("不是數字")

此方法不適用於負數。

使用 try-except 轉換為數字

最通用的方法是嘗試將字串轉換為浮點數或整數，並捕捉轉換失敗的異常。

# 示例
string = "-123.45"
try:
    float(string)  # 可以改用 int(string) 來檢查整數
    print("是數字")
except ValueError:
    print("不是數字")

使用正則表達式

正則表達式可以精確匹配數字，包括整數、小數與負數。

# 示例
import re

string = "-123.45"
pattern = r"^-?\d+(\.\d+)?$"
if re.match(pattern, string):
    print("是數字")
else:
    print("不是數字")

結論

對於簡單情況，可使用 isdigit()。對於更複雜的情況（如處理小數或負數），建議使用 try-except 或正則表達式。

Python f-string

f-string（格式化字串文字）是 Python 3.6 引入的一種強大且高效的字串格式化方法。它提供了一種簡潔、可讀性高的方式，將變數、表達式的值嵌入到字串中。

f-string 的核心特點是：在字串開頭使用前綴 f 或 F，並使用大括號 {} 來包含要計算和顯示的內容。

1. 基本用法：嵌入變數

您可以直接將任何變數名稱放在大括號內。

name = "Alice"
age = 30
message = f"Hello, my name is {name} and I am {age} years old."
# 輸出: Hello, my name is Alice and I am 30 years old.

2. 嵌入表達式

f-string 的強大之處在於，您可以在大括號內放置任何有效的 Python 表達式，它會在運行時被求值。

price = 19.99
tax_rate = 0.05
total = price * (1 + tax_rate)

# 在 f-string 內執行計算
result = f"含稅總價為: {price * (1 + tax_rate):.2f} 元。"
# 輸出: 含稅總價為: 20.99 元。

# 呼叫函式
def get_status():
    return "OK"

status_msg = f"系統狀態: {get_status()}"
# 輸出: 系統狀態: OK

3. 字串格式化與對齊

f-string 支援與 .format() 方法相同的格式規範迷你語言（Format Specifier Mini-Language），使用冒號 : 來分隔表達式和格式說明符。

格式碼	用途	範例	輸出
`:.2f`	浮點數小數點後兩位	`f"{3.14159:.2f}"`	`3.14`
`: <10`	靠左對齊，寬度 10	`f"{'Name':<10}"`	`Name`
`: >10`	靠右對齊，寬度 10	`f"{'Value':>10}"`	`Value`
`:^10`	置中對齊，寬度 10	`f"{'Hi':^10}"`	`Hi`
`:,`	數字千位分隔符	`f"{1000000:,}"`	`1,000,000`

4. 偵錯功能 (Debug F-strings)

從 Python 3.8 開始，f-string 引入了一個方便的偵錯功能，可以在變數後加上等號 =，自動顯示變數名稱及其值。

user_id = 42
is_active = True

debug_output = f"User ID is {user_id=}, Status: {is_active=}"
# 輸出: User ID is user_id=42, Status: is_active=True

5. 注意事項

引號：f-string 內的表達式可以使用與外部字串不同的引號類型。如果外部使用單引號 '...'，內部可以使用雙引號 "..."，反之亦然。
大括號：如果您需要在 f-string 內顯示字面值的大括號，請使用雙大括號 {{}}。
反斜線：f-string 內的反斜線 \ 不允許用於表示字串格式，例如 f"{{'\n'}}" 會導致錯誤。

f-string 不顯示浮點數小數點

1. 方案一：在 f-string 內進行整數轉換 (推薦)

在 f-string 的大括號 {} 內部，您可以直接使用 int() 函式將變數轉換回整數類型。這是最清晰且最直接的方法。

Python 實作範例

inta = 12 # 假設原始整數
float_a = inta * 2.0 # 結果是 24.0 (浮點數)

# 直接在 f-string 中將浮點數轉換回整數
result_str = f"abc def {int(float_a)}"

print(f"原始值 (float_a): {float_a}")
print(f"格式化結果: {result_str}")

2. 方案二：使用 f-string 格式化說明符 (Format Specifier)

您可以使用格式化迷你語言中的整數格式碼 d 或 .0f 來控制輸出格式。

A. 使用整數格式碼 `:d`

使用 :d 會要求 Python 在顯示時將該值視為整數。如果變數 a 是浮點數，Python 會自動將其四捨五入到最接近的整數後再顯示（如果您的計算結果是 $24.0$，它會顯示 $24$）。

float_a = 24.0
result_d = f"abc def {float_a:d}" 
# 輸出: abc def 24

B. 使用浮點數格式碼 `:.0f`

使用 :.0f 意味著將該值格式化為浮點數，但要求小數點後顯示 0 位數字。這也會導致結果被四捨五入後顯示。

float_a = 24.0
result_0f = f"abc def {float_a:.0f}"
# 輸出: abc def 24

總結與建議

如果您的目的是確保結果是一個絕對的整數且不帶小數點，推薦使用方案一：

str = f"abc def {int(a)}"

Python re.split 函式

在 Python 中，re.split() 函式是 re（正規表達式）模組中的一個強大工具，用於根據正規表達式中定義的分隔符號（模式）來切割字串，並將結果返回為一個列表（list）。

1. 函式語法

re.split(pattern, string, maxsplit=0, flags=0)

pattern：用於切割字串的正規表達式模式。
string：要被切割的目標字串。
maxsplit (可選)：指定最大切割次數。預設值 0 表示不限制切割次數。
flags (可選)：控制正規表達式行為的旗標（如 re.IGNORECASE）。

2. 基本用法

使用正規表達式來定義多個或複雜的分隔符號。

import re

text = "apple,banana;orange-grape"
# 使用逗號、分號或連字號作為分隔符號
result = re.split(r'[;,-]', text)

print(result)
# 輸出: ['apple', 'banana', 'orange', 'grape']

3. 處理多個空格 (一個常見用途)

與標準字串的 split() 不同，re.split() 可以輕鬆處理多個連續的分隔符號（例如多個空格），並忽略它們。

text = "Word1   Word2  Word3"
# 使用 \s+ 匹配一個或多個空白字元作為分隔符號
result = re.split(r'\s+', text)

print(result)
# 輸出: ['Word1', 'Word2', 'Word3']

4. 使用 maxsplit 限制切割次數

如果設定了 maxsplit，切割操作只會執行指定的次數，剩下的部分會作為最後一個元素保留在列表中。

text = "one:two:three:four"
# 只切割一次
result = re.split(r':', text, maxsplit=1)

print(result)
# 輸出: ['one', 'two:three:four']

5. 保留分隔符號

如果將分隔符號模式放置在括號 () 中，則分隔符號本身也會包含在結果列表的元素之間。

text = "2025-01-15"
# 將連字號放在括號中，使其被保留
result = re.split(r'(-)', text)

print(result)
# 輸出: ['2025', '-', '01', '-', '15']

判斷字串開頭 startswith

用途

startswith() 是 Python 字串（str）物件的方法，用來判斷字串是否以指定的子字串開頭。若符合，回傳 True；否則回傳 False。

語法


str.startswith(prefix[, start[, end]])

參數說明

prefix：要比對的開頭字串，可以是單一字串，也可以是字串的 tuple。
start（可選）：指定從原字串哪個索引位置開始判斷。
end（可選）：指定到哪個索引位置（不含 end）為止。

回傳值

布林值：若字串以指定字首開頭，回傳 True，否則 False。

範例


text = "Python Programming"

# 基本用法
print(text.startswith("Py"))        # True
print(text.startswith("Java"))      # False

# 指定範圍
print(text.startswith("thon", 2))   # True (從索引 2 開始是 "thon")

# 多重比對
print(text.startswith(("Py", "Java", "C")))  # True，因為有任一符合

# 不區分大小寫（可先轉小寫）
print(text.lower().startswith("py"))  # True

常見應用

檔名或網址判斷：


url = "https://openai.com"
if url.startswith("https://"):
    print("安全的連線網址")

過濾清單：


files = ["data1.csv", "data2.csv", "readme.txt"]
csv_files = [f for f in files if f.startswith("data")]
print(csv_files)  # ['data1.csv', 'data2.csv']

延伸

若要判斷字串是否以某段文字「結尾」，可使用 endswith() 方法，語法與 startswith() 相同。


filename = "report.pdf"
if filename.endswith(".pdf"):
    print("這是 PDF 檔案")

刪除字串最後一字元

說明

在 Python 中，字串是不可變（immutable）物件，若要刪除最後一個字元，通常使用字串切片（slicing）建立新的字串。

範例


text = "Hello!"

# 方法一：使用切片
new_text = text[:-1]
print(new_text)   # 輸出: Hello

# 方法二：使用 rstrip() 移除特定結尾字元
text2 = "Hello!!!"
new_text2 = text2.rstrip("!")
print(new_text2)  # 輸出: Hello

# 方法三：確保非空再刪除最後一字元
if text:
    text = text[:-1]
print(text)

輸出結果


Hello
Hello
Hello

說明

text[:-1] 會取出從開頭到倒數第二個字元的子字串。
rstrip(chars) 可移除結尾指定的字元（不限一個）。
在進行切片前可檢查字串是否為空，避免取值錯誤。

延伸

若要刪除開頭字元，可使用：


text = text[1:]

總結

刪除最後一字元最簡單的方法是 s[:-1]。
若要移除特定結尾字元，建議使用 rstrip()。

字串中找到子字串之前的內容

問題說明

給定一個字串 str1，我們希望找到在 strA 或 strB 出現之前的部分。例如：

str1 = "Hello World, this is a test. Stop here or continue."
strA = "Stop"
strB = "continue"

目標是獲取 "Hello World, this is a test. "。

使用 re.split()

re.split() 可以根據多個關鍵字拆分字串，並取第一部分：

import re

def get_substring_before(text, strA, strB):
    result = re.split(f"{re.escape(strA)}|{re.escape(strB)}", text, maxsplit=1)[0]
    return result

str1 = "Hello World, this is a test. Stop here or continue."
strA = "Stop"
strB = "continue"

print(get_substring_before(str1, strA, strB))  # "Hello World, this is a test. "

使用 re.search()

re.search() 可以用來匹配 strA 或 strB，並取得匹配前的內容：

import re

def get_substring_before(text, strA, strB):
    match = re.search(f"{re.escape(strA)}|{re.escape(strB)}", text)
    return text[:match.start()] if match else text

str1 = "Hello World, this is a test. Stop here or continue."
print(get_substring_before(str1, "Stop", "continue"))  # "Hello World, this is a test. "

使用 find() 方法

find() 方法可以手動搜尋最早出現的 strA 或 strB，然後擷取對應部分：

def get_substring_before(text, strA, strB):
    indexA = text.find(strA)
    indexB = text.find(strB)
    
    indices = [i for i in [indexA, indexB] if i != -1]
    first_index = min(indices, default=len(text))
    
    return text[:first_index]

str1 = "Hello World, this is a test. Stop here or continue."
print(get_substring_before(str1, "Stop", "continue"))  # "Hello World, this is a test. "

結論

使用 re.split() 最簡單，適合單次查找。
使用 re.search() 提供更靈活的正則匹配。
使用 find() 方法最有效率，適用於簡單的字串處理。

多個值串接成字串

用 join（需先全部轉成字串）

values = ["str1", "str2", 123, "str3", 456]

s = ", ".join(str(v) for v in values)
print(s)  # 輸出: str1, str2, 123, str3, 456

自動處理字串與整數混合

def join_values(*args, sep=", "):
    return sep.join(str(v) for v in args)

print(join_values("str1", "str2", 88, "str3"))
# 輸出: str1, str2, 88, str3

若來源是 dict，依 key 排序後串接

data = {
    "str1": "hello",
    "str2": "world",
    "int1": 123,
    "str3": "ok"
}

# 按 key 排序後 join
s = ", ".join(str(data[k]) for k in sorted(data.keys()))
print(s)  # hello, world, 123, ok

若要 key + value 一起 join

s = ", ".join(f"{k}={v}" for k, v in data.items())
print(s)
# 輸出: str1=hello, str2=world, int1=123, str3=ok

來源是 list of dict，每個 dict join 成一列

rows = [
    {"str1": "A", "int1": 10},
    {"str1": "B", "int1": 20},
]

for row in rows:
    print(", ".join(str(v) for v in row.values()))
# A, 10
# B, 20

通用函式：可切換「有引號」或「無引號」模式

def join_values(values, sep=", ", quoted=False):
    if quoted:
        # 使用全形單引號 ‘ ’
        return sep.join(f"‘{v}’" for v in values)
    else:
        return sep.join(str(v) for v in values)

values = ["str1", "str2", 88, "str3"]

print(join_values(values, quoted=False))
# 輸出: str1, str2, 88, str3

print(join_values(values, quoted=True))
# 輸出: ‘str1’, ‘str2’, ‘88’, ‘str3’

可支援 *args 輸入版本

def join_args(*args, sep=", ", quoted=False):
    if quoted:
        return sep.join(f"‘{v}’" for v in args)
    return sep.join(str(v) for v in args)

print(join_args("str1", "str2", 88, "str3", quoted=True))
# ‘str1’, ‘str2’, ‘88’, ‘str3’

支援 dict（只輸出 value）

data = {"str1": "hello", "str2": "world", "int1": 123}

print(join_values(data.values(), quoted=True))
# ‘hello’, ‘world’, ‘123’

支援 key=value 格式

def join_key_value(d, sep=", ", quoted=False):
    if quoted:
        return sep.join(f"{k}=‘{v}’" for k, v in d.items())
    return sep.join(f"{k}={v}" for k, v in d.items())

print(join_key_value(data, quoted=True))
# str1=‘hello’, str2=‘world’, int1=‘123’

re.match()

Python 的 re.match 是正則表達式模組中的一個函式，用於從字串的開頭進行匹配。如果匹配成功，則返回一個 Match 物件；否則返回 None。

語法

re.match(pattern, string, flags=0)

參數說明：

pattern：要匹配的正則表達式。
string：要被檢查的字串。
flags：可選參數，用於修改匹配行為，例如 re.IGNORECASE。

常用屬性和方法

group(n)：返回第 n 個捕獲的子組，n=0 返回整個匹配。
start()：返回匹配的起始位置。
end()：返回匹配的結束位置。
span()：返回匹配的範圍 (起始, 結束)。

使用範例

import re

# 定義一個字串
text = "123 Hello World!"

# 使用 re.match 從開頭匹配數字
match = re.match(r"(\d+)\s+(.*)", text)

if match:
    print(f"整個匹配結果: {match.group(0)}")  # 123 Hello World!
    print(f"數字部分: {match.group(1)}")      # 123
    print(f"文字部分: {match.group(2)}")      # Hello World!
else:
    print("匹配失敗")

輸出結果


整個匹配結果: 123 Hello World!
數字部分: 123
文字部分: Hello World!

注意事項

re.match 只從字串開頭進行匹配，若開頭不符合，則返回 None。
如果需要全局搜索，請使用 re.search 或 re.findall。

正則表達式

正則表達式（Regular Expression，簡稱 Regex）是一種用於描述字串匹配規則的語法，常用於搜尋、替換或驗證字串。在 Python 的 re 模組中，pattern 就是定義這些規則的核心部分。

基本語法元素

字元類別：
- \d：匹配任何數字（0-9）。
- \D：匹配任何非數字。
- \w：匹配任何單字字元（字母、數字、底線）。
- \W：匹配任何非單字字元。
- \s：匹配任何空白字元（空格、Tab 等）。
- \S：匹配任何非空白字元。
- .：匹配除換行符（\n）以外的任何單個字元。
量詞：
- *：匹配前一個表達式 0 次或多次。
- +：匹配前一個表達式 1 次或多次。
- ?：匹配前一個表達式 0 次或 1 次。
- {n}：匹配前一個表達式剛好 n 次。
- {n,}：匹配前一個表達式至少 n 次。
- {n,m}：匹配前一個表達式至少 n 次，但不超過 m 次。
邊界符號：
- ^：匹配字串的開頭。
- $：匹配字串的結尾。
- \b：匹配單字邊界（如單詞的開頭或結尾）。
- \B：匹配非單字邊界。
分組與選擇：
- (...)：分組，捕獲括號內的內容。
- |：邏輯「或」，如 a|b 匹配 a 或 b。
- (?:...)：分組但不捕獲內容。

進階用法

環視（Lookahead 和 Lookbehind）：
- (?=...)：正向環視，匹配後面必須是指定內容。
- (?!...)：負向環視，匹配後面不能是指定內容。
- (?<=...)：正向回顧，匹配前面必須是指定內容。
- (?<!...)：負向回顧，匹配前面不能是指定內容。

範例

import re

# 例子 1：匹配數字開頭的內容
pattern = r"^\d+"
text = "123abc"
match = re.match(pattern, text)
if match:
    print(f"匹配結果: {match.group()}")  # 輸出: 123

# 例子 2：匹配數字後的文字
pattern = r"(\d+)\s+(.*)"
text = "123 Hello World"
match = re.match(pattern, text)
if match:
    print(f"數字部分: {match.group(1)}")  # 輸出: 123
    print(f"文字部分: {match.group(2)}")  # 輸出: Hello World

正則表達式的應用場景

驗證電子郵件地址或電話號碼格式。
從文字中提取特定資料，如日期或 URL。
批量替換文字，如將標點符號替換為空格。

re.search() 的應用

基本用法

re.search() 用於在字串中搜尋符合正則表達式的第一個匹配項，並回傳 Match 物件，如果沒有匹配則回傳 None。

import re

text = "Hello 2024!"
match = re.search(r"\d+", text)

if match:
    print("找到數字:", match.group())  # 2024

返回 Match 物件

當 re.search() 找到匹配時，會返回 Match 物件，可透過以下方法存取資訊：

group()：回傳匹配的字串
start()：匹配的起始索引
end()：匹配的結束索引
span()：返回 (start, end) 索引範圍

import re

text = "Python 3.10 is great!"
match = re.search(r"\d+\.\d+", text)

if match:
    print("匹配內容:", match.group())  # 3.10
    print("起始索引:", match.start())  # 7
    print("結束索引:", match.end())    # 11
    print("範圍:", match.span())       # (7, 11)

使用群組匹配

透過括號 () 來建立群組，並使用 group(n) 來提取對應的匹配內容。

import re

text = "John Doe, Age: 25"
match = re.search(r"(\w+) (\w+), Age: (\d+)", text)

if match:
    print("姓氏:", match.group(1))  # John
    print("名字:", match.group(2))  # Doe
    print("年齡:", match.group(3))  # 25

與 re.findall() 的比較

re.search() 只回傳第一個匹配的結果，而 re.findall() 會回傳所有匹配結果。

import re

text = "Price: $10, Discount: $2, Tax: $1"

match = re.search(r"\$\d+", text)
print("re.search:", match.group())  # $10

matches = re.findall(r"\$\d+", text)
print("re.findall:", matches)  # ['$10', '$2', '$1']

結論

re.search() 適合用來找到第一個匹配的結果，並能透過 Match 物件獲取詳細資訊。對於多個匹配結果，則可使用 re.findall()。

正則表達式的非捕獲群組

提高匹配效能

在正則表達式中，(...) 會捕獲匹配內容，並存入 group(n)，但非捕獲群組 (?:...) 只用來組織結構，不會影響群組編號，因此匹配速度更快。

避免影響群組索引

如果在正則表達式中使用 () 來組織匹配條件，會影響 group(n) 的編號。使用 (?:...) 則可確保群組索引不變。

import re

text = "2024-03-12"
pattern = r"(\d{4})-(?:\d{2})-(\d{2})"

match = re.search(pattern, text)
print(match.group(1))  # 2024
print(match.group(2))  # 12

搭配 OR 運算符

使用 (?:...|...) 可以讓 | 運算符影響匹配內容，但不影響群組存取。

import re

text = "bar123"
pattern = r"(?:foo|bar|baz)\d+"

match = re.search(pattern, text)
print(match.group())  # bar123

應用於 --user-data-dir 解析

在解析 Chrome 參數時，使用 (?:...) 可確保匹配格式不影響群組編號。

import re

cmdline = '--user-data-dir="C:\\Users\\moirg\\AppData\\Local\\Google\\Chrome\\User Data"'

match = re.search(r'--user-data-dir=(?:"([^"]+)"|(\S+))', cmdline)
user_data_dir = match.group(1) or match.group(2)

print(user_data_dir)  # C:\Users\moirg\AppData\Local\Google\Chrome\User Data

結論

(?:...) 在正則表達式中能提高效能，避免影響群組索引，並適用於 | 運算及特定條件匹配，使程式碼更高效且清晰。

Python 的 datetime

匯入模組

import datetime

取得現在時間

now = datetime.datetime.now()
print(now)

建立指定時間

dt = datetime.datetime(2025, 7, 2, 14, 30, 0)
print(dt)

格式化時間字串

now = datetime.datetime.now()
formatted = now.strftime("%Y-%m-%d %H:%M:%S")
print(formatted)

解析時間字串

dt_str = "2025-07-02 14:30:00"
parsed = datetime.datetime.strptime(dt_str, "%Y-%m-%d %H:%M:%S")
print(parsed)

時間加減

now = datetime.datetime.now()
delta = datetime.timedelta(days=7)
next_week = now + delta
print(next_week)

取得今天日期

today = datetime.date.today()
print(today)

比較日期

dt1 = datetime.datetime(2025, 7, 1)
dt2 = datetime.datetime(2025, 7, 2)
print(dt1 < dt2)

取得時間差

dt1 = datetime.datetime(2025, 7, 1, 12, 0, 0)
dt2 = datetime.datetime(2025, 7, 2, 14, 30, 0)
diff = dt2 - dt1
print(diff)
print(diff.total_seconds())

取得星期幾

today = datetime.date.today()
print(today.weekday())  # 0 = 星期一, 6 = 星期日

datetime 時區問題

offset-naive 與 offset-aware datetime 相減錯誤

當一個 datetime 物件沒有時區（naive），另一個有時區（aware）時進行相減，就會產生：

TypeError: can't subtract offset-naive and offset-aware datetimes

檢查 datetime 是否為 naive 或 aware

from datetime import datetime

def is_aware(dt):
    return dt.tzinfo is not None and dt.tzinfo.utcoffset(dt) is not None

def is_naive(dt):
    return not is_aware(dt)

dt1 = datetime.now()                 # naive
dt2 = datetime.now().astimezone()    # aware

print(is_naive(dt1), is_aware(dt1))
print(is_naive(dt2), is_aware(dt2))

解決方式 A：統一轉成 aware（推薦）

適用於跨時區或需要精準時間計算的情況。

from datetime import datetime, timezone

sql_dt = sql_dt.replace(tzinfo=timezone.utc)     # SQL 資料轉 aware
now_dt = datetime.now(timezone.utc)              # 現在時間用 aware

diff = now_dt - sql_dt
print(diff.total_seconds())

解決方式 B：統一轉成 naive（不推薦，會忽略時區差）

sql_dt = sql_dt.replace(tzinfo=None)
now_dt = datetime.now()

diff = now_dt - sql_dt

總結

兩個 datetime 必須同為 naive 或同為 aware 才能相減。
建議全部轉為 UTC aware，避免時區錯誤。

計算串列的標準差

說明

在 Python 中，可以用內建模組 statistics 的 stdev() 或 pstdev() 計算樣本標準差或母體標準差。

範例


import statistics

ratios = [2.3, 2.8, 3.1, 2.5, 3.0]

# 平均值
average = sum(ratios) / len(ratios)

# 樣本標準差（n-1）
std_sample = statistics.stdev(ratios)

# 母體標準差（n）
std_population = statistics.pstdev(ratios)

print(f"平均值: {average:.2f}")
print(f"樣本標準差: {std_sample:.3f}")
print(f"母體標準差: {std_population:.3f}")

輸出結果


平均值: 2.74
樣本標準差: 0.303
母體標準差: 0.271

公式方式（不使用模組）

若不想依賴 statistics 模組，可以用數學公式自行計算：


ratios = [2.3, 2.8, 3.1, 2.5, 3.0]
average = sum(ratios) / len(ratios)

# 標準差（母體）
variance = sum((x - average) ** 2 for x in ratios) / len(ratios)
std_dev = variance ** 0.5

print(f"標準差: {std_dev:.3f}")

輸出結果


標準差: 0.271

差異說明

statistics.stdev()：樣本標準差（除以 n-1）
statistics.pstdev()：母體標準差（除以 n）
若資料是整個母體 → 用 pstdev()
若資料是樣本 → 用 stdev()

總結

平均值：avg = sum(data) / len(data)
樣本標準差：statistics.stdev(data)
母體標準差：statistics.pstdev(data)

Python 顯示 ANSI 顏色字串

基本範例

# ANSI 顏色碼範例
print("\033[31m紅色文字\033[0m")
print("\033[32m綠色文字\033[0m")
print("\033[33m黃色文字\033[0m")
print("\033[34m藍色文字\033[0m")
print("\033[35m紫色文字\033[0m")
print("\033[36m青色文字\033[0m")
print("\033[37m白色文字\033[0m")

粗體與背景色

print("\033[1;31m粗體紅色文字\033[0m")
print("\033[42m綠色背景文字\033[0m")

自訂顏色組合

# 格式: \033[樣式;前景色;背景色m
# 樣式: 0=預設, 1=粗體, 4=底線
# 前景色: 30~37
# 背景色: 40~47

print("\033[1;33;44m粗體黃色字 + 藍色背景\033[0m")

可封裝成函式

def color_text(text, color_code):
    return f"\033[{color_code}m{text}\033[0m"

print(color_text("警告!", "1;31"))  # 粗體紅色
print(color_text("成功!", "1;32"))  # 粗體綠色

檢查目前終端機是否支援 ANSI 顏色

方法一：檢查 sys.stdout.isatty()

import sys

if sys.stdout.isatty():
    print("終端機可能支援 ANSI 顏色")
else:
    print("可能是檔案或不支援顏色的輸出環境")

方法二：使用 colorama（跨平台解決方案）

import colorama
colorama.init()

print("\033[32m這段文字應該會是綠色\033[0m")

方法三：實際測試輸出

def supports_ansi():
    try:
        print("\033[31m測試紅色\033[0m")
        return True
    except:
        return False

print("支援 ANSI" if supports_ansi() else "不支援 ANSI")

補充

Linux / macOS 的終端機通常預設支援 ANSI 顏色。
Windows 10 以前需要安裝額外工具或使用 colorama。
如果輸出被導向檔案，顏色碼會以文字顯示而不是顏色。

Python 輸入支援自動完成

說明

在 Python 中，input() 函式本身並不支援 Tab 自動完成。若要實現這個功能，可以結合 readline 模組，讓使用者在互動式輸入時，使用 Tab 進行自動補全（類似 Bash 或 IPython）。

基本範例


import readline

# 定義可補全的字串清單
WORDS = ['apple', 'banana', 'cherry', 'grape', 'orange', 'watermelon']

def completer(text, state):
    """自動完成函式：根據輸入字首比對可用字串"""
    options = [w for w in WORDS if w.startswith(text)]
    if state < len(options):
        return options[state]
    else:
        return None

# 啟用補全功能
readline.set_completer(completer)
readline.parse_and_bind('tab: complete')

# 使用者輸入（支援 Tab）
user_input = input("輸入水果名稱（可按 Tab 補全）: ")
print(f"你輸入的是: {user_input}")

運作說明

readline.set_completer() 設定自動補全邏輯。
readline.parse_and_bind('tab: complete') 讓 Tab 鍵觸發自動補全。
completer(text, state)：
- text 是目前輸入的文字。
- state 代表第幾個匹配項目（0、1、2...）。
- 若無更多匹配項，回傳 None。

進階：動態補全

你也可以依照目前的上下文或動態內容更新補全清單：


import readline

def dynamic_completer(text, state):
    current_words = ['cat', 'car', 'dog', 'duck', 'deer']
    options = [w for w in current_words if w.startswith(text)]
    if state < len(options):
        return options[state]
    return None

readline.set_completer(dynamic_completer)
readline.parse_and_bind('tab: complete')

command = input("輸入動物名稱: ")
print("你輸入:", command)

注意事項

readline 模組在 Linux / macOS 上預設可用。
在 Windows 上，需安裝套件：
```
pip install pyreadline3
```
這種方式僅在終端機（console）中運作，無法在 GUI 或非互動式環境中使用。

總結

使用 readline 模組可讓 input() 支援 Tab 補全。
可根據輸入內容自訂補全邏輯。
Windows 需額外安裝 pyreadline3 套件。

Python 流程

Python 迴圈

for 搭配 range()

最常見的迴圈，用來跑固定次數或數列。


# 從 0 到 4
for i in range(5):
    print(i)  # 0,1,2,3,4

# 指定起點、終點與步長
for i in range(2, 10, 2):
    print(i)  # 2,4,6,8

for 搭配可迭代物件

直接迭代清單、字串、字典等。


fruits = ["apple", "banana", "cherry"]

for fruit in fruits:
    print(fruit)

for ch in "hello":
    print(ch)

# 迭代字典
person = {"name": "Tom", "age": 25}
for key, value in person.items():
    print(key, value)

while 迴圈

當條件為 True 就會一直執行。


count = 0
while count < 5:
    print(count)
    count += 1

break 與 continue

控制迴圈流程。


for i in range(10):
    if i == 3:
        continue  # 跳過本次
    if i == 7:
        break     # 提前結束
    print(i)

巢狀迴圈

迴圈裡再放迴圈。


for i in range(3):
    for j in range(2):
        print(f"i={i}, j={j}")

迴圈搭配 else

for 或 while 都可以加 else，只有「正常跑完（沒有 break）」才會執行。


for i in range(5):
    print(i)
else:
    print("迴圈正常結束")

列表生成式 (List Comprehension)

簡潔寫法，可以在一行內完成迴圈與生成清單。


squares = [x**2 for x in range(5)]
print(squares)  # [0,1,4,9,16]

結論

for in range()：適合固定次數或數列。
for in 可迭代物件：適合處理清單、字串、字典。
while：適合不確定次數、依條件結束的迴圈。
break / continue / else：控制迴圈流程。
列表生成式：一行快速生成資料。

Python 異常處理

基本語法結構

Python 使用 try...except 語句來攔截並處理程式執行時發生的錯誤，防止程式崩潰。

try:
    # 可能會發生異常的程式碼
    result = 10 / 0
except ZeroDivisionError:
    # 發生特定異常時執行的代碼
    print("除數不能為零")
except Exception as e:
    # 捕捉其他所有類型的異常
    print(f"發生錯誤: {e}")
else:
    # 如果 try 區塊沒有發生異常則執行
    print("運作正常")
finally:
    # 無論是否發生異常都一定會執行
    print("清理資源或關閉檔案")

區塊功能說明

try：放置監控的程式碼片段。
except：定義處理特定錯誤類型的邏輯，可用 as 取得錯誤訊息。
else：選填區塊，當程式碼完全沒出錯時才會運行。
finally：選填區塊，通常用於關閉資料庫連線或檔案，確保資源釋放。

捕捉多個異常

您可以在一個 except 中使用元組（Tuple）來同時處理多個錯誤類型。

try:
    # 執行操作
    pass
except (ValueError, TypeError):
    print("輸入的資料類型或數值有誤")

主動拋出異常

使用 raise 關鍵字可以根據邏輯需求手動觸發異常。

age = -1
if age < 0:
    raise ValueError("年齡數值不可為負數")

最佳實踐

盡量捕捉具體的錯誤類型（如 FileNotFoundError），而非通用的 Exception。
保持 try 區塊內的程式碼簡潔，只放入可能出錯的幾行。
使用 finally 或 with 語句處理檔案讀寫，確保程式異常時檔案仍能正確關閉。

Python 類別

1. 基本類別概念

Python 的類別（Class）是用於封裝數據和行為的結構。類別用於創建物件，物件是類別的實例。例如：

class MyClass:
    def __init__(self, value):
        self.value = value

    def display(self):
        print(f"Value: {self.value}")

obj = MyClass(10)
obj.display()  # 輸出: Value: 10

2. 靜態方法（Static Method）

靜態方法使用 `@staticmethod` 裝飾器定義，與類別和物件無關，不能訪問類別屬性或物件屬性。適用於一些工具性功能：

class MyClass:
    @staticmethod
    def add(a, b):
        return a + b

result = MyClass.add(5, 3)
print(result)  # 輸出: 8

3. 類別方法（Class Method）

類別方法使用 `@classmethod` 裝飾器定義，第一個參數是類別本身（通常命名為 `cls`），可以訪問類別屬性：

class MyClass:
    count = 0

    @classmethod
    def increment_count(cls):
        cls.count += 1

MyClass.increment_count()
print(MyClass.count)  # 輸出: 1

4. 繼承與多型

Python 支援類別繼承，子類可以繼承父類的屬性和方法，並覆寫父類方法：

class Parent:
    def greet(self):
        print("Hello from Parent!")

class Child(Parent):
    def greet(self):
        print("Hello from Child!")

obj = Child()
obj.greet()  # 輸出: Hello from Child!

5. 類別屬性與物件屬性

類別屬性是屬於整個類別的，所有物件共享；物件屬性則屬於每個物件：

class MyClass:
    class_attr = "I am a class attribute"

    def __init__(self, value):
        self.instance_attr = value

obj1 = MyClass(10)
obj2 = MyClass(20)

print(MyClass.class_attr)  # 輸出: I am a class attribute
print(obj1.instance_attr)  # 輸出: 10
print(obj2.instance_attr)  # 輸出: 20

6. 使用 object 作為基類

Python 中的所有類別都默認繼承自 `object`，這是一個內建的基類，提供一些基本方法，例如 `__str__` 和 `__eq__`：

class MyClass(object):
    def __init__(self, value):
        self.value = value

    def __str__(self):
        return f"MyClass with value {self.value}"

obj = MyClass(5)
print(obj)  # 輸出: MyClass with value 5

7. 總結

- **靜態方法（Static Method）**：與類別無關，主要用於工具性功能。 - **類別方法（Class Method）**：操作類別層級的數據。 - **物件方法（Instance Method）**：操作物件層級的數據。 - **繼承與多型**：支援代碼重用與靈活設計。 - **object 基類**：提供基本方法，讓所有類別具備一致的行為。

類別繼承

1. 基本繼承概念

在 Python 中，類別繼承允許子類（Derived Class）繼承父類（Base Class）的屬性和方法，實現代碼重用。例如：

class Parent:
    def greet(self):
        print("Hello from Parent!")

class Child(Parent):
    pass

c = Child()
c.greet()  # 輸出: Hello from Parent!

2. 子類覆寫父類方法

子類可以覆寫（Override）父類的方法，改寫其功能：

class Parent:
    def greet(self):
        print("Hello from Parent!")

class Child(Parent):
    def greet(self):
        print("Hello from Child!")

c = Child()
c.greet()  # 輸出: Hello from Child!

3. 使用 super() 呼叫父類方法

在子類中可以透過 `super()` 呼叫父類的方法，並在父類行為基礎上擴展：

class Parent:
    def greet(self):
        print("Hello from Parent!")

class Child(Parent):
    def greet(self):
        super().greet()
        print("Hello from Child!")

c = Child()
c.greet()
# 輸出:
# Hello from Parent!
# Hello from Child!

4. 多重繼承

Python 支援多重繼承，子類可以同時繼承多個父類：

class Parent1:
    def greet(self):
        print("Hello from Parent1!")

class Parent2:
    def greet(self):
        print("Hello from Parent2!")

class Child(Parent1, Parent2):
    pass

c = Child()
c.greet()  # 輸出: Hello from Parent1! (依據繼承順序)

5. 方法解析順序（MRO）

多重繼承使用 MRO（Method Resolution Order）確定方法的解析順序。可以使用 `__mro__` 屬性檢查：

print(Child.__mro__)
# 輸出: (, , , )

6. 抽象基類

使用 `abc` 模組定義抽象基類（Abstract Base Class），強制子類實現特定方法：

from abc import ABC, abstractmethod

class AbstractParent(ABC):
    @abstractmethod
    def greet(self):
        pass

class Child(AbstractParent):
    def greet(self):
        print("Hello from Child!")

c = Child()
c.greet()  # 輸出: Hello from Child!

7. 總結

- 繼承讓類別代碼更具重用性和擴展性。 - 子類可以覆寫父類方法，並用 `super()` 呼叫父類方法。 - 支援多重繼承，但需注意方法解析順序（MRO）。 - 抽象基類可用於強制子類實現特定方法，適合介面設計。

建立繼承 ClassB 的臨時類別

範例程式碼

class ClassB:
    def greet(self):
        print("Hello from ClassB!")

# 動態建立繼承自 ClassB 的臨時類別
TempClass = type('TempClass', (ClassB,), {
    'greet': lambda self: (print("Hello from TempClass!"), super(TempClass, self).greet())[0]
})

# 創建實例並測試
temp = TempClass()
temp.greet()

解釋

type() 函數:
type('TempClass', (ClassB,), {...})
- 'TempClass'：新類別名稱。
- (ClassB,)：基礎類別的元組，這裡只有 ClassB。
- {...}：新增的屬性或方法。
Lambda 函數用於覆蓋方法:
- 自訂 greet 方法先印出新訊息，再透過 super() 呼叫父類別的 greet。

輸出結果

Hello from TempClass!
Hello from ClassB!

切換使用具相同介面的不同類別

說明

假設有兩個類別 AClass 與 BClass，它們具有相同名稱與參數的函式。我們希望能方便地切換使用哪一個類別，而不需要修改主要程式邏輯。

範例程式


class AClass:
    def process(self, data):
        print(f"AClass 處理: {data}")

    def result(self):
        return "結果來自 AClass"


class BClass:
    def process(self, data):
        print(f"BClass 處理: {data}")

    def result(self):
        return "結果來自 BClass"


# 可透過設定控制使用哪個類別
USE_A = True

# 動態選擇類別
SelectedClass = AClass if USE_A else BClass

# 建立實例並使用
obj = SelectedClass()
obj.process("測試資料")
print(obj.result())

輸出結果 (USE_A=True)


AClass 處理: 測試資料
結果來自 AClass

輸出結果 (USE_A=False)


BClass 處理: 測試資料
結果來自 BClass

更進階的寫法：使用工廠函式


def get_class(name):
    mapping = {
        "A": AClass,
        "B": BClass
    }
    return mapping.get(name, AClass)  # 預設用 AClass

# 動態選擇
cls = get_class("B")
obj = cls()
obj.process("測試資料")

結論

若兩個類別有相同介面，可直接以條件式或工廠函式切換。
保持函式名稱與參數一致，可讓主程式完全不用改。
若需更彈性設計，可考慮使用「介面」或「抽象類別 (abc)」。

Python 使用抽象類別

簡短回答

在 Python 中，不一定需要 像 C++ 或 Java 那樣寫成 abstract class。 Python 採用「鴨子型別 (Duck Typing)」，只要物件具有相同的方法名稱與行為，即可視為相容。

鴨子型別範例


class AClass:
    def process(self, data):
        print(f"AClass 處理: {data}")

class BClass:
    def process(self, data):
        print(f"BClass 處理: {data}")

def run(obj):
    obj.process("資料")  # 不需指定型別，只要有這個方法即可

run(AClass())
run(BClass())

輸出結果


AClass 處理: 資料
BClass 處理: 資料

使用抽象類別 (ABC) 的情境

雖然 Python 不強制型別，但若想在團隊開發或大型專案中明確定義介面，可以使用 abc 模組。


from abc import ABC, abstractmethod

class BaseClass(ABC):
    @abstractmethod
    def process(self, data):
        pass

class AClass(BaseClass):
    def process(self, data):
        print(f"AClass 處理: {data}")

class BClass(BaseClass):
    def process(self, data):
        print(f"BClass 處理: {data}")

# BaseClass() 會報錯，因為抽象方法未實作

結論

Python 不強制使用抽象類別，動態型別語言天生支援「相同介面不同類別」。
若專案需要明確介面規範、可讀性高或自動檢查，建議使用 abc 模組。
小型或快速開發專案中，鴨子型別即可滿足需求。

Python 模組

定義

在 Python 中，模組（Module） 是一個包含程式碼的檔案，通常以副檔名 .py 結尾。模組可以定義函式、類別、變數，也可以包含可執行的程式碼，方便重複使用與程式結構化。

用途

將程式拆分為多個檔案，便於維護與閱讀。
提供可重複使用的函式庫或工具。
避免程式碼重複，提高開發效率。
支援命名空間管理，減少名稱衝突。

使用方式

Python 透過 import 關鍵字來引入模組，例如：


import math

print(math.sqrt(16))  # 輸出 4.0

自訂模組

開發者可以自己建立模組。例如建立一個 mymodule.py：


# mymodule.py
def greet(name):
    return f"Hello, {name}!"

在另一個程式檔案中使用：


import mymodule

print(mymodule.greet("Alice"))

常見內建模組

os：處理作業系統相關操作。
sys：存取 Python 直譯器相關資訊。
datetime：處理日期與時間。
math：提供數學函式。
random：產生隨機數。

Python 套件

定義

在 Python 中，套件（Package） 是一種組織模組的方式。套件是一個包含多個模組的目錄，透過層級化的結構讓程式更容易管理與維護。

特徵

套件是一個目錄（資料夾）。
目錄內至少包含一個 __init__.py 檔案（在 Python 3.3+ 可省略，但加上有助於清楚定義套件）。
套件可以再包含子套件，形成階層式結構。

基本範例

建立一個名為 mypackage 的套件：


mypackage/
│── __init__.py
│── module1.py
└── module2.py

module1.py 範例：


def add(a, b):
    return a + b

module2.py 範例：


def multiply(a, b):
    return a * b

使用套件


import mypackage.module1
import mypackage.module2

print(mypackage.module1.add(2, 3))      # 輸出 5
print(mypackage.module2.multiply(2, 3)) # 輸出 6

從套件匯入特定項目


from mypackage.module1 import add
from mypackage.module2 import multiply

print(add(10, 5))       # 輸出 15
print(multiply(10, 5))  # 輸出 50

常見用途

將相關模組整合管理，方便維護。
避免名稱衝突，提供清楚的命名空間。
讓大型專案的結構更清晰。

取得當前套件名稱

說明

在 Python 中，若要取得目前模組所屬的套件名稱，可以使用特殊變數 __package__。這和 __module__ 取得當前模組名稱的概念類似。

範例：模組與套件結構


mypackage/
│── __init__.py
└── submodule.py

submodule.py 內容：


print("__name__:", __name__)
print("__package__:", __package__)
print("__module__:", __module__)

執行結果

若在其他程式中以 import mypackage.submodule 匯入，輸出大致如下：


__name__: mypackage.submodule
__package__: mypackage
__module__: __main__

解釋

__name__：完整的模組名稱。
__package__：當前模組所屬套件的名稱，若是頂層模組則為空字串。
__module__：通常用在類別或函式的定義中，表示它定義於哪個模組。

應用場景

在大型專案中判斷模組的上下文位置。
在相對匯入時，利用 __package__ 協助確認套件路徑。

Python 套件版本

檢查 Python 套件版本有兩種主要途徑：透過終端機（命令列）或在 Python 程式碼中執行。這能幫助你確認環境是否符合專案需求。

1. 透過終端機檢查 (Command Line)

這是最快速的方法，不需要進入 Python 互動環境。

檢查特定套件： pip show 套件名稱（例如 pip show pandas）。
列出所有已安裝套件： pip list。
搜尋特定套件版本： pip list | findstr "套件名稱" (Windows) 或 pip list | grep "套件名稱" (Linux/Mac)。
Conda 環境： conda list 套件名稱。

2. 在 Python 程式碼中檢查

如果你需要在程式執行時判斷版本，可以使用以下兩種方式：

使用 __version__ 屬性： 大多數主流套件都支援此屬性。
```
import pandas
print(pandas.__version__)
```
使用 importlib.metadata (推薦)： 這是 Python 3.8+ 內建的標準方法，不需要先 import 該套件即可檢查。
```
from importlib.metadata import version
print(version('pandas'))
```

3. 檢查方法對照表

方法	指令 / 程式碼	適用情境
Pip 指令	`pip show`	查看安裝路徑、作者、依賴關係等詳細資訊。
Pip 清單	`pip list`	快速概覽目前環境中所有套件與版本。
內部屬性	`.__version__`	在腳本運行中進行邏輯判斷。
Metadata	`version()`	標準化且不需加載整個套件的檢查方式。

4. 檢查 Python 自身版本

有時候問題不在套件，而是在 Python 解釋器本身：

終端機： python --version
程式內：
```
import sys
print(sys.version)
```

5. 常見問題與提醒

多環境衝突： 如果 pip list 顯示的版本與 VS Code 內執行的不同，請確認 VS Code 右下角的 Interpreter 是否選擇正確。
套件未安裝： 若使用 importlib 檢查未安裝的套件，會拋出 PackageNotFoundError。
大小寫敏感： 在 pip show 中不區分大小寫，但在某些程式碼邏輯中可能需要精確的名稱。

從類別與模組物件取得套件名稱

類別物件

在 Python 中，類別物件可以透過 cls.__module__ 找到定義該類別的模組名稱，然後再透過 sys.modules 取得模組物件，最後讀取其 __package__ 屬性以得到套件名稱。


import sys

# 假設在 mypackage.submodule 裡定義一個類別
class MyClass:
    pass

# 取得類別所屬模組名稱
module_name = MyClass.__module__
print("模組名稱:", module_name)

# 取得模組物件
mod = sys.modules[module_name]

# 從模組物件取得套件名稱
print("套件名稱:", mod.__package__)

模組物件

模組本身就是一個物件，可以直接存取其 __package__ 屬性。


import math
import mypackage.submodule as sub

# math 是標準函式庫模組，沒有套件，所以 __package__ 為空字串
print("math.__package__:", math.__package__)

# 自訂套件的模組
print("sub.__package__:", sub.__package__)

執行結果示例


模組名稱: mypackage.submodule
套件名稱: mypackage
math.__package__: 
sub.__package__: mypackage

結論

類別 → __module__ → sys.modules[...] → __package__
模組物件 → __package__ 直接取得

inspect.getfile

當 Python 檔案被直接執行時，它的模組名就是 __main__。這使得僅使用 cls.__module__ 無法獲取原始的檔案名和路徑。

假設您的專案結構是：

/project
  |-- test_runner.py  <-- 您直接執行的檔案 (會被視為 __main__)
  |-- test/
        |-- db_test.py <-- 定義了 DbCmdAgent 的檔案

如果您在 `test_runner.py` 中執行以下程式碼：

from test.db_test import DbCmdAgent 
agent_obj = DbCmdAgent(...) # 實例化

# 此時 cls.__module__ 仍然是 'test.db_test' (正確的模組名)

但是，如果您在 `test_runner.py` 中定義了類別：

# test_runner.py 的內容
class DbCmdAgent:
    pass

agent_obj = DbCmdAgent()
# 此時 cls.__module__ == '__main__' (錯誤的模組名)

這表明您正在獲取資訊的類別是在被執行為 `__main__` 的檔案中定義的。

使用 `inspect` 模組可直接獲取檔案路徑

無論類別是否在 `__main__` 中定義，您都可以繞過 `__module__` 屬性，直接使用 inspect 模組來獲取該類別對應的原始程式碼檔案路徑。這是更可靠且更通用的方法。

Python 修正實作

import inspect
import os

# --- 模擬情境：類別在 __main__ (當前執行腳本) 中定義 ---

class DbCmdAgent:
    """這個類別在當前執行的主腳本中定義"""
    def __init__(self, data):
        self.data = data

agent_obj = DbCmdAgent("some_data")

def get_class_location_robust(obj):
    """
    使用 inspect.getfile 繞過 __module__ == '__main__' 的問題。
    """
    cls = type(obj)
    
    # 1. 使用 inspect.getfile() 獲取定義該類別的檔案路徑
    try:
        file_path = inspect.getfile(cls) 
        
        # 2. 獲取檔案名和目錄
        file_name = os.path.basename(file_path)
        directory = os.path.dirname(file_path)
        py_name = os.path.splitext(file_name)[0]
        
        # 3. 如果 __module__ 是 __main__，則用檔案名替換它，以提供更多上下文
        module_name = cls.__module__
        if module_name == '__main__':
            module_name = py_name # 使用 db_test 或 test_runner 作為上下文
            
    except TypeError:
        # 處理內建類型
        file_path = "N/A (Built-in or C extension)"
        file_name = "N/A"
        directory = "N/A"
        py_name = "N/A"
        module_name = cls.__module__
        
    return {
        "module_name_or_main": module_name,
        "py_name_no_ext": py_name, 
        "directory": directory,
        "file_path": file_path,
    }

# 執行並查看結果
location_info = get_class_location_robust(agent_obj)

print("--- 類別定義檔案資訊 ---")
print(f"檔案名稱 (.py 名):  {location_info['py_name_no_ext']}")
print(f"目錄路徑 (Package):  {location_info['directory']}")
print(f"完整檔案路徑:        {location_info['file_path']}")

4. 關鍵點總結

使用 inspect.getfile(type(obj))：這是直接獲取原始定義檔案路徑最可靠的方法，完全獨立於模組是否被視為 __main__。
__module__ 僅反映該類別在當前程序中的模組命名空間，不一定反映其在專案結構中的實際名稱。

動態匯入模組

功能說明

此方法利用 importlib.import_module 嘗試匯入指定模組，若遇到 ModuleNotFoundError，會從目前已載入的套件中再嘗試匯入其子模組。

程式範例


import importlib
import sys

def safe_import(module_name):
    try:
        # 直接嘗試匯入
        return importlib.import_module(module_name)
    except ModuleNotFoundError:
        # 若失敗，嘗試從已知套件中匯入子模組
        for pkg in list(sys.modules.keys()):
            if pkg and not pkg.startswith("_"):
                try:
                    return importlib.import_module(f"{pkg}.{module_name}")
                except ModuleNotFoundError:
                    continue
        raise  # 若仍找不到，拋出例外

使用範例


import numpy

mod1 = safe_import("random")   # 可直接成功，因為是標準庫
mod2 = safe_import("linalg")   # 會嘗試 numpy.linalg
print(mod2.__name__)           # 輸出 numpy.linalg

說明

sys.modules 保存所有已載入的模組。
當匯入失敗時，會嘗試以 package.module_name 方式重試。
此方法能模擬 Python 子模組的自動搜尋機制。

Python 模組搜索路徑：sys.path 的組成

在 Python 中，sys.path 是一個列表（list），它包含了 Python 解譯器在嘗試匯入（import）模組時會依序搜索的所有目錄路徑。當您執行 import some_module 時，Python 會按順序檢查 sys.path 列表中的每個目錄，直到找到名為 some_module 的檔案（例如 some_module.py、some_module/__init__.py 等）。

sys.path 的三個主要組成部分

sys.path 列表通常由以下三個部分組成，並按以下順序搜索：

1. 程式碼的入口目錄 (入口點)

執行腳本的目錄：列表的第一個元素（sys.path[0]）通常是當前正在執行的 Python 腳本（例如 main.py）所在的目錄。
互動模式：如果您是在互動式解譯器（Interactive Interpreter）或 Jupyter Notebook 中，這個元素會是空字串 ''，它代表當前工作目錄（Current Working Directory, CWD）。

2. PYTHONPATH 環境變數

Python 會讀取名為 PYTHONPATH 的系統環境變數。
此變數中定義的所有目錄路徑會被加入到 sys.path 中。
用途：PYTHONPATH 通常用於永久地將一些常用的、位於非標準位置的專案或函式庫目錄添加到搜索路徑中，而無需在每個專案中手動設定。

3. 標準函式庫和安裝目錄

標準函式庫 (Standard Library)：包含所有 Python 內建模組（如 os, sys, json, socket）的安裝目錄。
第三方套件安裝目錄 (site-packages)：這是所有透過 pip 安裝的第三方套件（例如 fastapi, numpy, pandas）的安裝目錄。在虛擬環境中，這通常位於該環境的 lib/site-packages 目錄下。

---

與 sys.path 相關的系統變數

除了上述的 PYTHONPATH 之外，還有幾個與 Python 執行環境相關的環境變數，它們會影響解譯器的行為和路徑查找，但影響 sys.path 組成的主要變數是 PYTHONPATH：

系統變數	功能描述	與 sys.path 的關係
`PYTHONPATH`	定義額外要添加到模組搜索路徑的目錄。	直接影響 `sys.path` 的組成。
`PYTHONHOME`	用於設定 Python 安裝目錄的替代路徑，特別是用於嵌入式系統。	間接影響標準函式庫和 `site-packages` 的位置。
`PATH`	作業系統用來查找可執行文件（例如 `python.exe`）的路徑。	不直接影響 `sys.path`，但影響哪個 Python 解譯器被執行。
`VIRTUAL_ENV`	當您處於虛擬環境中時，此變數指向虛擬環境的根目錄。	間接影響 `sys.path`，因為它確保 `site-packages` 是來自該虛擬環境而非系統全域的。

如何修改 sys.path

由於 sys.path 是一個普通的 Python 列表，您可以在程式運行時動態修改它，但這種修改只在當前解譯器會話中有效：

import sys
import os

# 將父目錄添加到搜索路徑中 (常用於測試或專案內部引用)
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

模組陰影

模組陰影（Module Shadowing，或稱 Name Shadowing）是 Python 中常見的一種錯誤或程式設計問題。它發生在當您自己建立的程式碼檔案或變數名稱，不小心與您嘗試匯入或使用的內建模組或第三方函式庫的名稱相衝突時。

1. 定義與發生原因

定義：當 Python 解譯器嘗試載入一個模組時，它會按照特定的搜索順序（sys.path）來查找該模組。
陰影發生：如果您的專案目錄中存在一個與您打算匯入的標準模組（例如 socket, json, random）或第三方函式庫同名的檔案或目錄（例如您建立了一個名為 socket.py 的檔案），Python 會優先載入您本地的這個檔案。

這導致的結果是：您本地的檔案「遮蓋」或「覆蓋」了原本應該載入的標準模組，使得您程式碼中對標準模組功能（例如 socket.AF_UNSPEC）的呼叫會失敗，因為您載入的本地檔案中並沒有這些屬性。

2. 常見範例

標準模組名	導致陰影的本地檔案名	後果
`socket`	`socket.py`	無法使用標準 `socket` 模組的網路常數（如 `AF_INET`, `AI_PASSIVE`）。
`json`	`json.py`	無法使用標準 `json` 模組的 `loads` 或 `dumps` 函式。
`test`（專案名）	`test.py`	在單元測試環境中，可能會與測試框架的內部邏輯衝突。

3. 解決方案

重新命名檔案：這是最簡單和最有效的解決方案。只需將與標準模組或函式庫名稱衝突的本地檔案或目錄重新命名即可。例如，將 socket.py 改名為 network_handler.py。
檢查 sys.path：在您的程式碼中執行 import sys; print(sys.path) 來查看 Python 的搜索路徑，以確認它是否優先於標準函式庫目錄載入了您的本地檔案。
使用虛擬環境：雖然虛擬環境本身不能防止本地檔案陰影，但它可以確保您安裝的第三方套件不會與其他環境衝突。

取得目前入口 .py 名稱

說明

要取得 Python 程式中目前執行的 __main__ 所屬 .py 檔名稱，可使用 __main__.__file__ 或 sys.argv[0]。但在互動模式、Jupyter、或以 -c 執行時可能不存在，因此需要安全處理。

取得目前 main .py 檔名（安全版本）

import os
import sys
import __main__

def get_main_py_path():
    """回傳 main 所屬 .py 絕對路徑，找不到時回傳 None"""

    # 情況 1：正常執行 .py
    main_file = getattr(__main__, "__file__", None)
    if main_file:
        return os.path.abspath(main_file)

    # 情況 2：從 sys.argv[0] 判斷
    if len(sys.argv) > 0:
        argv0 = sys.argv[0]
        if argv0 not in ("", "-c", ""):
            candidate = os.path.abspath(argv0)
            if os.path.exists(candidate):
                return candidate

    # 情況 3：互動模式、Jupyter、embed etc.
    return None

# 範例
path = get_main_py_path()
if path:
    print("main path:", path)
    print("main filename:", os.path.basename(path))
else:
    print("找不到 main .py（可能在互動環境或不是從檔案執行）")

只要檔名（basename）

path = get_main_py_path()
filename = os.path.basename(path) if path else None
print(filename)

總結

__main__.__file__ 是最可靠方式，但並非總是存在。
sys.argv[0] 是備用方式，但需確認值不是 -c 或 <stdin>。
互動式（REPL/Jupyter）無法取得 .py 名稱，會回傳 None。

拿到目前函式的參數名稱與值

To get the parameter names and their corresponding values of a function in Python, you can use the `inspect` module, which provides introspection utilities. Specifically, `inspect.signature()` can help you retrieve the names of the parameters, and you can pass the current frame's local variables to get their values.

Here is an example that demonstrates how to get the function name, parameter names, and their values:

```python
import inspect

# Sample function
def my_function(a, b, c=5):
    # Get the current frame
    frame = inspect.currentframe()
    
    # Get the function name
    func_name = frame.f_code.co_name
    print(f"Function name: {func_name}")
    
    # Get the parameter names and their values
    args, _, _, values = inspect.getargvalues(frame)
    
    # Print parameter names and values
    for arg in args:
        print(f"Parameter name: {arg}, Value: {values[arg]}")

# Call the function
my_function(1, 2)
```

### Output:
```
Function name: my_function
Parameter name: a, Value: 1
Parameter name: b, Value: 2
Parameter name: c, Value: 5
```

### Explanation:
1. **`inspect.currentframe()`**: Retrieves the current execution frame.
2. **`frame.f_code.co_name`**: Extracts the name of the current function.
3. **`inspect.getargvalues(frame)`**: Gets the argument names and their corresponding values from the frame. This function returns a tuple containing:
   - `args`: List of argument names.
   - `_`: Placeholder for unused information.
   - `values`: Dictionary containing argument names as keys and their values.

This allows you to print both the names of the function's parameters and their values at runtime.

取得函式參數的型別

使用 inspect 模組

在 Python 中，可以透過 inspect.signature() 取得函式的參數資訊，並進一步從 Parameter.annotation 屬性獲得每個參數的型別註解（type hint）。


import inspect

def my_function(a: int, b: str, c: float = 3.14) -> bool:
    return str(a) == b

sig = inspect.signature(my_function)

for name, param in sig.parameters.items():
    print(f"參數名稱: {name}")
    print(f"  預設值: {param.default}")
    print(f"  型別註解: {param.annotation}")
    print()

輸出結果


參數名稱: a
  預設值: <class 'inspect._empty'>
  型別註解: <class 'int'>

參數名稱: b
  預設值: <class 'inspect._empty'>
  型別註解: <class 'str'>

參數名稱: c
  預設值: 3.14
  型別註解: <class 'float'>

說明

param.annotation 會取得型別註解（如 int、str）。
若參數沒有型別註解，則會是 inspect._empty。
可使用 get_type_hints() 取得完整的型別提示字典。

使用 get_type_hints

此方法會自動解析 forward reference（以字串標註的型別）。


from typing import get_type_hints

hints = get_type_hints(my_function)
print(hints)

輸出結果


{'a': <class 'int'>, 'b': <class 'str'>, 'c': <class 'float'>, 'return': <class 'bool'>}

總結

inspect.signature() 可取得參數順序與名稱。
param.annotation 可查每個參數的型別註解。
get_type_hints() 可更方便地一次取得所有型別提示（含回傳值）。

取得物件的類別名稱

說明

在 Python 中，可以透過物件的 __class__ 屬性或 type() 函式，取得其所屬的類別（class），進而獲得類別名稱。

範例


class Animal:
    pass

class Dog(Animal):
    pass

obj = Dog()

# 方法一：使用 __class__.__name__
print(obj.__class__.__name__)   # 輸出: Dog

# 方法二：使用 type()
print(type(obj).__name__)       # 輸出: Dog

# 方法三：取得完整模組與類別名稱
print(obj.__class__)            # 輸出: <class '__main__.Dog'>
print(obj.__class__.__module__) # 輸出: __main__

輸出結果


Dog
Dog
<class '__main__.Dog'>
__main__

說明

obj.__class__：取得物件的類別物件。
obj.__class__.__name__：取得類別名稱字串。
type(obj) 等價於 obj.__class__。
__module__：可取得該類別定義所在的模組名稱。

進階應用

若要同時取得完整的「模組 + 類別名稱」，可以這樣寫：


cls = type(obj)
full_name = f"{cls.__module__}.{cls.__name__}"
print(full_name)

輸出結果


__main__.Dog

總結

type(obj).__name__ 是最簡潔取得類別名稱的方法。
若需完整辨識類別來源（含模組），可用 f"{obj.__class__.__module__}.{obj.__class__.__name__}"。

檢測屬性所屬類別

以下是使用 Python 判斷屬性屬於哪個繼承類別的範例程式碼：

範例程式碼


import inspect

class BaseClass:
    base_attr = "我是來自 BaseClass 的屬性"

class SubClass(BaseClass):
    sub_attr = "我是來自 SubClass 的屬性"

# 定義函式以找出屬性歸屬的類別
def find_attribute_owner(cls, attr_name):
    for base in inspect.getmro(cls):  # 取得 MRO（方法解析順序）
        if attr_name in base.__dict__:
            return base
    return None

# 測試
sub_obj = SubClass()
attributes = sub_obj.__class__.__dict__.items()  # 取得類別層級的所有屬性
for name, value in attributes:
    owner = find_attribute_owner(sub_obj.__class__, name)
    print(f"屬性 '{name}' 屬於類別: {owner.__name__}")

程式說明

inspect.getmro(cls): 獲取類別的 MRO（方法解析順序），即繼承的類別層級順序。
base.__dict__: 每個類別都有自己的 __dict__，其中儲存該類別定義的屬性。
函式會檢查 MRO 中的每個類別，尋找屬性在哪個類別中定義。

執行結果

對於範例中的類別，執行結果如下：


屬性 '__module__' 屬於類別: SubClass
屬性 'sub_attr' 屬於類別: SubClass
屬性 '__doc__' 屬於類別: SubClass
屬性 'base_attr' 屬於類別: BaseClass

取得函式的註解 (Docstring)

使用 doc

class MyClass:
    def fun1(self):
        '''
        Fun1 comment
        '''
        pass

obj = MyClass()
print(obj.fun1.__doc__)

使用 inspect 模組

import inspect

class MyClass:
    def fun1(self):
        '''
        Fun1 comment
        '''
        pass

print(inspect.getdoc(MyClass.fun1))

函式標示為已棄用

使用 warnings 模組

在 Python 中，可使用內建的 warnings 模組，在執行時（而非編譯時）提醒使用者某個函式已被棄用，並建議新的替代方法。


import warnings

def old_function(x, y):
    warnings.warn(
        "函式 old_function() 已棄用，請改用 new_function(x, y)。",
        category=DeprecationWarning,
        stacklevel=2
    )
    return x + y

def new_function(x, y):
    return x + y

執行範例


result = old_function(3, 4)
print(result)

輸出結果


DeprecationWarning: 函式 old_function() 已棄用，請改用 new_function(x, y)。
  result = old_function(3, 4)
7

補充說明

warnings.warn() 是在執行階段顯示警告，不會中斷程式。
category=DeprecationWarning 用於標示棄用性警告。
stacklevel=2 讓警告訊息指出呼叫者的位置，而非函式內部。
若希望在開發階段將警告視為錯誤，可使用：
```
python -W error::DeprecationWarning your_script.py
```

進階：建立裝飾器自動標示棄用函式

可用裝飾器（decorator）讓多個舊函式共用相同棄用提示邏輯：


import warnings
from functools import wraps

def deprecated(new_func_name):
    def decorator(func):
        @wraps(func)
        def wrapper(*args, **kwargs):
            warnings.warn(
                f"函式 {func.__name__}() 已棄用，請改用 {new_func_name}()。",
                category=DeprecationWarning,
                stacklevel=2
            )
            return func(*args, **kwargs)
        return wrapper
    return decorator

@deprecated("new_function")
def old_function(x, y):
    return x + y

@staticmethod 與 @classmethod 的差異

在 Python 中，@staticmethod 和 @classmethod 這兩個裝飾器都可以定義不需要實例化類別就能調用的方法，但它們的用途和行為有所不同。

@staticmethod

定義：@staticmethod 是不接受任何隱含第一個參數（無 self 或 cls）的方法。它就像普通的函數，只是屬於類別的命名空間。
用法：靜態方法無法修改類別或實例的狀態，通常用於與類別相關的功能，但不需要訪問或修改類別或實例。
使用時機：當你不需要訪問類別或實例，但想將相關功能歸屬於類別時，可以使用 @staticmethod。

@staticmethod 範例：

class MyClass:
    @staticmethod
    def static_method(x, y):
        return x + y

# 無需建立實例即可調用靜態方法
result = MyClass.static_method(5, 10)  # 結果：15

重點：@staticmethod 無法訪問類別（cls）或實例（self）。

@classmethod

定義：@classmethod 是接受類別本身（cls）作為第一個參數的方法。這使得它可以訪問和修改類別的狀態。
用法：類別方法可以修改類別層級的狀態（例如類別變數），並且可以在實例或類別上調用。
使用時機：當你需要訪問或修改類別層級的數據（如類別變數）或創建類別的替代構造函數時，可以使用 @classmethod。

@classmethod 範例：

class MyClass:
    class_variable = 0

    def __init__(self, value):
        self.value = value
        MyClass.class_variable += 1

    @classmethod
    def get_class_variable(cls):
        return cls.class_variable

# 創建實例
obj1 = MyClass(10)
obj2 = MyClass(20)

# 調用類別方法
print(MyClass.get_class_variable())  # 結果：2

重點：@classmethod 可以訪問類別層級的狀態（cls）。

總結

特徵	@staticmethod	@classmethod
第一個參數	無隱含的第一個參數	`cls`（類別本身）
訪問實例	無	無
訪問類別	無	有
用法	與類別相關但不需要實例或類別的工具函數	需要操作類別層級的數據或提供替代構造函數

靜態類別執行初始化

Python 本身並沒有提供「默認靜態方法」或「默認類別方法」，即在第一次調用任何靜態或類別方法時自動執行一個方法的功能。但我們可以通過懶加載技巧來實現類似的行為。

解決方案：使用靜態變數和懶加載

可以在類中定義一個靜態變數來追蹤初始化的狀態，然後在第一次調用靜態或類別方法時執行初始化邏輯。

範例：

class MyClass:
    initialized = False  # 靜態變數，跟蹤是否已經初始化

    @staticmethod
    def init_once():
        if not MyClass.initialized:
            print("初始化邏輯執行...")
            MyClass.initialized = True

    @classmethod
    def class_method(cls):
        cls.init_once()
        print("調用類別方法")

    @staticmethod
    def static_method():
        MyClass.init_once()
        print("調用靜態方法")

# 第一次調用類別方法，觸發初始化
MyClass.class_method()  # 輸出: 初始化邏輯執行... 調用類別方法

# 第二次調用類別方法，不再執行初始化
MyClass.class_method()  # 輸出: 調用類別方法

# 第一次調用靜態方法，不再執行初始化，因為已經初始化過
MyClass.static_method()  # 輸出: 調用靜態方法

工作原理：

靜態變數 initialized：該變數用於跟蹤類別是否已經初始化，初始值為 False。
init_once() 方法：這個方法負責執行初始化邏輯，並且在初始化後將 initialized 設為 True，以防止重複初始化。
靜態和類別方法：在每次調用這些方法時，都會首先檢查是否需要初始化，保證初始化邏輯只會執行一次。

總結

雖然 Python 沒有內建「默認靜態方法」或「默認類別方法」，但通過使用靜態變數與懶加載技巧，你可以在第一次調用靜態或類別方法時自動執行初始化邏輯，並確保該邏輯只會被執行一次。

Python 執行緒

在 Python 中，執行緒（Thread）是用於實現並行（Concurrency）的一種機制。它允許程式在單一進程（Process）內同時執行多個任務。這對於執行 I/O 密集型操作（例如網路通訊、檔案讀寫）非常有用，可以避免程式因等待外部操作完成而阻塞（Blocking）。

1. 為什麼使用執行緒？

非阻塞 I/O：當程式等待網路響應或磁碟讀寫時，其他執行緒可以繼續執行計算，提高效率。
使用者介面：保持 UI 響應性，即使主程式在執行耗時的背景任務。
並行任務：同時處理多個獨立的任務，例如多個客戶端的連線請求。

2. Python 執行緒的限制：GIL (全域解譯器鎖)

在標準的 CPython 解譯器中，存在一個「全域解譯器鎖」（Global Interpreter Lock, GIL）。GIL 確保在任何給定時間，只有一個執行緒可以執行 Python 位元碼。這意味著：

執行緒在 I/O 密集型任務中表現良好（因為 Python 可以在等待 I/O 時釋放 GIL，讓其他執行緒執行）。
執行緒對於 CPU 密集型任務的加速效果不明顯（因為 GIL 會限制多核 CPU 的並行計算能力）。對於 CPU 密集型任務，建議使用多進程（multiprocessing 模組）。

3. 執行緒模組：`threading`

Python 使用標準函式庫中的 threading 模組來處理執行緒。有兩種主要的執行緒創建方法：

方法一：傳遞函式作為目標 (Target Function)

這是最簡單和最常見的用法。

import threading
import time

def task(name, delay):
    """執行緒要執行的任務函式"""
    print(f"執行緒 {name}: 正在啟動...")
    time.sleep(delay) # 模擬耗時的 I/O 操作
    print(f"執行緒 {name}: 任務完成。")

# 創建執行緒
thread1 = threading.Thread(target=task, args=("T1", 2))
thread2 = threading.Thread(target=task, args=("T2", 4))

# 啟動執行緒
thread1.start()
thread2.start()

# 等待所有執行緒完成（阻塞主執行緒直到它們結束）
thread1.join()
thread2.join()

print("所有執行緒已完成。主程式退出。")

方法二：繼承 `threading.Thread` 類別

適用於更複雜的場景，將執行緒的邏輯封裝在一個類別中。

import threading
import time

class MyThread(threading.Thread):
    def __init__(self, name, delay):
        super().__init__()
        self.name = name
        self.delay = delay

    def run(self):
        """
        當執行緒啟動時，會自動呼叫 run() 方法。
        在這裡定義執行緒要執行的任務。
        """
        print(f"執行緒 {self.name}: 正在啟動...")
        time.sleep(self.delay)
        print(f"執行緒 {self.name}: 任務完成。")

# 創建並啟動執行緒
thread3 = MyThread("T3", 3)
thread3.start()
thread3.join()

print("自定義執行緒已完成。")

4. 執行緒同步與資料共享

當多個執行緒存取和修改共享數據時，可能會產生競爭條件（Race Condition）。您需要使用同步機制來保護數據：

Lock：鎖是最基本的同步原語。在執行緒存取共享資源之前呼叫 lock.acquire()，完成後呼叫 lock.release()。
RLock (可重入鎖)：允許同一個執行緒多次獲取鎖。
Semaphore (號誌)：用於限制同時存取資源的執行緒數量。

使用 Lock 範例

import threading

# 共享資源
counter = 0
# 創建鎖
lock = threading.Lock()

def increment_counter():
    global counter
    # 獲取鎖，確保同一時間只有一個執行緒可以執行此區塊
    lock.acquire()
    try:
        # 競爭區段
        current_value = counter
        time.sleep(0.001) # 模擬切換
        counter = current_value + 1
    finally:
        # 釋放鎖
        lock.release()

threads = []
for i in range(100):
    t = threading.Thread(target=increment_counter)
    threads.append(t)
    t.start()

for t in threads:
    t.join()

print(f"最終計數器值: {counter}") # 如果沒有鎖，這個值可能不是 100

Python 執行緒的啟動、同步與停止

Python 的 threading 模組提供了建立和管理執行緒的功能，但由於作業系統的限制和設計哲學，Python **沒有提供一個安全、直接、強制性停止（Kill）外部執行緒**的方法。強制停止可能導致資源洩漏或資料損壞。

因此，停止執行緒必須透過 **協同機制（Cooperative Mechanism）** 來實現，即讓執行緒自己檢查一個停止旗標並優雅地退出。

1. 執行緒停止機制：使用旗標 (Flag)

這是最安全和最推薦的執行緒停止方法。它要求執行緒在執行任務的迴圈中定期檢查一個外部變數（旗標）。

Python 實作範例

import threading
import time

# 共享的停止旗標
stop_flag = threading.Event()

def monitored_task(name, delay):
    """
    會定期檢查停止旗標的任務函式
    """
    print(f"執行緒 {name}: 正在啟動...")
    i = 0
    while not stop_flag.is_set(): # 檢查旗標是否被設定
        i += 1
        print(f"執行緒 {name}: 執行步驟 {i}")
        
        # 模擬耗時操作，並定期檢查
        time.sleep(delay)
        
        # 在這裡可以設置一個執行次數限制，以確保不會無限循環
        if i >= 5:
            break
            
    print(f"執行緒 {name}: 收到停止訊號或任務結束，優雅退出。")

# --- 主程式控制區塊 ---

# 創建執行緒
worker_thread = threading.Thread(target=monitored_task, args=("Worker-1", 1))

# 啟動執行緒
worker_thread.start()

print("\n主程式: 執行緒已啟動，等待 3 秒...\n")
time.sleep(3) # 讓執行緒運行一段時間

# 發出停止訊號
print("\n主程式: 設定停止旗標...\n")
stop_flag.set() # 設定 Event，讓 is_set() 返回 True

# 等待執行緒優雅地完成並退出 (通常很快)
worker_thread.join()

print("\n主程式: 執行緒已安全停止並加入。程式退出。")

2. 關鍵組件說明

threading.Event()：一個簡單的同步原語。它在內部維護一個布林旗標。
- stop_flag.is_set()：檢查旗標是否為 True（即是否發出了停止訊號）。
- stop_flag.set()：將旗標設置為 True，發出停止訊號。
while not stop_flag.is_set():：這是執行緒的主要控制結構。只要沒有收到停止訊號，就繼續執行迴圈。
worker_thread.join()：確保主程式會等待工作執行緒完成（優雅退出）後再繼續執行。這是確保程序乾淨結束的重要步驟。

3. 其他停止機制 (不推薦強制停止)

儘管存在一些實驗性或不安全的強制停止方法，例如使用 `_thread.stop()` 或拋出異常，但這些方法都可能導致：

資源鎖定：如果執行緒在持有鎖（Lock）時被強制停止，該鎖將永遠無法釋放，導致其他執行緒永久阻塞。
數據損壞：執行緒可能在修改共享數據到一半時被終止，留下不一致的狀態。

因此，在 Python 中，始終應堅持使用協同的旗標機制來停止執行緒。

多執行緒共享物件衝突的解決方案

1. 最常用的解決方案：執行緒區域儲存 (Thread-Local Storage)

這是在多執行緒環境中最推薦的做法。與其讓所有執行緒去搶同一個物件，不如讓每個執行緒都擁有該物件的一個獨立副本。在 Python 中，可以使用 threading.local() 來達成。

import threading

# 建立一個執行緒區域儲存物件
thread_data = threading.local()

def get_service():
    # 如果當前執行緒還沒有自己的 service，就建立一個
    if not hasattr(thread_data, 'service'):
        print(f"為執行緒 {threading.current_thread().name} 建立新連線")
        thread_data.service = create_new_connection() 
    return thread_data.service

def task():
    service = get_service()
    # 執行操作...

2. 其次常用的方法：鎖機制 (Locking)

如果該物件必須是同一個（例如寫入同一個檔案或操作同一個全域計數器），則必須使用 Lock。這能保證同一時間只有一個執行緒能存取該物件，避免競爭條件（Race Condition）。

lock = threading.Lock()

def safe_task():
    with lock:
        # 在此區塊內，其他執行緒必須等待
        shared_object.do_something()

---

替代多執行緒的方法：非同步與多進程

如果您想避開多執行緒帶來的鎖競爭（Lock contention）或崩潰風險，可以考慮以下兩種主要的替代方案：

1. 非同步協程 (Asyncio) - 適用於 I/O 密集型任務

這是目前 Python 最流行的做法（例如 FastAPI 的核心原理）。它在單個執行緒內運行，透過切換任務來等待 I/O（如 API 請求、資料庫查詢）。

優點：沒有執行緒競爭問題，不需使用鎖，記憶體消耗極低。
適合場景：大量的 API 請求、爬蟲、網頁伺服器。

import asyncio

async def fetch_api(url):
    # 使用非同步庫如 aiohttp
    response = await call_api(url)
    return response

async def main():
    # 同時執行多個任務，但在單執行緒內切換
    results = await asyncio.gather(fetch_api("url1"), fetch_api("url2"))

2. 多進程 (Multiprocessing) - 適用於計算密集型任務

Python 的執行緒受限於 GIL（全域解釋器鎖），無法真正平行運算。multiprocessing 會開啟多個獨立的 Python 解釋器實例。

優點：每個進程有獨立的記憶體空間，完全不會發生「共享物件崩潰」的問題。能利用多核 CPU。
適合場景：圖片處理、大數據運算、解析大型 JSON。

from multiprocessing import Process

def task(name):
    print(f"進程 {name} 執行中")

if __name__ == "__main__":
    p = Process(target=task, args=('A',))
    p.start()
    p.join()

3. 任務佇列 (Task Queue) - 適用於分散式處理

如果您希望將任務徹底解耦，可以使用 Celery 或 Redis Queue。將任務丟進佇列，由後端的 Worker（可能是多個進程或多台機器）去領取執行。

---

總結建議

方案	解決方式	適用情境
Thread-Local	每個執行緒拿一份副本	API Service、資料庫連線
Asyncio	單執行緒切換（非同步）	高併發網路請求 (推薦)
Multiprocessing	獨立記憶體空間	CPU 運算、徹底避開共享衝突

執行緒區域儲存與資訊共享的平衡

核心概念

當您使用執行緒區域儲存（Thread-Local Storage, TLS）時，目的是為了保護那些「非執行緒安全」的物件（如 API Service、資料庫連線）。但如果執行緒之間需要交換數據（例如 A 執行緒下載的結果要給 B 執行緒處理），您需要建立專門的「通訊管道」。

1. 使用執行緒安全佇列 (Queue) - 最推薦

Python 的 queue.Queue 是執行緒安全的。這是執行緒之間傳遞資訊最標準、最安全的方法。它內部已經處理好了所有鎖（Lock）的邏輯。

import threading
import queue

# 建立一個全域佇列，所有執行緒都可以存取
task_queue = queue.Queue()

def producer():
    # 生產資料並放入佇列
    data = {"video_id": "abc", "status": "pending"}
    task_queue.put(data)

def consumer():
    # 從佇列取出資料
    data = task_queue.get()
    # 處理資料...
    task_queue.task_done()

2. 使用執行緒安全變數 (如共享清單加鎖)

如果您需要共享的是一個大型列表或字典，您可以使用一般的全域變數，但存取時**必須**搭配 threading.Lock。

shared_results = []
results_lock = threading.Lock()

def task():
    result = "某些運算結果"
    
    # 存取共享資源前先上鎖
    with results_lock:
        shared_results.append(result)
    # 離開 with 區塊後自動解鎖

3. 使用 Event 或 Condition 物件 (信號同步)

有時候您不是要共享「資料」，而是要共享「狀態」（例如：告訴其他執行緒，API 已經初始化完成了）。

api_ready = threading.Event()

def initializer():
    # 執行初始化
    api_ready.set() # 發送訊號

def worker():
    api_ready.wait() # 等待訊號，直到 initializer 呼叫 set()
    print("開始工作")

總結：區域儲存 vs 共享資訊

內容類型	存放位置	管理方式
工具類物件 (API, DB 連線)	Thread-Local (區域)	各自擁有副本，避免崩潰。
任務資料 (ID, 參數)	Queue (全域)	使用執行緒安全佇列傳遞。
計算結果 (統計數據)	Global List/Dict (全域)	必須搭配 `threading.Lock`。

簡單來說：**「私有的工具（連線）自己拿，公有的資料（數據）排隊領（Queue/Lock）。」**

執行緒鎖

基本概念

在多執行緒環境中，當多個執行緒嘗試同時修改同一個全域變數或共享資源（如檔案、資料庫連線、全域清單）時，會發生競爭條件 (Race Condition)，導致資料錯亂。threading.Lock 是一種同步原語，它確保同一時間只有一個執行緒可以進入受保護的程式碼區塊。

1. 標準使用方法

最安全且推薦的方式是搭配 with 敘述句使用。這能確保即使在區塊內發生異常（Exception），鎖也會被正確釋放，避免產生死鎖（Deadlock）。

import threading

# 1. 建立鎖物件
my_lock = threading.Lock()
shared_counter = 0

def increment_task():
    global shared_counter
    # 2. 使用 with 自動管理 acquire() 與 release()
    with my_lock:
        # 此區塊內的程式碼同一時間只能有一個執行緒執行
        temp = shared_counter
        temp += 1
        shared_counter = temp

# 啟動多個執行緒測試
threads = [threading.Thread(target=increment_task) for _ in range(100)]
for t in threads: t.start()
for t in threads: t.join()

print(f"最終計數: {shared_counter}")

2. 手動控制方法

雖然不推薦，但有時需要更精細的控制。您必須手動呼叫 acquire() 獲取鎖，並在 finally 區塊中呼叫 release()。

lock = threading.Lock()

def manual_task():
    lock.acquire()  # 獲取鎖，若鎖已被占用則會在此阻塞（等待）
    try:
        # 執行任務
        pass
    finally:
        lock.release()  # 務必釋放，否則其他執行緒將永遠無法執行

3. 鎖的特性：不可重入性

threading.Lock 是不可重入的。這意味著如果同一個執行緒在已經持有鎖的情況下再次請求同一個鎖，它會把自己「鎖死」（死鎖）。

解決方案：如果您需要在同一個執行緒中多次獲取同一個鎖，請改用 threading.RLock()（可重入鎖）。

4. 什麼時候該用 Lock？

修改全域變數：如計數器、累加器。
非執行緒安全物件：如您之前提到的 Google API Service 物件。
檔案寫入：避免多個執行緒同時寫入同一個檔案導致內容混亂。
資料庫操作：若多個執行緒共用同一個連線進行查詢與提交。

效能考量

過度使用鎖會導致程式效能下降，因為多執行緒會變成「排隊執行」。如果可能，優先考慮使用 queue.Queue 或我們之前討論的 Thread-Local Storage，這些方法通常比頻繁上鎖更有效率且不易出錯。

Python 非同步編程

在 Python 中，async def 與 await 是實現非同步編程 (Asynchronous Programming) 的核心語法。它們能讓程式在等待 I/O 任務（如網路請求、讀取檔案）時不卡死，轉而處理其他任務，極大提升效能。

1. async def：定義協程函數

當你在函數定義前加上 async，該函數就會變成一個協程函數 (Coroutine Function)。呼叫它時，它不會立即執行內容，而是回傳一個「協程物件」。

async def fetch_data():
    print("開始抓取資料...")
    # 模擬耗時任務
    return {"data": "success"}

# 直接呼叫只會得到協程物件，不會執行 print
result = fetch_data() 
print(result) # 輸出: <coroutine object fetch_data at ...>

2. await：掛起與等待

await 只能在 async def 內部使用。它的作用是「暫時掛起目前的協程，等待後方的任務完成，並取得回傳值」。在等待期間，系統可以去執行其他的非同步任務。

import asyncio

async def main():
    # 使用 await 執行協程並取得結果
    data = await fetch_data() 
    print(f"抓取結果: {data}")

# 啟動非同步程式的入口
asyncio.run(main())

3. 關鍵對照表

語法	功能說明	注意事項
async def	宣告一個非同步函數	回傳的是協程物件，非執行結果。
await	等待非同步任務完成	只能寫在 async 函數內。
asyncio.run()	啟動最外層的非同步入口	一個程式通常只需要呼叫一次。

4. 常見錯誤與修正

忘記寫 await： 這是最常見的錯誤。如果不寫 await，你會得到 coroutine 物件，當你試圖讀取屬性（如 result.text）時會噴出 AttributeError。
在一般函數中使用 await： 這會導致 SyntaxError。必須確保外層函數有 async 修飾。
阻塞操作： 在 async 函數中使用 time.sleep() 會卡死整個事件迴圈。請改用 await asyncio.sleep()。

5. 為什麼要用非同步？

想像你在煮飯：

同步 (Sync)： 燒水時，你站在水壺前發呆，水開了才去切菜。
非同步 (Async)： 燒水（await）的同時，你去切菜，水開的聲音（事件通知）會叫你回來處理。

完成協程回傳結果

loop.run_until_complete() 是 asyncio 模組中較底層的方法，用於執行協程（Coroutine）直到其完成並回傳結果。在 Python 3.7 之後，雖然官方推薦使用 asyncio.run()，但在某些特定情境（如需要重複使用事件迴圈或自定義啟動邏輯）時，仍需使用此方法。

1. 基本使用流程

使用 run_until_complete 必須先獲取或建立一個事件迴圈物件，然後將協程傳遞給它。

import asyncio

async def my_task():
    await asyncio.sleep(1)
    return "任務完成"

# 1. 獲取事件迴圈
loop = asyncio.get_event_loop()

# 2. 執行協程直到完成，並直接獲取 return 值
result = loop.run_until_complete(my_task())

print(result)  # 輸出: 任務完成

2. 與 asyncio.run() 的差異

這兩者都能得到回傳值，但管理生命週期的方式不同：

特性	asyncio.run() (推薦)	loop.run_until_complete()
自動化程度	高。自動建立、關閉迴圈並清理任務。	低。需手動管理迴圈的生命週期。
重複使用性	低。每次呼叫都會建立新迴圈。	高。可以在同一個迴圈執行多個任務。
使用限制	不能在已運行的迴圈中使用。	較靈活，常用於舊版代碼或測試環境。

3. 在現有迴圈中獲取結果

如果你在一個已經在運行的腳本中，想要確保某個協程執行完畢並拿到值，可以使用此方法：

import asyncio

async def add(a, b):
    return a + b

loop = asyncio.new_event_loop()
asyncio.set_event_loop(loop)

try:
    # 執行第一個任務
    val1 = loop.run_until_complete(add(10, 20))
    # 執行第二個任務
    val2 = loop.run_until_complete(add(val1, 5))
    print(f"最終結果: {val2}")
finally:
    # 必須手動關閉
    loop.close()

4. 獲取多個任務的結果

如果要讓多個協程並行執行並統一取回 return 值，需搭配 asyncio.gather：

async def task(id):
    return f"結果 {id}"

loop = asyncio.get_event_loop()
# gather 會將多個協程包裝成一個任務，run_until_complete 會等待全部完成
results = loop.run_until_complete(asyncio.gather(task(1), task(2), task(3)))
print(results)  # 輸出: ['結果 1', '結果 2', '結果 3']

5. 常見注意事項

RuntimeError： 如果你在一個已經在運行的 async def 函數內呼叫 run_until_complete，會噴出 This event loop is already running。異步函數內部請一律使用 await。
資源清理： 使用完迴圈後，應呼叫 loop.close() 以釋放資源，否則可能導致程式無法正常退出或產生警告。
回傳值類型： run_until_complete 會回傳協程 return 的數據，若協程內發生未捕捉的異常，該異常會被拋出到呼叫端。

asyncio.run() 是自 Python 3.7 之後引入的高階 API，它是啟動非同步程式最推薦的方式。它會自動負責建立事件迴圈、執行協程、並在完成後關閉迴圈。最重要的是，它會直接回傳協程中 return 的數值。

1. 基本獲取方式

你只需要將 async def 的函數呼叫傳遞給 asyncio.run()，它就會像一般同步函數一樣回傳結果。

import asyncio

async def calculate_score(name):
    print(f"正在計算 {name} 的分數...")
    await asyncio.sleep(1) # 模擬耗時任務
    return 95

# 直接獲取 return 的結果
final_score = asyncio.run(calculate_score("張小明"))

print(f"最終分數是: {final_score}") # 輸出: 95

2. 處理多個任務的結果

通常我們會定義一個 main() 函數作為進入點，並在裡面獲取所有子任務的結果，最後由 asyncio.run(main()) 統一輸出。

async def task_a():
    return "蘋果"

async def task_b():
    return "香蕉"

async def main():
    # 在 main 裡面使用 gather 同時執行
    results = await asyncio.gather(task_a(), task_b())
    return results # 回傳一個列表

# 透過 asyncio.run 拿到 main 的回傳值
all_fruits = asyncio.run(main())
print(all_fruits) # 輸出: ['蘋果', '香蕉']

3. asyncio.run() 的執行規則

規則項目	說明
單一入口	在一個執行續中，通常只呼叫一次 `asyncio.run()`。
自動清理	它會自動取消所有剩餘的任務並關閉執行緒池，非常安全。
嵌套限制	不能在已經是 `async def` 的函數內部呼叫 `asyncio.run()`。

4. 常見報錯：RuntimeError

如果你在異步函數內嘗試獲取另一個異步函數的結果，請使用 await，而不是 asyncio.run()。

# 錯誤示範
async def sub_task():
    return 10

async def main():
    # 這裡會噴錯：RuntimeError: asyncio.run() cannot be called from a running event loop
    res = asyncio.run(sub_task()) 
    
# 正確修正
async def main():
    res = await sub_task() # 在異步環境內請用 await

5. 實戰建議

最外層使用： 把 asyncio.run() 當作程式的啟動按鈕，放在 if __name__ == "__main__": 區塊中。
異常處理： 如果協程內部發生錯誤且未被捕捉，asyncio.run() 會直接將該異常拋出。建議在 run 的外層加上 try...except。
回傳類型： 無論協程回傳的是字串、字典還是自定義物件，asyncio.run() 都能完好無損地將其取出。

Python 資料分析

Python 科學運算 NumPy

NumPy (Numerical Python) 是 Python 中最重要的科學運算程式庫。它提供了高效的多維陣列物件 ndarray，以及大量用於操作這些陣列的數學函式庫。它是數據科學、機器學習（如 Pandas, Scikit-learn, TensorFlow）等領域的底層支柱。

1. 為什麼選擇 NumPy 而非原生 List？

高效能： 使用 C 語言編寫，陣列操作在連續記憶體中進行，速度遠快於 Python 內建的清單（List）。
向量化運算 (Vectorization)： 允許對整個陣列進行數學運算，而不需要編寫顯式的 for 迴圈。
廣播機制 (Broadcasting)： 自動處理不同形狀陣列之間的運算。

2. 核心物件：ndarray 基礎操作

import numpy as np

# 建立一維與二維陣列
arr1 = np.array([1, 2, 3])
arr2 = np.array([[1, 2], [3, 4]])

# 快速建立特定陣列
zeros = np.zeros((3, 3))    # 全為 0 的 3x3 矩陣
ones = np.ones((2, 4))      # 全為 1 的 2x4 矩陣
eye = np.eye(3)             # 3x3 單位矩陣
range_arr = np.arange(0, 10, 2) # [0, 2, 4, 6, 8]

3. 常用的陣列運算與屬性

功能	程式碼範例	說明
形狀檢查	`arr.shape`	回傳各維度的大小（如 (3, 2)）。
改變形狀	`arr.reshape(1, 6)`	在不改變數據的情況下變更維度。
矩陣乘法	`np.dot(a, b)` 或 `a @ b`	執行線性代數中的矩陣乘法。
統計函數	`np.mean()`, `np.std()`	計算平均值、標準差、最大最小值。

4. 切片與索引 (Slicing & Indexing)

NumPy 的切片語法與 Python List 相似，但更強大，支援多維度同時切割：

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 取得第二列 (index 1)
print(arr[1, :]) # [4, 5, 6]

# 取得右下角 2x2 子矩陣
print(arr[1:, 1:]) # [[5, 6], [8, 9]]

5. 安裝與版本檢查

安裝： pip install numpy 或 conda install numpy。

檢查版本：

import numpy as np
print(np.__version__)

6. 配合 Numba 使用

如先前提到，Numba 能夠完美識別 NumPy 的陣列結構，將複雜的 NumPy 運算進一步編譯為機器碼，達到接近原生 C 語言的執行極限。

Python 高效能處理大量數據 Numba

Numba 是一個開源的 JIT (Just-In-Time) 編譯器，專門設計用來加速處理大量數據的 Python 程式碼。它能將 Python 函數轉譯成機器碼，執行速度可與 C、C++ 或 Fortran 媲美，且特別適合用於 NumPy 陣列運算。

1. 核心功能與優勢

JIT 編譯： 在程式執行時即時編譯，而非提前編譯（AOT）。
支援 NumPy： 針對 NumPy 陣列與函數有極佳的優化效果。
GPU 加速： 透過 CUDA 或是 ROCm 支援，可以將運算任務轉移至 NVIDIA 或 AMD 的顯示卡執行。
平行運算： 支援多核心 CPU 平行化處理，只需簡單的標籤即可達成。

2. 基本使用範例

使用 Numba 最簡單的方式就是加上 @jit 或 @njit 裝飾器（Decorator）。

from numba import njit
import numpy as np

# @njit 代表 "nopython" 模式，保證不進入 Python 解析器，速度最快
@njit
def fast_function(n):
    total = 0
    for i in range(n):
        total += i
    return total

# 第一次呼叫會進行編譯，第二次呼叫則直接執行機器碼
print(fast_function(10000000))

3. 模式比較：nopython vs object

模式	裝飾器	說明
nopython 模式	`@njit`	推薦使用。完全脫離 Python 直譯器，直接編譯為機器碼。若程式碼含無法編譯的部分會報錯。
object 模式	`@jit`	若無法編譯，則退回到 Python 解析器執行。通常效能提升有限。

4. 常用技巧：平行運算

若要利用 CPU 的多核心能力，只需開啟 parallel=True 並使用 prange。

from numba import njit, prange

@njit(parallel=True)
def parallel_sum(A):
    s = 0
    # prange 會自動將迴圈分配到不同的 CPU 核心
    for i in prange(A.shape[0]):
        s += A[i]
    return s

5. 安裝與依賴檢查

安裝指令： pip install numba 或 conda install numba。
依賴項： Numba 依賴 LLVM 編譯器框架（透過 llvmlite 庫）。
檢查安裝：
```
import numba
print(numba.__version__)
```

6. 使用限制

非純數值計算： Numba 在處理 Python 的 dict、list 或自定義物件時效能不佳。
編譯開銷： 第一次執行函數時會因為編譯而有短暫延遲。
第三方庫： 除非 Numba 官方有支援（如 NumPy），否則無法編譯大部分的第三方庫函數。

Pandas 資料分析工具

什麼是 Pandas？

Pandas 是一個基於 Python 的資料分析與操作工具，專門用於處理結構化數據，例如表格數據或時間序列數據。

Pandas 的核心數據結構

Series： 一維的標籤數組，可以看作帶索引的清單。
DataFrame： 二維的數據結構，類似於電子表格或 SQL 表格。

Pandas 的主要功能

讀取和寫入多種格式的數據（如 CSV、Excel、JSON、SQL）。
數據清理與預處理，例如填補缺失值和刪除重複值。
數據篩選、分組和聚合操作。
時間序列分析與處理。
整合其他數據科學工具如 NumPy 與 Matplotlib。

使用範例

import pandas as pd

# 建立 DataFrame
data = {'姓名': ['Alice', 'Bob', 'Charlie'],
        '年齡': [25, 30, 35],
        '城市': ['台北', '台中', '高雄']}
df = pd.DataFrame(data)

# 查看數據
print(df)

# 篩選年齡大於 28 的資料
filtered_df = df[df['年齡'] > 28]
print(filtered_df)

適用場景

分析大型數據集。
處理數據清理和格式轉換任務。
快速探索與可視化數據。

為什麼選擇 Pandas？

Pandas 提供高效、靈活且直觀的操作方式，特別適合進行數據分析與處理，是數據科學和機器學習中不可或缺的工具之一。

結論

Pandas 是一個功能強大的資料分析工具，無論是入門還是高階使用者，都能受益於其簡單易用的設計和廣泛的功能。

Python Googletrans

安裝 Googletrans

首先，您需要安裝 googletrans 套件。在命令列輸入以下指令：

pip install googletrans==4.0.0-rc1

注意：安裝時請確認版本是 4.0.0-rc1，因為較舊版本可能不再適用。

基本使用範例

以下是一個將英文翻譯成繁體中文的範例：


from googletrans import Translator

# 初始化 Translator 物件
translator = Translator()

# 翻譯文字
text = "Hello, how are you?"
result = translator.translate(text, src="en", dest="zh-tw")

# 輸出翻譯結果
print("原文:", text)
print("翻譯:", result.text)

支援的語言代碼

您可以翻譯多種語言，以下是常見的語言代碼：

英文：en
繁體中文：zh-tw
簡體中文：zh-cn
日文：ja
韓文：ko
法文：fr
德文：de

注意事項

Googletrans 是非官方的 Google 翻譯 API，因此有可能因為 Google 端的更改而停止運作。如果發現翻譯功能失效，請考慮使用其他翻譯 API，例如 Google 官方的 Cloud Translation API。

Python 其他翻譯kit

DeepL Translator

DeepL 提供準確性較高的翻譯服務，但需要 API key 才能使用其開發者 API。

Microsoft Translator

由 Microsoft 提供的翻譯工具，支援多語言翻譯，但需使用 Azure 的 API key 設定。

Amazon Translate

Amazon Web Services (AWS) 提供的翻譯服務，針對多語言文本進行高效翻譯，需透過 AWS 提供的 API key 訪問。

LibreTranslate

LibreTranslate 是開源的翻譯工具，可自行架設服務器，不需要 API key。部分第三方公共伺服器也提供無需 API key 的使用選項。

TextBlob

TextBlob 是一個基於自然語言處理的工具，內建 Google Translate 的功能，但較舊版本的實現可無需 API key，可能需要注意版本支持。

MyMemory

MyMemory 提供基於記憶的翻譯，部分功能不需要 API key，但高級使用可能需申請。

結論

在 Googletrans 的競爭對手中，像 LibreTranslate 和部分版本的 TextBlob 提供了無需 API key 的選擇。如果需要完全免費且無需額外設定的工具，可考慮這些選項。

OpenCC 中文轉換

OpenCC (Open Chinese Convert) 是一個致力於中文簡繁轉換的開源專案。它不僅僅是簡單的字對字轉換，更重要的是它處理了詞彙級別的轉換以及不同地區（中國大陸、台灣、香港）的用字習慣差異。

1. OpenCC 的核心優勢

精準轉換： 能夠區分「發 (發達)」與「發 (頭髮)」等一簡對多繁的情境。
地區化支援： 支援台灣正體、香港繁體與中國大陸簡體之間的術語轉換（例如：軟體 vs 軟件）。
高效能： 使用 C++ 開發，並提供 Python、Node.js、Java 等多種語言介面。
自定義字典： 允許使用者建立自己的轉換規則。

2. Python 安裝與基礎使用

在 Python 中，最常用的封裝庫是 opencc-python-reimplemented。

# 安裝指令
pip install opencc-python-reimplemented

# 基本程式碼範例
from opencc import OpenCC

# 初始化，s2t 代表 Simplified to Traditional (簡轉繁)
cc = OpenCC('s2t') 
text = "人工智能改变了世界"
result = cc.convert(text)

print(result) # 輸出: 人工智能改變了世界

3. 常用轉換模式對照表

模式名稱	說明	適用情境
s2t	簡體到繁體	標準字對字簡轉繁。
t2s	繁體到簡體	標準字對字繁轉簡。
s2twp	簡體到台灣正體 (含詞彙)	最常用於台灣。會將「軟件」轉為「軟體」。
tw2s	台灣正體到簡體	將台灣慣用語轉為大陸簡體。
s2hk	簡體到香港繁體	符合香港地區用字習慣（如「裡」轉為「裏」）。

4. 命令行工具 (CLI)

如果你不想寫程式，OpenCC 也可以直接在終端機操作：

# 將 input.txt 轉換為 output.txt，使用簡轉台繁模式
opencc -i input.txt -o output.txt -c s2twp.json

5. 常見問題與提醒

一簡對多繁： 雖然 OpenCC 表現優異，但在極少數極端語境下仍可能出錯，建議重要文件仍需人工校對。
環境依賴： 原生 OpenCC 需要 C 執行環境，若在安裝 Python 庫時報錯，請嘗試使用 reimplemented 版本。
JSON 配置： 轉換邏輯是由 .json 檔案定義的，你可以去 OpenCC 的安裝目錄查看這些字典是如何運作的。

Python 查詢中文的注音

以下範例將展示如何使用 Python 來查詢中文字符的所有注音。我們使用 pypinyin 套件來取得中文字的拼音，並自訂拼音轉注音符號的對應表。

步驟 1：安裝 pypinyin 套件

pip install pypinyin

步驟 2：Python 程式碼範例

以下是 Python 程式碼，包含注音對應表及查詢並生成 HTML 結果的程式邏輯。


from pypinyin import pinyin, Style
from jinja2 import Template

# 拼音到注音的簡易對應表
pinyin_to_zhuyin = {
    "a": "ㄚ", "ai": "ㄞ", "an": "ㄢ", "ang": "ㄤ", "ao": "ㄠ",
    "ba": "ㄅㄚ", "bai": "ㄅㄞ", "ban": "ㄅㄢ", "bang": "ㄅㄤ", "bao": "ㄅㄠ",
    # 省略部分對應，需自行完善
    "hao": "ㄏㄠ", "hao": "ㄏㄠ", "hǎo": "ㄏㄠˇ", "hào": "ㄏㄠˋ"
}

# 查詢中文字符的所有拼音並轉換為注音
def get_zhuyin(char):
    pinyins = pinyin(char, style=Style.NORMAL, heteronym=True)
    unique_pinyins = set(pinyins[0])
    zhuyins = {p: pinyin_to_zhuyin.get(p, p) for p in unique_pinyins}  # 將拼音轉換為注音
    return list(zhuyins.values())

# 查詢字符
chinese_char = '好'  # 可更換成其他字
zhuyin_results = get_zhuyin(chinese_char)

說明

pinyin 到注音轉換：使用 pinyin_to_zhuyin 字典來將拼音對應為注音符號。該對應表需自行擴充。
Jinja2 模板：利用 Jinja2 模板生成 HTML，並將結果輸出到網頁顯示。
多音字支援：使用 heteronym=True 確保多音字所有讀音皆會顯示出來。

Python 儲存

檢查檔案或資料夾是否存在

使用 os.path

import os

# 檢查是否為檔案
if os.path.isfile("example.txt"):
    print("檔案存在")

# 檢查是否為資料夾
if os.path.isdir("my_folder"):
    print("資料夾存在")

# 檢查檔案或資料夾是否存在
if os.path.exists("path/to/check"):
    print("路徑存在")

使用 pathlib（Python 3.4+）

from pathlib import Path

path = Path("example.txt")

if path.exists():
    print("路徑存在")

if path.is_file():
    print("是檔案")

if path.is_dir():
    print("是資料夾")

Python 檔案操作

在 Python 中，處理檔案複製、移動、重新命名與刪除，最標準且強大的模組是 shutil（用於高階操作）以及 os（用於基礎路徑操作）。

1. 檔案複製操作 (Copy)

複製操作根據是否需要保留元數據（如建立時間、權限）有不同的函式：

shutil.copy(來源, 目的)： 複製檔案內容與權限，目的可以是一個目錄。
shutil.copy2(來源, 目的)： 最推薦使用，會儘可能完整保留檔案的所有元數據（時間戳記等）。
shutil.copytree(來源資料夾, 目的資料夾)： 遞迴複製整個目錄及其內部所有內容。

import shutil

# 複製單一檔案
shutil.copy2('source.txt', 'destination.txt')

# 複製整個資料夾（目的資料夾必須不存在）
shutil.copytree('my_folder', 'backup_folder')

2. 檔案移動與重新命名 (Move / Rename)

移動與重新命名在底層邏輯上是非常相似的。使用 shutil.move 可以跨磁碟執行，而 os.rename 則常用於同磁碟的更名。

功能	常用指令	說明
移動檔案或目錄	`shutil.move(src, dst)`	將檔案或整個目錄移至新路徑，支援跨分割區。
重新命名檔案	`os.rename(old, new)`	更改檔案或目錄名稱。

import shutil
import os

# 移動檔案
shutil.move('test.txt', 'archive/test.txt')

# 重新命名
os.rename('old_name.txt', 'new_name.txt')

3. 檔案刪除操作 (Remove)

刪除操作需謹慎使用，因為這些指令通常不會經過資源回收筒，而是直接永久移除。

os.remove(路徑)： 刪除單一檔案。如果路徑是目錄會報錯。
os.rmdir(路徑)： 刪除空目錄。
shutil.rmtree(路徑)： 強制刪除整個目錄樹（包含內部所有檔案與子目錄）。

# 刪除單一檔案
if os.path.exists('temp.txt'):
    os.remove('temp.txt')

# 強力刪除整個資料夾
shutil.rmtree('old_data_folder')

4. 路徑與狀態檢查

在執行複製或移動前，先檢查路徑是否存在可以避免程式崩潰：

os.path.exists(path)： 檢查路徑是否存在。
os.path.isfile(path)： 檢查是否為檔案。
os.path.isdir(path)： 檢查是否為目錄。

5. 注意事項與建議

路徑處理： 建議使用 os.path.join() 或 pathlib 模組來組合路徑，以確保程式在 Windows (反斜線) 與 Linux (正斜線) 之間皆能運作。
例外處理： 檔案操作容易因為權限不足或檔案被佔用而失敗，建議使用 try...except 包裹。
覆蓋行為： shutil.copy 和 shutil.move 在目的路徑已存在同名檔案時，通常會直接覆蓋，執行前應確認是否需要更名避開。

logging 套件

Python 的 logging 套件是一個強大的內建模組，用於應用程式中進行有效的日誌管理。無論是記錄調試信息、錯誤追蹤，還是性能監控，logging 套件都能提供多層級、多格式的日誌記錄方式。

基本概念

Logger：日誌器，負責創建和管理日誌消息。
Handler：處理器，用於決定日誌的輸出位置，例如主控台、文件、網絡等。
Formatter：格式器，定義日誌消息的輸出格式。
Level：級別，設定日誌的嚴重性級別，例如 DEBUG、INFO、WARNING、ERROR 和 CRITICAL。

範例代碼

以下是一個基本的 logging 套件配置範例：

import logging

# 設定 logger
logger = logging.getLogger('my_logger')
logger.setLevel(logging.DEBUG)

# 設置 Handler
console_handler = logging.StreamHandler()
file_handler = logging.FileHandler('app.log')

# 設置 Formatter
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
console_handler.setFormatter(formatter)
file_handler.setFormatter(formatter)

# 添加 Handler 到 logger
logger.addHandler(console_handler)
logger.addHandler(file_handler)

# 測試不同級別的日誌
logger.debug('這是一條調試訊息')
logger.info('這是一條信息訊息')
logger.warning('這是一條警告訊息')
logger.error('這是一條錯誤訊息')
logger.critical('這是一條嚴重訊息')

日誌等級

logging 支援以下日誌級別：

DEBUG：最低層級，用於調試資訊。
INFO：普通資訊，如系統運行狀態。
WARNING：警告資訊，但並不會導致程式停止。
ERROR：錯誤資訊，通常會因錯誤引發問題。
CRITICAL：最嚴重的錯誤，可能導致程式終止。

自訂輸出格式

可以使用 Formatter 類來定義日誌的輸出格式。例如：

formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')

這個格式會輸出類似於以下內容：

2024-10-25 10:00:00 - my_logger - INFO - 這是一條信息訊息

小結

logging 套件提供了多樣化的日誌管理選項，讓開發者可以根據需求自訂日誌級別、輸出格式及目的地，提升應用程式的可維護性及除錯效率。

Logging Handler

在 Python 的 logging 套件中，Handler 是一個關鍵的組件，負責定義日誌的輸出位置。不同的處理器可以將日誌輸出到不同的目標位置，包括控制台、文件、網絡、甚至是郵件。StreamHandler 是最常用的處理器之一，它負責將日誌輸出到控制台。

主要處理器（Handler）

在 logging 中，一些常見的 Handler 包括：

StreamHandler：將日誌輸出到 stdout 或 stderr（通常是控制台）。
FileHandler：將日誌輸出到文件。
NullHandler：忽略日誌輸出，適用於不需要顯示的情境。
SMTPHandler：將日誌透過電子郵件發送。

StreamHandler 與 Console Output 的關係

StreamHandler 是控制台輸出最常用的處理器，它通常會將日誌消息發送到標準錯誤（stderr）。透過設定 StreamHandler，可以讓日誌直接在控制台顯示，適合即時監控系統的狀態。

如果不希望日誌顯示在控制台上，可以從 Logger 中移除 StreamHandler，或者改用 NullHandler 來避免輸出。

範例代碼：移除 Console Output

以下範例展示了如何配置 logging 並移除控制台輸出的 StreamHandler：

import logging

# 設定 Logger
logger = logging.getLogger('my_logger')
logger.setLevel(logging.DEBUG)

# 添加 StreamHandler 以輸出至控制台
console_handler = logging.StreamHandler()
logger.addHandler(console_handler)

# 測試輸出
logger.info("這條消息將顯示在控制台")

# 移除控制台輸出
logger.removeHandler(console_handler)
logger.info("這條消息將不會顯示在控制台")

如何使用 NullHandler 避免 Console Output

可以使用 NullHandler 來禁用日誌的所有輸出：

import logging

# 設定 Logger 並添加 NullHandler
logger = logging.getLogger('my_logger')
logger.addHandler(logging.NullHandler())

# 這條訊息不會顯示在控制台
logger.info("這條消息將不會顯示")

小結

Handler 是 logging 套件中定義輸出位置的組件。透過 StreamHandler，日誌消息可以顯示在控制台，便於即時監控。若不需要控制台輸出，可以移除 StreamHandler 或使用 NullHandler 來禁用日誌輸出。

Python 日誌執行緒 ID

修改日誌格式

要在 logging.Formatter 中包含執行緒 ID（Thread ID），您可以使用格式字串中的 %(thread)d 屬性。這會顯示系統分配給該執行緒的唯一整數 ID。

import logging

# 加入 %(thread)d 來顯示執行緒 ID
log_formatter = logging.Formatter(
    '%(asctime)s.%(msecs)03d %(thread)d %(levelno)s %(message)s', 
    "%Y-%m-%d %H:%M:%S"
)

# 範例輸出：
# 2025-12-20 16:30:45.123 140735612345678 20 這是日誌訊息

常用執行緒相關屬性

除了整數 ID，您也可以根據需求選擇顯示執行緒的名稱：

%(thread)d：顯示執行緒的整數 ID。
%(threadName)s：顯示執行緒的名稱（例如 MainThread 或 Thread-1）。

完整範例程式碼

這段程式碼展示了如何在多執行緒環境中應用此格式：

import logging
import threading

# 1. 設定格式化器
log_format = '%(asctime)s.%(msecs)03d [Thread:%(thread)d] %(levelno)s %(message)s'
date_format = "%Y-%m-%d %H:%M:%S"
formatter = logging.Formatter(log_format, date_format)

# 2. 設定日誌處理器
handler = logging.StreamHandler()
handler.setFormatter(formatter)

logger = logging.getLogger("ThreadTest")
logger.addHandler(handler)
logger.setLevel(logging.INFO)

# 3. 測試函式
def task():
    logger.info("子執行緒正在執行")

# 啟動測試
logger.info("主執行緒啟動")
t = threading.Thread(target=task)
t.start()
t.join()

Python資料庫

Python常用資料庫套件

關聯式資料庫（SQL）

SQLite（內建）

Python內建支援SQLite，適用於小型應用。

import sqlite3

conn = sqlite3.connect("example.db")
cursor = conn.cursor()

cursor.execute("CREATE TABLE IF NOT EXISTS users (id INTEGER PRIMARY KEY, name TEXT)")
cursor.execute("INSERT INTO users (name) VALUES (?)", ("Alice",))
conn.commit()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

MySQL（PyMySQL）

用於連接MySQL資料庫。

pip install pymysql

import pymysql

conn = pymysql.connect(host="localhost", user="root", password="password", database="test")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

PostgreSQL（psycopg2）

用於連接PostgreSQL。

pip install psycopg2

import psycopg2

conn = psycopg2.connect(dbname="testdb", user="user", password="password", host="localhost")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

SQL Server（pyodbc）

用於連接Microsoft SQL Server。

pip install pyodbc

import pyodbc

conn = pyodbc.connect("DRIVER={SQL Server}; SERVER=localhost; DATABASE=test; UID=user; PWD=password")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

非關聯式資料庫（NoSQL）

MongoDB（pymongo）

適用於文件型資料庫。

pip install pymongo

import pymongo

client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["testdb"]
collection = db["users"]

collection.insert_one({"name": "Alice", "age": 25})
print(list(collection.find()))

Redis（redis-py）

適用於快取與高效能Key-Value存取。

pip install redis

import redis

r = redis.Redis(host="localhost", port=6379, decode_responses=True)

r.set("name", "Alice")
print(r.get("name"))

Elasticsearch（elasticsearch-py）

適用於全文搜尋與分析。

pip install elasticsearch

from elasticsearch import Elasticsearch

es = Elasticsearch("http://localhost:9200")

doc = {"name": "Alice", "age": 25}
es.index(index="users", document=doc)

print(es.search(index="users", query={"match_all": {}}))

ORM框架

SQLAlchemy

支援多種SQL資料庫，提供ORM功能。

pip install sqlalchemy

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import declarative_base, sessionmaker

engine = create_engine("sqlite:///example.db")
Base = declarative_base()

class User(Base):
    __tablename__ = "users"
    id = Column(Integer, primary_key=True)
    name = Column(String)

Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine)
session = Session()

session.add(User(name="Alice"))
session.commit()

print(session.query(User).all())

結論

關聯式資料庫：sqlite3（內建）、pymysql（MySQL）、psycopg2（PostgreSQL）、pyodbc（SQL Server）。
非關聯式資料庫：pymongo（MongoDB）、redis（Redis）、elasticsearch（Elasticsearch）。
ORM框架：SQLAlchemy（支援多種SQL資料庫）。

PyMySQL

安裝PyMySQL

使用以下指令安裝PyMySQL：

pip install pymysql

連接MySQL資料庫

使用PyMySQL連接MySQL伺服器：

import pymysql

# 建立連線
conn = pymysql.connect(
    host="localhost",
    user="your_user",
    password="your_password",
    database="your_database",
    charset="utf8mb4",
    cursorclass=pymysql.cursors.DictCursor  # 返回字典格式
)

# 建立游標
cursor = conn.cursor()

# 查詢資料
cursor.execute("SELECT * FROM your_table")
result = cursor.fetchall()
for row in result:
    print(row)

# 關閉連線
cursor.close()
conn.close()

執行SQL語句

執行INSERT、UPDATE、DELETE語句時，需要提交變更：

try:
    with conn.cursor() as cursor:
        sql = "INSERT INTO users (name, age) VALUES (%s, %s)"
        cursor.execute(sql, ("Alice", 25))
    conn.commit()  # 提交變更
except Exception as e:
    conn.rollback()  # 發生錯誤時回滾
    print("發生錯誤:", e)

執行儲存程序

可以使用 callproc 呼叫儲存程序：

with conn.cursor() as cursor:
    cursor.callproc("your_stored_procedure", (param1, param2))
    result = cursor.fetchall()
    print(result)

批量插入資料

使用 executemany 進行批量插入：

data = [("Bob", 30), ("Charlie", 28), ("David", 35)]
sql = "INSERT INTO users (name, age) VALUES (%s, %s)"

with conn.cursor() as cursor:
    cursor.executemany(sql, data)
conn.commit()

防止SQL注入

使用參數化查詢來防止SQL注入攻擊：

name = "Alice"
sql = "SELECT * FROM users WHERE name = %s"

with conn.cursor() as cursor:
    cursor.execute(sql, (name,))
    result = cursor.fetchall()
    print(result)

關閉連線

確保程式結束時關閉資料庫連線：

conn.close()

PyMySQL datetime 的用法

1. 插入 datetime（Python datetime → MySQL DATETIME）

PyMySQL 會自動把 datetime.datetime 轉成 MySQL DATETIME，可直接傳入。

import pymysql
import datetime

conn = pymysql.connect(
    host="localhost",
    user="root",
    password="pwd",
    database="testdb",
    cursorclass=pymysql.cursors.DictCursor
)

with conn:
    with conn.cursor() as cur:
        now = datetime.datetime.now()

        sql = """
            INSERT INTO logs (msg, created_at)
            VALUES (%s, %s)
        """

        cur.execute(sql, ("hello world", now))
        conn.commit()

2. 插入日期（Python date → MySQL DATE）

today = datetime.date.today()

sql = "INSERT INTO records (start_date) VALUES (%s)"
cur.execute(sql, (today,))
conn.commit()

3. 查詢 datetime（MySQL DATETIME → Python datetime）

查到的欄位會自動變成 datetime.datetime 型態。

sql = "SELECT id, created_at FROM logs ORDER BY id DESC LIMIT 1"
cur.execute(sql)
row = cur.fetchone()

dt = row["created_at"]
print(dt, type(dt))
# 例如: 2025-07-01 15:22:33

4. 將查出的 datetime 格式化成字串

formatted = dt.strftime("%Y-%m-%d %H:%M:%S")
print(formatted)

5. 使用 datetime 作為查詢條件

start = datetime.datetime(2025, 1, 1, 0, 0, 0)

sql = """
    SELECT * FROM logs
    WHERE created_at >= %s
"""
cur.execute(sql, (start,))
rows = cur.fetchall()

6. 查詢某段時間內的資料

begin = datetime.datetime(2025, 1, 1)
end   = datetime.datetime(2025, 1, 31, 23, 59, 59)

sql = """
    SELECT * FROM logs
    WHERE created_at BETWEEN %s AND %s
"""
cur.execute(sql, (begin, end))
rows = cur.fetchall()

7. 若資料庫 datetime 以字串儲存（VARCHAR/CHAR），需手動解析

sql = "SELECT created_at FROM logs_str LIMIT 1"
cur.execute(sql)
row = cur.fetchone()

dt = datetime.datetime.strptime(row["created_at"], "%Y-%m-%d %H:%M:%S")
print(dt)

8. 大量插入 datetime（executemany）

items = [
    ("log1", datetime.datetime.now()),
    ("log2", datetime.datetime.now()),
]

sql = "INSERT INTO logs (msg, created_at) VALUES (%s, %s)"
cur.executemany(sql, items)
conn.commit()

結論

PyMySQL 會自動處理 datetime ↔ MySQL DATETIME，不需手動轉型。
插入資料時只要傳 Python datetime 即可。
查詢 MySQL DATETIME 時會取得 datetime.datetime 物件。
若 MySQL 中 datetime 是用字串儲存，才需要 strptime 手動解析。

從 pymysql 查詢結果取得 datetime 欄位

基本用法

import pymysql
import datetime

# 建立資料庫連線
conn = pymysql.connect(
    host='localhost',
    user='root',
    password='your_password',
    database='your_db',
    cursorclass=pymysql.cursors.DictCursor  # 以字典回傳欄位
)

with conn:
    with conn.cursor() as cursor:
        sql = "SELECT id, created_at FROM your_table LIMIT 1"
        cursor.execute(sql)
        result = cursor.fetchone()

        dt = result['created_at']  # 假設 created_at 欄位為 datetime 型態
        print(dt)
        print(type(dt))

轉換為字串

dt_str = dt.strftime("%Y-%m-%d %H:%M:%S")
print(dt_str)

如果資料是字串格式

# 若 created_at 是以字串格式儲存 (例如 CHAR / VARCHAR)
dt = datetime.datetime.strptime(result['created_at'], "%Y-%m-%d %H:%M:%S")
print(dt)

補充：cursorclass 選擇

# 若未設定 DictCursor，資料會是 tuple，取值方式如下：
cursor = conn.cursor()
cursor.execute("SELECT id, created_at FROM your_table")
row = cursor.fetchone()
dt = row[1]

取出 SQL datetime 與現在時間差

範例程式 - 與現在時間的天數差

import pymysql
import datetime

# 建立資料庫連線
conn = pymysql.connect(
    host='localhost',
    user='root',
    password='your_password',
    database='your_db',
    cursorclass=pymysql.cursors.DictCursor
)

with conn:
    with conn.cursor() as cursor:
        sql = "SELECT created_at FROM your_table LIMIT 1"
        cursor.execute(sql)
        result = cursor.fetchone()

        dt_from_sql = result['created_at']  # datetime 型態
        now = datetime.datetime.now()

        # 計算時間差
        diff = now - dt_from_sql
        print(f"相差天數: {diff.days}")

若只比較日期，不包含時間

diff = now.date() - dt_from_sql.date()
print(f"純日期差異天數: {diff.days}")

範例程式 - 與現在時間的時數差

import pymysql
import datetime

# 建立資料庫連線
conn = pymysql.connect(
    host='localhost',
    user='root',
    password='your_password',
    database='your_db',
    cursorclass=pymysql.cursors.DictCursor
)

with conn:
    with conn.cursor() as cursor:
        sql = "SELECT created_at FROM your_table LIMIT 1"
        cursor.execute(sql)
        result = cursor.fetchone()

        dt_from_sql = result['created_at']  # datetime 型態
        now = datetime.datetime.now()

        # 計算時間差
        diff = now - dt_from_sql
        hours = diff.total_seconds() / 3600
        print(f"相差小時數: {hours}")

取整數小時數

print(f"相差整數小時數: {int(hours)}")

資料庫強制更新

原理

在 MySQL 的預設儲存引擎 InnoDB 中，預設的隔離層級是 REPEATABLE READ（可重複讀）。

這意味著當您在同一個事務（Transaction）中執行第一次查詢後，MySQL 會為該事務建立一個「快照」。即使一秒後資料庫中的數據被其他程式修改了，只要您的事務還沒結束，第二次查詢依然會看到跟第一次一樣的快照資料，這就是為了保證「可重複讀」的一致性。

如何強制獲取最新數據？

方法一：手動提交事務 (最推薦)

這是最標準的做法。在執行第二次查詢前，先呼叫 connection.commit()。提交會結束當前事務，下一次查詢時 MySQL 就會建立新的快照，讀取到最新的資料。

# 第一次查詢
cursor.execute(sql)
result1 = cursor.fetchall()

# 強制更新：提交當前事務
connection.commit()

# 第二次查詢，這時會抓到最新資料
cursor.execute(sql)
result2 = cursor.fetchall()

方法二：開啟自動提交模式 (Autocommit)

如果您希望每一條 SQL 指令都立即生效且看到最新結果，可以在建立連線後開啟自動提交。這樣每一條 execute() 都會被視為獨立的事務。

connection.autocommit = True
# 之後所有的 execute(sql) 都會直接讀取資料庫最新狀態

方法三：調整隔離層級

您可以將隔離層級改為 READ COMMITTED（讀取提交內容）。在這種層級下，同一個事務內每次執行查詢都會讀取已提交的最新數據。

# 在執行查詢前設定
cursor.execute("SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED")

常見誤區：不要只檢查 Cursor

游標與連線：快取通常發生在 connection（連線）的事務範圍，而非 cursor 物件本身。如果您重新建立游標 (cursor) 但使用同一個連線且未提交，問題依然會存在。
查詢緩存 (Query Cache)：MySQL 8.0 之後已經移除了 Server 端的 Query Cache 功能，所以現代環境通常與 SQL 快取無關。

多執行緒的資料庫連線

為什麼多執行緒需要獨立連線？

在 Python 的多執行緒環境中，如果多個執行緒共用同一個資料庫連線（Connection），會導致嚴重的衝突。這是因為連線物件通常不是執行緒安全的，多個執行緒同時發送 SQL 指令或讀取結果，會造成資料錯亂、事務（Transaction）異常或連線中斷。因此，使用連線池來為每個執行緒分配獨立連線是最佳做法。

1. 使用 MySQL Connector 的連線池

mysql-connector-python 內建了簡易的連線池功能。您可以預先建立一個池子，執行緒需要時再從中「借用」連線。

import threading
import mysql.connector
from mysql.connector import pooling

# 1. 建立連線池 (全域變數)
db_config = {
    "host": "localhost",
    "user": "root",
    "password": "password",
    "database": "test_db"
}

connection_pool = mysql.connector.pooling.MySQLConnectionPool(
    pool_name="my_pool",
    pool_size=5, # 設定池子大小，應大於等於執行緒數量
    **db_config
)

# 2. 執行緒任務函式
def thread_task(task_id):
    conn = None
    try:
        # 從池中取得獨立連線
        conn = connection_pool.get_connection()
        cursor = conn.cursor()
        
        # 執行操作
        cursor.execute("SELECT NOW()")
        result = cursor.fetchone()
        print(f"執行緒 {task_id} 讀取時間: {result}")
        
        # 注意：在此隔離層級下，若有修改記得 commit
        # conn.commit()

    except Exception as e:
        print(f"執行緒 {task_id} 發生錯誤: {e}")
    finally:
        # 重要：關閉 cursor 與連線 (此處 close 會將連線還回池中，而非真正中斷)
        if conn and conn.is_connected():
            cursor.close()
            conn.close()

# 3. 啟動多個執行緒
threads = []
for i in range(3):
    t = threading.Thread(target=thread_task, args=(i,))
    threads.append(t)
    t.start()

for t in threads:
    t.join()

2. 使用 SQLAlchemy 的連線池 (業界常用)

如果您開發的是較大型的應用，SQLAlchemy 提供了更強大且自動化的連線管理（QueuePool）。它能自動處理連線失效、回收與執行緒分配。

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker

# 建立 Engine 時會自動啟用連線池
engine = create_engine(
    "mysql+mysqlconnector://root:password@localhost/test_db",
    pool_size=10,
    max_overflow=20
)

# 使用 sessionmaker 確保每個執行緒獲得獨立的 Session
Session = sessionmaker(bind=engine)

def sqlalchemy_task():
    session = Session()
    try:
        # 執行操作
        # session.execute(...)
        session.commit()
    finally:
        session.close() # 歸還連線

實作注意事項

pool_size：連線池的大小必須根據執行緒的併發量調整。如果執行緒多於連線，後來的執行緒會進入等待狀態。
上下文管理 (Context Manager)：建議盡可能使用 with 語法來管理 cursor 和 connection，確保即使發生異常也能歸還連線。
Transaction 完整性：每個執行緒在工作結束前應明確執行 commit() 或 rollback()，否則該連線回到池中時可能帶有未完成的事務狀態，影響下一個使用者。

Python呼叫儲存程序

使用MySQL

若要在Python中執行MySQL的儲存程序，可以使用 mysql-connector-python 或 PyMySQL。

安裝套件

pip install mysql-connector-python

範例：執行儲存程序

import mysql.connector

# 連接資料庫
conn = mysql.connector.connect(
    host="localhost",
    user="your_user",
    password="your_password",
    database="your_database"
)
cursor = conn.cursor()

# 呼叫儲存程序
cursor.callproc("your_stored_procedure", (param1, param2))

# 取得結果
for result in cursor.stored_results():
    print(result.fetchall())

# 關閉連線
cursor.close()
conn.close()

使用SQL Server

若要在Python中執行SQL Server的儲存程序，可以使用 pyodbc。

安裝套件

pip install pyodbc

範例：執行儲存程序

import pyodbc

# 連接SQL Server
conn = pyodbc.connect("DRIVER={SQL Server};"
                      "SERVER=your_server;"
                      "DATABASE=your_database;"
                      "UID=your_user;"
                      "PWD=your_password")
cursor = conn.cursor()

# 執行儲存程序
cursor.execute("{CALL your_stored_procedure (?, ?)}", (param1, param2))

# 取得結果
rows = cursor.fetchall()
for row in rows:
    print(row)

# 關閉連線
cursor.close()
conn.close()

使用PostgreSQL

若要在Python中執行PostgreSQL的儲存程序，可以使用 psycopg2。

安裝套件

pip install psycopg2

範例：執行儲存程序

import psycopg2

# 連接PostgreSQL
conn = psycopg2.connect(
    dbname="your_database",
    user="your_user",
    password="your_password",
    host="localhost",
    port="5432"
)
cursor = conn.cursor()

# 執行儲存程序
cursor.callproc("your_stored_procedure", (param1, param2))

# 取得結果
rows = cursor.fetchall()
for row in rows:
    print(row)

# 關閉連線
cursor.close()
conn.close()

注意事項

確保儲存程序名稱正確，並根據需求傳入適當的參數。
若儲存程序有返回值，請使用 fetchall() 或 stored_results() 來獲取結果。
不同資料庫的呼叫語法可能略有不同，請根據使用的資料庫進行調整。

Python網路

HTTP 請求套件 requests

說明

requests 是 Python 最常用的 HTTP 請求套件，用於存取 REST API、下載網頁、送出表單資料等。它比內建的 urllib 更簡潔易用。

安裝方式


pip install requests

基本用法


import requests

# 發送 GET 請求
url = "https://api.pionex.com/api/v1/common/symbols"
response = requests.get(url)

# 檢查是否成功
if response.status_code == 200:
    data = response.json()
    print("請求成功，回傳欄位：", list(data.keys()))
else:
    print("請求失敗:", response.status_code)

POST 請求範例


import requests

url = "https://httpbin.org/post"
payload = {"key": "value", "symbol": "BTC_USDT"}
headers = {"Content-Type": "application/json"}

res = requests.post(url, json=payload, headers=headers)
print(res.json())

常用方法

方法	用途
`requests.get()`	取得資料（最常用）
`requests.post()`	送出資料或表單
`requests.put()`	更新資料
`requests.delete()`	刪除資料
`response.status_code`	HTTP 狀態碼
`response.json()`	解析 JSON 回應
`response.text`	取得原始文字內容
`response.raise_for_status()`	自動拋出 HTTP 錯誤例外

錯誤處理範例


import requests

try:
    r = requests.get("https://api.pionex.com/api/v1/unknown")
    r.raise_for_status()
except requests.exceptions.HTTPError as e:
    print("HTTP 錯誤:", e)
except requests.exceptions.RequestException as e:
    print("一般請求錯誤:", e)

補充

可用於 REST API、自動化爬蟲、Webhook 呼叫等。
支援 JSON、表單、檔案上傳等多種格式。
與 pandas 或 asyncio 搭配可進行大量資料擷取。

檢查 HTTP 狀態碼

說明

raise_for_status() 是 requests 模組中 Response 物件的方法，用來檢查 HTTP 回應狀態碼是否為錯誤（例如 4xx 或 5xx）。

如果狀態碼顯示請求失敗，它會自動拋出 requests.exceptions.HTTPError 例外，方便偵錯或停止執行。

範例


import requests

url = "https://api.pionex.com/api/v1/common/symbols"
response = requests.get(url)

# 檢查 HTTP 狀態碼是否為成功 (200~299)
response.raise_for_status()

# 若成功，可安全解析 JSON
data = response.json()
print("請求成功，取得交易對數量:", len(data.get("data", [])))

執行結果


請求成功，取得交易對數量: 248

錯誤處理範例


import requests

try:
    r = requests.get("https://api.pionex.com/api/v1/invalid_endpoint")
    r.raise_for_status()
except requests.exceptions.HTTPError as e:
    print("HTTP 錯誤:", e)
except requests.exceptions.RequestException as e:
    print("請求異常:", e)

補充

成功狀態（200~299）時不會拋錯。
若 API 回應 404、500 等錯誤狀態，會自動拋出 HTTPError。
這是撰寫 REST API 程式時非常實用的安全檢查機制。

Python Web API

使用 requests 模組呼叫 API

import requests

# 呼叫 API
url = "https://api.example.com/data"
response = requests.get(url)

# 確認回應成功
if response.status_code == 200:
    print("成功取得資料")
else:
    print(f"錯誤：{response.status_code}")

解析 JSON 回應

# 解析 JSON 回應
data = response.json()

# 存取 JSON 資料
print(data["key1"])
print(data["key2"]["subkey"])

範例：呼叫和解析

import requests

# API URL
url = "https://jsonplaceholder.typicode.com/posts"

# 發送請求
response = requests.get(url)

# 檢查回應狀態並解析
if response.status_code == 200:
    data = response.json()
    # 列出每篇文章的標題
    for post in data:
        print(f"Post ID: {post['id']}, Title: {post['title']}")
else:
    print(f"API 呼叫失敗，狀態碼：{response.status_code}")

處理 JSON 例外

try:
    data = response.json()
    print(data)
except ValueError:
    print("回應不是有效的 JSON 格式")

注意事項

總結

JSON cache

說明

Python 提供 json 模組來將資料轉換（序列化）成 JSON 格式，並可將其儲存成檔案（dump）或重新載入（load）以達到快取（cache）效果。

常用函式

json.dump(obj, file)：將 Python 物件寫入檔案（JSON 格式）。
json.dumps(obj)：將物件轉成 JSON 字串。
json.load(file)：從檔案讀取 JSON 並轉回 Python 物件。
json.loads(str)：將 JSON 字串轉回 Python 物件。

範例：將資料快取到檔案再讀取


import json
import os

cache_file = "data_cache.json"

# 模擬資料來源
data = {
    "name": "Alice",
    "age": 30,
    "hobbies": ["reading", "music", "coding"]
}

# 將資料寫入 JSON 檔案（dump）
with open(cache_file, "w", encoding="utf-8") as f:
    json.dump(data, f, ensure_ascii=False, indent=2)

print("資料已快取到檔案。")

# 從檔案讀取 JSON 資料（load）
if os.path.exists(cache_file):
    with open(cache_file, "r", encoding="utf-8") as f:
        loaded_data = json.load(f)
    print("載入的資料：", loaded_data)

輸出結果


資料已快取到檔案。
載入的資料： {'name': 'Alice', 'age': 30, 'hobbies': ['reading', 'music', 'coding']}

說明

ensure_ascii=False：確保中文字不被轉為 Unicode 編碼。
indent=2：讓 JSON 檔案有縮排，較易讀。
json.load() 會自動將 JSON 還原成 dict、list、int、str 等對應型別。

範例：用 JSON 快取計算結果


import json, os

CACHE_PATH = "result_cache.json"

def expensive_calculation():
    print("執行複雜運算中...")
    return [x**2 for x in range(5)]

def get_cached_result():
    # 若快取存在則載入
    if os.path.exists(CACHE_PATH):
        with open(CACHE_PATH, "r") as f:
            return json.load(f)
    # 否則計算後寫入快取
    result = expensive_calculation()
    with open(CACHE_PATH, "w") as f:
        json.dump(result, f)
    return result

data = get_cached_result()
print("取得資料：", data)

輸出結果（第一次執行）


執行複雜運算中...
取得資料： [0, 1, 4, 9, 16]

輸出結果（第二次執行）


取得資料： [0, 1, 4, 9, 16]

總結

json.dump()：寫入 JSON 檔案。
json.load()：從 JSON 檔案讀取。
可用於快取（cache）計算結果，減少重複運算。
若需快速測試可用 dumps() 與 loads() 處理字串。

標準 JSON 結構建議

1. 推薦結構：列表 (List) 儲存

這是儲存一系列相同格式記錄的最標準、最常見的做法。將所有數據點作為一個列表（在 JSON 中對應方括號 []）的元素。

[
    {"time": 1759028400000, "open": "109398.3", "close": "109364.8", "high": "109489.2", "low": "109364.8", "volume": "518.7594"},
    {"time": 1759024800000, "open": "109305.6", "close": "109398.3", "high": "109496.4", "low": "109296.0", "volume": "757.0290"},
    ...
]

Python 實作方式

在 Python 中，您只需建立一個包含字典的列表，然後使用 json.dumps() 進行序列化。

import json

data_list = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'}
]

json_output = json.dumps(data_list, indent=4)
# print(json_output)

2. 替代結構：以時間戳為鍵的字典 (Dictionary)

如果每個數據點的 time 值是唯一的，您可以將其作為頂層物件的鍵 (Key)，來建立一個字典結構。這種結構方便透過時間戳直接查詢特定數據。

{
    "1759028400000": {"open": "109398.3", "close": "109364.8", "high": "109489.2", "low": "109364.8", "volume": "518.7594"},
    "1759024800000": {"open": "109305.6", "close": "109398.3", "high": "109496.4", "low": "109296.0", "volume": "757.0290"},
    ...
}

Python 實作方式

您需要遍歷數據列表，將每個數據點的 time 值取出作為字典的鍵。

import json

source_data = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'}
]

data_dict = {}
for item in source_data:
    # 確保時間戳是字串，因為 JSON 鍵必須是字串
    time_key = str(item['time']) 
    
    # 複製或創建新的字典，並移除 'time' 欄位，因為它現在是鍵
    value_data = item.copy()
    del value_data['time']
    
    data_dict[time_key] = value_data

json_output = json.dumps(data_dict, indent=4)
# print(json_output)

將資料庫資料轉換為 JSON 列表

在 Python 中，使用內建的 json 模組是將 Python 資料結構（例如列表和字典）序列化為 JSON 格式的最佳方式。您的目標結構在 Python 中對應於一個包含字典的列表。

1. 資料庫查詢結果

假設您從資料庫查詢獲得的資料已經是一個列表，其中的每個元素都是一個字典，鍵名與您想要的 JSON 欄位名稱一致。

db_data = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'},
    # ... 更多數據
]

2. 轉換步驟：使用 `json.dumps()`

您只需要匯入 json 模組，並使用 json.dumps() 函式將 Python 列表物件轉換為 JSON 格式的字串。

import json

# 假設 db_data 已經準備好

# 使用 json.dumps() 將 Python 列表序列化為 JSON 字串
# indent=4 用於美化輸出，使其易於閱讀
json_output_string = json.dumps(db_data, indent=4)

print(json_output_string)

3. 輸出結果 (JSON 格式字串)

這將產生一個符合您目標的 JSON 字串：

[
    {
        "time": 1759028400000,
        "open": "109398.3",
        "close": "109364.8",
        "high": "109489.2",
        "low": "109364.8",
        "volume": "518.7594"
    },
    {
        "time": 1759024800000,
        "open": "109305.6",
        "close": "109398.3",
        "high": "109496.4",
        "low": "109296.0",
        "volume": "757.0290"
    }
]

4. 從原始資料庫查詢結果到列表的常見處理

如果您的資料庫驅動程式返回的是元組 (tuple) 列表（例如：[(1759028400000, '109398.3', ...), ...]），您需要先將其轉換為字典列表，才能進行上述的序列化。

# 假設欄位名稱如下
field_names = ['time', 'open', 'close', 'high', 'low', 'volume']
tuple_data = [
    (1759028400000, '109398.3', '109364.8', '109489.2', '109364.8', '518.7594'),
    # ...
]

# 列表推導式 (List Comprehension)
list_of_dicts = [
    dict(zip(field_names, row)) 
    for row in tuple_data
]

# 現在 list_of_dicts 就可以直接傳給 json.dumps() 進行序列化。

Python Web API JSON 輸出

在 Python 中，實作 Web API 並輸出 JSON 的方式取決於你使用的框架。最直接對應 PHP echo json_encode() 的邏輯是使用 Python 內建的 json 模組，但在 Web 環境中，通常會透過框架提供的工具來自動處理標頭（Headers）。

1. 使用 FastAPI (目前最推薦)

FastAPI 是現代 Python 開發的首選，它會自動將 Python 的 dict (字典) 或 list (列表) 轉換為 JSON 並設定正確的 Content-Type。

from fastapi import FastAPI

app = FastAPI()

@app.get("/api/stocks")
def get_stocks():
    # 直接回傳 Python 字典，FastAPI 會自動處理 json_encode
    data = ["AAPL", "TSLA", "NVDA", "GOOGL"]
    return {"stocks": data}

2. 使用 Flask (最經典)

在 Flask 中，官方提供 jsonify 函式，它除了轉換資料外，還會幫你把 Response Header 設為 application/json。

from flask import Flask, jsonify

app = Flask(__name__)

@app.route('/api/stocks')
def get_stocks():
    data = ["AAPL", "TSLA", "NVDA", "GOOGL"]
    # 相當於 PHP 的 echo json_encode($data) 並加上 Header
    return jsonify(data)

3. 使用 Django Ninja / REST Framework

如果你使用的是大型框架 Django，通常會使用 JsonResponse 物件。

from django.http import JsonResponse

def stock_api(request):
    data = {"stocks": ["AAPL", "TSLA"]}
    return JsonResponse(data)

4. 原生 Python (非 Web 環境)

如果你只是想單純得到 JSON 字串（例如寫入檔案或自定義輸出），可以使用 json.dumps()。

import json

data = {"name": "Gemini", "age": 18}
# 這是最接近 PHP json_encode() 的底層實作
json_string = json.dumps(data)
print(json_string)

對應關係比較表

功能	PHP (Vanilla)	Python (FastAPI / Flask)
設定 JSON 標頭	`header('Content-Type: application/json')`	框架自動處理 (使用 `return dict` 或 `jsonify`)
物件轉 JSON 字串	`json_encode($data)`	`json.dumps(data)`
輸出並結束	`echo ...; exit;`	`return ...`

開發建議

自動化： Python 框架通常比原生 PHP 更聰明，你只需要 return 一個字典，它們就會幫你處理好所有的格式轉換。
效能： 如果你是在建立高效能的 API，建議選擇 FastAPI，它基於非同步（async/await）且速度接近 Node.js。

Google API

核心運作機制

Google API 主要是透過 Google Cloud Platform (GCP) 提供的服務，讓開發者能存取 Google 的各項功能（如搜尋、地圖、雲端硬碟等）。大部分的 Google API 都遵循 RESTful 架構，並使用 JSON 格式進行資料交換。

1. 存取權限控管 (Authentication)

在使用任何 Google API 之前，必須先在 Google Cloud Console 建立專案並設定驗證方式。主要分為兩種：

API Key：適用於存取公開資料（如 YouTube 公開影片資訊、Google Maps）。安全層級較低，僅限制來源。
OAuth 2.0：適用於存取使用者私有資料（如讀取使用者的 Gmail、修改雲端硬碟檔案）。需要使用者授權。
服務帳戶 (Service Account)：適用於伺服器對伺服器 (Server-to-Server) 的溝通，不需人工介入授權。

2. 常用庫與工具

在 Python 中，官方推薦使用以下庫來簡化開發：

google-api-python-client：通用的 API 客戶端，用於大部份的 Discovery 服務。
google-auth：專門處理身份驗證與 Token 管理。
google-cloud-storage / google-cloud-vision：針對特定雲端服務優化的客戶端庫。

3. 使用流程步驟

啟用 API：在 GCP Console 的「API 和服務」庫中搜尋並啟動需要的服務（如 YouTube Data API v3）。
建立憑證：下載 JSON 格式的私鑰（服務帳戶）或取得 API Key。
安裝 SDK：使用 pip install google-api-python-client google-auth-httplib2 google-auth-oauthlib。
編寫程式碼：初始化 Service 物件並呼叫 execute()。

4. 重要限制與配額 (Quotas)

Google API 並非完全免費且無限制。每個 API 都有其配額計費方式：

點數制 (Units)：例如 YouTube API 每天有 10,000 點基本配額，簡單的讀取消耗 1 點，上傳影片可能消耗 1,600 點。
速率限制 (Rate Limits)：限制每秒或每分鐘的請求次數，超過會回傳 429 Too Many Requests 錯誤。

5. 常見 API 類別表

類別	代表性 API	主要用途
工作自動化	Google Sheets / Calendar / Gmail	自動化表單、排程、發送郵件。
數據與儲存	Cloud Storage / BigQuery	存放大型檔案、執行大數據分析。
人工智慧	Vision / Translation / Natural Language	圖片辨識、文字翻譯、情緒分析。
多媒體	YouTube Data API	搜尋影片、管理頻道內容。

Google API Service

核心概念

在 Python 中使用 Google API（如 YouTube, Drive, Gmail 等），通常是透過 google-api-python-client 庫中的 build 函式來建立一個 Service 物件。這個物件封裝了所有的 API 方法，是您與 Google 伺服器溝通的主要管道。

1. 基本初始化方法

要建立一個 Service 物件，您需要 API 名稱、版本以及驗證金鑰（API Key）或憑證（OAuth2）。

from googleapiclient.discovery import build

# 初始化 YouTube Data API v3
youtube = build(
    'youtube', 
    'v3', 
    developerKey='YOUR_API_KEY'
)

# 呼叫 API 範例
request = youtube.videos().list(part="snippet", id="dQw4w9WgXcQ")
response = request.execute()

2. 處理執行緒安全 (Thread Safety)

這正是您之前遇到崩潰的核心原因。build() 產生的 Service 物件及其內部的 http 傳輸層物件不是執行緒安全的。在多執行緒環境中，請務必遵循以下原則：

不要全域共享：避免多個執行緒同時呼叫同一個 youtube.execute()。
延遲初始化：在每個執行緒的 run() 方法中才執行 build()。
使用 Scoped Service：確保每個執行緒擁有獨立的 googleapiclient.discovery.Resource 實例。

3. 優化連線效能

頻繁地呼叫 build() 會因為重複下載「探索文件（Discovery Document）」而導致效能下降（增加約 1-2 秒延遲）。您可以透過以下方式優化：

# 停用探索文件下載（如果您已經安裝了預編譯的庫或想加快速度）
# 注意：這需要您的環境中已經有相關定義
youtube = build('youtube', 'v3', developerKey='KEY', static_discovery=True)

4. 錯誤處理與配額管理

呼叫 Service 方法時，最常遇到的錯誤是 HttpError。您必須捕捉它來處理配額用盡或權限問題。

from googleapiclient.errors import HttpError

try:
    response = youtube.channels().list(part="statistics", mine=True).execute()
except HttpError as e:
    if e.resp.status == 403:
        print("API 配額已用盡或權限不足")
    elif e.resp.status == 401:
        print("身份驗證無效")
    else:
        print(f"HTTP 錯誤: {e}")

5. 常用 Service 清單

API 功能	名稱參數	版本參數
YouTube Data	'youtube'	'v3'
Google Drive	'drive'	'v3'
Google Sheets	'sheets'	'v4'
Gmail API	'gmail'	'v1'

多執行緒下 YouTube API

try...except 無法捕捉？

如果您在多執行緒中共享同一個 Google API Service 物件（例如 YoutubeApi.youtube），可能會遇到執行緒安全（Thread-safety）問題。底層的 httplib2 或 urllib3 傳輸層在多執行緒併發存取同一個連線物件時，會產生競爭條件（Race Condition），導致程式在底層網路層直接崩潰，有時甚至會觸發 C 語言層級的錯誤，導致 Python 直譯器直接關閉，這就是為什麼 try...except 攔截不到的原因。

解決方案一：為每個執行緒建立獨立的 Service 物件 (最推薦)

不要在主執行緒建立一個全域的 youtube 物件給所有人用。應該在每個執行緒啟動時，各自建立屬於自己的 API Service 實例。這樣每個執行緒都有獨立的網路連線與快取，互不干擾。

import threading
from googleapiclient.discovery import build

def get_youtube_service():
    # 每個執行緒內部呼叫此函式來建立獨立的物件
    return build('youtube', 'v3', developerKey='YOUR_API_KEY')

def thread_task(video_id):
    try:
        # 在執行緒內建立專用的 service
        local_youtube = get_youtube_service()
        request = local_youtube.videos().list(
            part="snippet,statistics",
            id=video_id
        )
        response = request.execute()
        print(f"成功取得: {video_id}")
    except Exception as e:
        print(f"執行緒錯誤: {e}")

# 啟動多執行緒
t1 = threading.Thread(target=thread_task, args=("vid1",))
t2 = threading.Thread(target=thread_task, args=("vid2",))
t1.start()
t2.start()

解決方案二：使用執行緒鎖 (Lock)

如果您不希望重複建立物件，可以使用 threading.Lock 確保同一時間只有一個執行緒能執行 execute()。這雖然會讓 API 呼叫變成排隊執行（失去併發加速效果），但能保證不會崩潰。

import threading

# 建立全域鎖
api_lock = threading.Lock()

def thread_task_with_lock(video_id):
    # 使用 with 確保鎖會自動釋放
    with api_lock:
        try:
            request = YoutubeApi.youtube.videos().list(
                part="snippet",
                id=video_id
            )
            vlist = request.execute()
        except Exception as e:
            print(f"錯誤: {e}")

解決方案三：停用 HttpLib2 的執行緒檢查 (進階)

如果您使用的是較舊版本的客戶端庫，可以在建立 service 時明確指定 http 物件，並將其設為非執行緒安全或使用 httplib2.Http() 的獨立實例。但這通常較複雜，建議優先採用方案一。

總結建議

方案一 是最佳實踐：它能維持多執行緒的併發速度，且完全避開資源共享導致的崩潰。
檢查 API 配額：多執行緒併發呼叫會極快地消耗每日 10,000 點的 Quota，請務必監控 403 錯誤。
逾時設定：建立 Service 時建議加上 socket.setdefaulttimeout(10)，避免某個執行緒因網路卡死而永久佔用資源。

Python 寄送 Email

安裝必要套件

pip install smtplib email

這兩個模組一般為 Python 內建，不需要額外安裝。

基本範例程式碼

import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart

# 設定寄件人、收件人、主旨與內容
sender = '[email protected]'
receiver = '[email protected]'
subject = '測試郵件'
body = '這是一封由 Python 發送的測試郵件。'

# 建立郵件內容
msg = MIMEMultipart()
msg['From'] = sender
msg['To'] = receiver
msg['Subject'] = subject
msg.attach(MIMEText(body, 'plain'))

# 使用 Gmail SMTP 寄送
smtp_server = 'smtp.gmail.com'
smtp_port = 587
username = '[email protected]'
password = 'your_app_password'  # 建議使用 App 密碼而非一般密碼

with smtplib.SMTP(smtp_server, smtp_port) as server:
    server.starttls()
    server.login(username, password)
    server.send_message(msg)

print('郵件已發送')

注意事項

Gmail 須開啟「應用程式專用密碼」才能正常登入。
Outlook、Yahoo 等也提供 SMTP 伺服器與 Port，設定需依各家說明。
務必妥善保管帳號密碼，避免洩露。

取得 Gmail 應用程式專用密碼

前提條件

你的 Google 帳戶已啟用「兩步驟驗證」。

步驟說明

開啟瀏覽器，前往 Google 帳戶
在左側選單中點選「安全性」
找到「登入 Google」區塊，確認「兩步驟驗證」已啟用
啟用後，會出現「應用程式密碼」選項，點選它
輸入 Google 登入密碼再次驗證
在「選擇應用程式」中選擇「郵件」，「選擇裝置」中選「其他（自訂名稱）」
輸入名稱，例如「Python Script」後按下「產生」
系統會產生一組 16 位數的應用程式密碼，複製它
在 Python 程式中用這組密碼取代你原本的 Gmail 密碼

安全建議

不要與他人分享應用程式密碼
如密碼外洩可立即移除該組密碼並重新產生

設定 Gmail 規則

前置準備

需要啟用 Gmail API。
到 Google Cloud Console 建立專案並啟用 Gmail API。
下載 OAuth 2.0 憑證 (credentials.json)。
安裝必要套件：pip install google-api-python-client google-auth-httplib2 google-auth-oauthlib

建立 Gmail 規則 (Filter)

可以透過 Gmail API 建立過濾器，例如：當寄件人是某個信箱時，自動加標籤。


from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request
import os
import pickle

# 需要的授權範圍
SCOPES = ['https://www.googleapis.com/auth/gmail.settings.basic',
          'https://www.googleapis.com/auth/gmail.modify']

def gmail_service():
    creds = None
    if os.path.exists("token.pickle"):
        with open("token.pickle", "rb") as token:
            creds = pickle.load(token)

    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file("credentials.json", SCOPES)
            creds = flow.run_local_server(port=0)

        with open("token.pickle", "wb") as token:
            pickle.dump(creds, token)

    return build("gmail", "v1", credentials=creds)

# 建立 Gmail 過濾器
def create_filter():
    service = gmail_service()

    filter_config = {
        "criteria": {
            "from": "[email protected]"  # 條件：寄件人
        },
        "action": {
            "addLabelIds": ["Label_123456"],  # Gmail 內部標籤 ID
            "removeLabelIds": ["INBOX"]       # 可選：移除收件匣
        }
    }

    result = service.users().settings().filters().create(
        userId="me",
        body=filter_config
    ).execute()

    print("建立成功，Filter ID:", result["id"])

if __name__ == "__main__":
    create_filter()

注意事項

Label_123456 是 Gmail 的標籤 ID，可透過 users().labels().list() 取得。
第一次執行會跳出瀏覽器要求 Google 帳號登入並授權。
規則建立後會在 Gmail 設定 → 篩選器與封鎖的地址中看到。

執行 Gmail 規則

前置條件

已啟用 Gmail API 並完成 OAuth 驗證。
規則 (Filter) 需先建立，Gmail 會自動套用規則於新郵件。
若要讓既有郵件也套用規則，需要透過 Gmail API 執行搜尋並手動修改標籤。

自動套用規則

Gmail API 建立的規則 (Filter) 會自動在新郵件進來時觸發，不需要額外「執行」。

讓既有郵件套用規則

可用 Gmail API 搜尋符合條件的郵件，然後批次加上標籤或移動。


from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request
import os
import pickle

SCOPES = ['https://www.googleapis.com/auth/gmail.modify']

def gmail_service():
    creds = None
    if os.path.exists("token.pickle"):
        with open("token.pickle", "rb") as token:
            creds = pickle.load(token)

    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file("credentials.json", SCOPES)
            creds = flow.run_local_server(port=0)

        with open("token.pickle", "wb") as token:
            pickle.dump(creds, token)

    return build("gmail", "v1", credentials=creds)

# 套用 Gmail 規則到既有郵件
def run_rule():
    service = gmail_service()

    # 搜尋條件，例如 from:[email protected]
    query = "from:[email protected]"
    results = service.users().messages().list(userId="me", q=query).execute()
    messages = results.get("messages", [])

    if not messages:
        print("沒有符合條件的郵件")
        return

    for msg in messages:
        service.users().messages().modify(
            userId="me",
            id=msg["id"],
            body={
                "addLabelIds": ["Label_123456"],  # 新增標籤
                "removeLabelIds": ["INBOX"]       # 移除收件匣
            }
        ).execute()

    print(f"已處理 {len(messages)} 封郵件")

if __name__ == "__main__":
    run_rule()

注意事項

Gmail API 的 Filter 只能針對新郵件自動觸發。
若要「套用規則到舊郵件」，需要自己透過搜尋 q 條件並批次修改。
可用 Gmail 搜尋語法，例如 from:, subject:, has:attachment。

Python HTTP API 伺服器

在 Python 中建立 HTTP API 伺服器，最常見和推薦的方法是使用高效且功能豐富的 Web 框架。以下介紹三種主流的框架及其特點：

1. 使用 FastAPI (推薦：高性能、現代化)

FastAPI 是一個用於建構 API 的現代化、快速（由 Starlette 和 Pydantic 驅動）的 Web 框架。它原生支援異步操作（async/await），並自動生成 OpenAPI（Swagger UI）文件。

特點

速度極快，性能與 Go 相當。
基於 Python 類型提示（Type Hints）進行資料驗證和序列化。
自動生成 API 文件 (Swagger UI / ReDoc)。

基本範例

# 安裝: pip install fastapi uvicorn
from fastapi import FastAPI

app = FastAPI()

# 定義一個根路由 (GET 請求)
@app.get("/")
def read_root():
    return {"Hello": "World"}

# 定義一個帶參數的路由
@app.get("/items/{item_id}")
def read_item(item_id: int, q: str = None):
    return {"item_id": item_id, "q": q}

# 執行伺服器 (假設檔案名為 main.py)
# 在終端機執行: uvicorn main:app --reload

2. 使用 Flask (輕量級、彈性高)

Flask 是一個微框架（Micro-framework），它保持核心精簡，讓開發者可以自由選擇資料庫、驗證函式庫等組件。它適用於小型專案或需要高度客製化的應用程式。

特點

簡單易學，啟動成本低。
極少的內建組件，高度彈性。
成熟且擁有龐大的社群支援。

基本範例

# 安裝: pip install flask
from flask import Flask, jsonify, request

app = Flask(__name__)

# 定義一個 API 路由
@app.route("/data", methods=['GET'])
def get_data():
    return jsonify({"message": "這是 Flask API 數據"})

# 定義一個 POST 路由
@app.route("/submit", methods=['POST'])
def post_data():
    data = request.get_json()
    return jsonify({"received": data}), 201

# 執行伺服器
# if __name__ == '__main__':
#     app.run(debug=True)

3. 使用 Django Rest Framework (DRF) (大型專案)

DRF 是基於功能完整的 Django Web 框架之上，用於快速建構 RESTful API 的強大工具。它提供了序列化器（Serializers）、模型視圖集（Model ViewSets）、身份驗證和權限控制等大型 API 所需的所有功能。

特點

適合與 Django ORM 及資料庫功能深度整合。
提供強大的自動化管理介面和 Web 可瀏覽 API。
功能齊全，適用於企業級應用程式。

註：DRF 的範例程式碼較長，需要先建立 Django 專案和應用程式，故此處省略，但其為大型專案的首選。

總結與建議

若追求極致性能和現代異步特性，且項目規模中等，請選擇 **FastAPI**。
若需要快速建立簡單的服務或學習 Web 開發基礎，請選擇 **Flask**。
若您的 API 是大型應用程式的一部分，且需要複雜的 ORM、權限管理等，請使用 **Django + DRF**。

Django

主要特點

ORM (物件關係對應): 允許開發者使用 Python 程式碼來操作資料庫，無需撰寫原生 SQL 指令。
管理後台 (Admin Interface): 自動生成的管理介面，方便進行資料內容的增刪改查。
安全性: 內建防止 Cross-site scripting (XSS)、Cross-site request forgery (CSRF) 與 SQL injection 的機制。
高擴展性: 採用鬆散耦合設計，適合從小型專案擴展至大型企業級應用。

MVT 架構元件

Model (模型): 定義資料結構與資料庫 Schema，負責資料層的邏輯。
View (視圖): 處理業務邏輯與 HTTP 請求，並決定要回傳哪些資料給使用者。
Template (模板): 負責呈現介面，將資料嵌入 HTML 中顯示。

系統核心組件

URL Dispatcher: 基於正規表示式的路由系統，將 URL 對應到特定的視圖函數。
Auth System: 完整的用戶認證與授權系統，包含權限組與密碼雜湊。
Middleware: 用於處理請求與回應的鉤子系統，可用於日誌記錄、Gzip 壓縮等。
Migrations: 資料庫遷移系統，追蹤 Model 的變更並同步到資料庫結構。
Forms: 提供強大的表單處理與驗證功能，簡化 HTML 表單與資料處理的互動。

Django REST

主要特性

Web Browsable API: 內建可視化網頁介面，方便開發者直接在瀏覽器中測試 API 端點。
序列化 (Serialization): 支援將複雜的資料結構（如 Querysets 或 Model 實例）轉換為 JSON、XML 或其他內容類型。
認證與權限系統: 包含 OAuth1、OAuth2、Session 以及 Token 等多種內建認證方案。
高度自定義: 從視圖邏輯到序列化方式，皆提供豐富的鉤子函數進行擴充。

核心元件

Serializers: 負責資料的雙向轉換，處理從資料庫模型到 JSON 的序列化，以及從請求數據到模型的驗證與反序列化。
ViewSets: 將多個相關視圖的邏輯封裝在單一類別中（如 List, Create, Retrieve, Update, Destroy）。
Routers: 自動處理 ViewSets 的 URL 配置，減少手動撰寫路由的工作量。
APIView: DRF 視圖的基礎類別，提供比 Django 原生 View 更強大的請求與回應處理機制。
Permissions: 決定使用者是否有權執行特定操作，例如 IsAuthenticated 或 IsAdminUser。
Throttling: 限制 API 的請求頻率，防止系統被惡意攻擊或過度負荷。
Parsers & Renderers: 負責解析傳入的請求內容（如 JSON 或 Form 資料）以及決定輸出的格式。

進階功能

Generic Views: 提供常用的預定義視圖，用於快速構建標準的 CRUD 介面。
Filtering & Searching: 整合第三方套件或內建機制，輕鬆實現資料過濾、排序與全文檢索。
Pagination: 內建多種分頁方式（如 PageNumber, LimitOffset, Cursor），提升大量數據處理效能。
Versioning: 支援多種 API 版本管理策略，確保後端更新時的向下相容性。

Django Ninja

主要優勢

高效能：基於 Pydantic 進行數據驗證與序列化，並深度優化執行速度。
非同步支援：原生支持 async/await 操作，能有效提升高併發場景下的處理能力。
自動化文件：內建 Swagger UI 與 ReDoc，只需定義好路由與型別即可自動產生互動式 API 文件。
型別安全：完全利用 Python 3.6+ 的型別提示（Type Hints），提供強大的編輯器補全與靜態檢查。
易於整合：與 Django ORM 與認證系統無縫結合，適合快速開發 RESTful API。

核心元件

NinjaAPI: 框架的核心實例，用於註冊路由、設定文件路徑以及管理全局異常處理。
Schema: 基於 Pydantic 定義的數據結構，負責請求參數的驗證與回應數據的序列化。
Router: 用於將 API 邏輯拆分到不同模組，方便管理大型專案的路由結構。
ModelSchema: 專為 Django 模型設計的 Schema，能自動從數據庫模型生成對應的欄位定義。
Authentication: 提供多種內建驗證機制，如 APIKey、HttpBasic、HttpBearer 以及 Session 認證。
Request / Response Parsers: 自動處理 JSON、表單數據、路徑參數與查詢字串的解析。

功能特性

Dependency Injection: 提供簡單的依賴注入機制，方便在不同操作中共享邏輯（如數據庫連線或配置）。
File Handling: 簡化文件上傳與下載的處理流程，並與 Django 的儲存系統集成。
Error Handling: 允許自定義異常處理器，將錯誤訊息轉換為標準的 JSON 格式回傳給客戶端。
Versioning: 支援在同一個 Django 專案中運行多個 API 版本，透過不同的路徑前綴進行區隔。

類別中實作 FastAPI 路由

雖然 FastAPI 的慣用方法是使用裝飾器 @app.get() 直接裝飾函式，但為了更好的組織和結構化大型應用程式（特別是使用依賴注入或路由模組化時），您可以將路由處理器（Route Handlers）封裝在類別中，通常稱為「APIRouter」模式或「類別式視圖」（Class-Based Views）。

這需要使用 **fastapi.APIRouter** 和 **方法裝飾器** 來達成。

1. 檔案結構與類別定義

我們將使用 APIRouter 來定義路由，然後將類別方法註冊為處理函式。

# 安裝: pip install fastapi uvicorn
from fastapi import APIRouter, FastAPI, Depends
from typing import Annotated

# 步驟 1: 建立 APIRouter 實例
router = APIRouter(
    prefix="/api/v1",  # 為此路由組設定前綴
    tags=["items"]    # 用於文件分類
)

# 步驟 2: 定義包含路由邏輯的類別
class ItemService:
    """處理所有 Item 相關的業務邏輯和路由處理"""
    
    def __init__(self, db_dependency: str):
        # 模擬依賴注入 (Dependency Injection)
        self.db_connection = db_dependency

    # 使用 @router.get 裝飾類別方法
    @router.get("/")
    def read_root(self):
        # 實作 read_root 邏輯
        return {"message": "Hello World from ItemService Class!", "db_status": self.db_connection}

    # 實作 read_item 邏輯
    # 參數 {item_id} 來自 URL 路徑
    @router.get("/{item_id}")
    def read_item(self, item_id: int, q: str | None = None):
        return {
            "item_id": item_id, 
            "query": q,
            "status": "處理完成"
        }

# 輔助函式：模擬依賴注入 (Dependency)
def get_db():
    # 在實際應用中，這會返回一個資料庫連線
    return "Database Connected Successfully"

# 步驟 3: 創建一個類別實例的工廠函式，並注入依賴
# Annotated[str, Depends(get_db)] 表示 db_connection 是由 get_db 提供的
def get_item_service(db_connection: Annotated[str, Depends(get_db)]):
    # 返回 ItemService 的一個實例
    return ItemService(db_connection)

# 步驟 4: 創建 FastAPI 應用程式主體
app = FastAPI()

# 步驟 5: 核心！使用 Depends 將 ItemService 類別的方法掛載到應用程式中
# 這裡使用 Depends 來讓 FastAPI 知道如何獲取 ItemService 的實例
app.include_router(
    router, 
    dependencies=[Depends(get_item_service)]
)

2. 運行與測試

將上述程式碼儲存為 main.py，並運行 Uvicorn 伺服器：

uvicorn main:app --reload

訪問 `/api/v1/` 會觸發 ItemService.read_root 方法。
訪問 `/api/v1/123?q=test` 會觸發 ItemService.read_item 方法。

3. 總結

這種模式的關鍵是：

使用 APIRouter 來定義路由。
在類別方法上使用 @router.get/@router.post 等裝飾器。
使用 **依賴注入 (Depends)** 來獲取類別的實例，並將其包含在 app.include_router 的 dependencies 參數中。

這樣做的好處是將業務邏輯（在 ItemService 內）與路由定義分離，提高了程式碼的模組化和測試性。

Flask 伺服器的停止

1. 開發環境中的手動停止 (最常用)

如果您是在終端機中執行 Flask 應用程式並使用 `app.run()` 啟動，最簡單的方法是使用鍵盤中斷訊號。

使用：Ctrl + C
操作：在運行 Flask 伺服器的終端機視窗中按下這個組合鍵。
原理：這會發送一個 SIGINT（中斷訊號）給 Python 程式，讓它能夠乾淨地關閉伺服器並退出。

2. 程式中自動停止 (測試或特殊場景)

在單元測試或需要執行特定操作後自動關閉伺服器的場景中，您需要透過程式碼來發送停止命令。

A. 使用 werkzeug.serving 的 Shutdown 方法 (推薦)

Flask 內建的開發伺服器實際上使用的是 Werkzeug 庫。您可以向伺服器發送一個特定的 HTTP 請求，讓它自我關閉。這需要在您的應用程式中定義一個特殊的路由。

from flask import Flask, request

app = Flask(__name__)

# 定義一個秘密的關閉路由
@app.route('/shutdown', methods=['POST'])
def shutdown_server():
    # 確保只有授權的用戶才能呼叫這個端點
    
    func = request.environ.get('werkzeug.server.shutdown')
    if func is None:
        raise RuntimeError('不在 Werkzeug 開發伺服器上運行')
    
    func() # 呼叫關閉函式
    return '伺服器正在關閉...'

# ... 其他路由 ...

# 在另一個程式或腳本中發送 POST 請求到 http://127.0.0.1:5000/shutdown 即可關閉伺服器。

B. 在單獨的執行緒或進程中運行 (非阻塞)

預設的 `app.run()` 是阻塞的。要在主程式碼中繼續執行其他邏輯，同時讓伺服器在背景運行，您需要使用 threading 或 multiprocessing 模組。

import threading
import time
from flask import Flask

app = Flask(__name__)
# ... 您的路由 ...

def run_server():
    # 注意：在生產環境中不應使用 debug=True
    app.run(port=5000)

# 在一個新的執行緒中啟動伺服器
thread = threading.Thread(target=run_server)
thread.start()

print("Flask 伺服器已在背景啟動...")

# 讓伺服器運行一段時間
time.sleep(5)

# (程式式關閉) 在這個執行緒模式下，並沒有內建的簡單關閉函式。
# 您必須使用上述的 /shutdown 路由或直接終止執行緒 (不推薦，可能不乾淨)。

# 範例：等待伺服器執行緒結束 (Ctrl+C 停止後)
# thread.join()

3. 生產環境中的停止 (使用 Gunicorn, uWSGI 等)

在生產環境中，您不會使用 `app.run()`。您會使用 WSGI 伺服器（例如 Gunicorn 或 uWSGI）。要停止這些伺服器：

使用：發送 SIGTERM 或 SIGKILL 訊號給 Gunicorn 或 uWSGI 的主程序。
操作：通常通過操作系統命令（例如 `kill ` 或使用 systemd/supervisor 服務管理）來完成。

判斷 Flask 當前的伺服器環境

當 Flask 應用程式不在預設的 Werkzeug 開發伺服器中運行時（例如在生產環境中使用 Gunicorn, uWSGI, 或其他 ASGI 伺服器），判斷當前環境最可靠的方法是檢查 **WSGI/ASGI 環境變數**（即 request.environ 或 request.scope）。

1. 使用 `request.environ` (適用於 WSGI 伺服器，例如 Gunicorn)

在 Flask 路由函式中，您可以存取 request.environ 字典，檢查由 WSGI 伺服器設定的特定鍵來判斷伺服器類型。

Python 實作範例

from flask import Flask, request, jsonify

app = Flask(__name__)

@app.route('/server_info')
def get_server_info():
    
    # 預設：假設是 Werkzeug 開發伺服器
    server_name = "Werkzeug (Development Server)"
    
    # 檢查常見的 WSGI 伺服器標識
    
    # 檢查 Gunicorn
    if 'gunicorn.version' in request.environ:
        server_name = f"Gunicorn (版本: {request.environ.get('gunicorn.version')})"
    
    # 檢查 uWSGI
    elif 'uwsgi.version' in request.environ:
        # uWSGI 通常沒有標準的 version 鍵，但有特定的環境變數
        server_name = "uWSGI"
    
    # 檢查 Waitress (常見的生產 WSGI 伺服器)
    elif 'waitress.version' in request.environ:
        server_name = f"Waitress (版本: {request.environ.get('waitress.version')})"

    # 檢查其他 WSGI 伺服器的通用標識
    elif 'SERVER_SOFTWARE' in request.environ:
        # 很多伺服器會設定這個標準 WSGI 鍵
        server_name = request.environ.get('SERVER_SOFTWARE')
        
    # 如果 werkzeug.server.shutdown 存在，則幾乎確定是 Werkzeug
    elif 'werkzeug.server.shutdown' in request.environ:
        server_name = "Werkzeug (Development Server, Shutdown Available)"
        
    return jsonify({
        "current_server": server_name,
        "is_dev_server": (server_name.startswith("Werkzeug"))
    })

# 啟動應用程式
# if __name__ == '__main__':
#     app.run(debug=True)

2. 核心判斷邏輯

在您的伺服器關閉邏輯中，您可以直接使用這個檢查來決定是否執行 `shutdown_func`：

from flask import request, jsonify

@app.route('/shutdown', methods=['POST'])
def shutdown_server():
    shutdown_func = request.environ.get('werkzeug.server.shutdown')

    if shutdown_func is None:
        # 非 Werkzeug 環境 (通常是生產環境)
        return jsonify({
            "error": "此端點僅用於開發環境。請使用操作系統指令來停止伺服器。"
        }), 400
    
    # Werkzeug 環境
    shutdown_func() 
    return jsonify({"message": "伺服器正在關閉..."}), 200

3. 為什麼不能只看 SERVER_SOFTWARE？

雖然 `SERVER_SOFTWARE` 是一個標準的 WSGI 環境變數，但它並非所有伺服器都一定設定，或者設定的格式不一定標準。檢查特定伺服器設定的唯一鍵（如 `gunicorn.version`）是最可靠的方式。

Flask 獲取 API 傳入參數

在 Flask 中，用於處理 URL 中查詢字串（Query String）參數（例如 /my_api?abc=3&def=xy 中的 abc 和 def）的主要工具是來自 flask 模組的 request 物件。您可以使用 request.args 字典來存取這些參數。

1. 使用 `request.args` 字典

request.args 是一個類似字典的物件，它包含 URL 中問號（?）之後的所有鍵值對。

Python 實作範例

from flask import Flask, request, jsonify

app = Flask(__name__)

@app.route('/my_api', methods=['GET'])
def get_query_parameters():
    
    # 存取整個查詢參數字典
    all_params = request.args
    print(f"所有參數: {all_params}")
    
    # --- 獲取特定參數的方法 ---
    
    # 1. 使用 .get() 獲取參數 (推薦：安全且提供預設值)
    # 獲取 'abc' 參數，如果不存在則預設為 None
    abc_value = request.args.get('abc')
    
    # 獲取 'def' 參數，如果不存在則預設為 'default_value'
    def_value = request.args.get('def', 'default_value')
    
    # 2. 直接使用 [] 存取 (不推薦：如果參數不存在會拋出 KeyError)
    # try:
    #     required_param = request.args['required']
    # except KeyError:
    #     required_param = "Missing"

    # --- 處理多值參數 ---
    # 如果 URL 是 /my_api?item=apple&item=banana
    item_list = request.args.getlist('item') # 返回 ['apple', 'banana']
    
    return jsonify({
        "status": "success",
        "abc": abc_value,
        "def": def_value,
        "item_list": item_list
    })

if __name__ == '__main__':
    # 測試 URL 1: http://127.0.0.1:5000/my_api?abc=3&def=xy&item=A&item=B
    # 測試 URL 2: http://127.0.0.1:5000/my_api
    app.run(debug=True)

2. 關鍵方法說明

方法	用途	行為	範例
`request.args.get('key')`	安全地獲取單個參數	如果參數不存在，返回 `None`，不會拋出錯誤。	`request.args.get('user')`
`request.args.get('key', 'default')`	獲取參數並提供預設值	如果參數不存在，返回您指定的預設值。	`request.args.get('page', 1)`
`request.args['key']`	直接存取參數	如果參數不存在，會拋出 `KeyError` 錯誤，導致 500 伺服器錯誤。	`request.args['id']`
`request.args.getlist('key')`	獲取多個相同名稱的參數	返回包含所有值的列表。	`request.args.getlist('filter')`

3. 處理類型轉換

從 request.args 獲取的所有值都是字串（String）。如果參數應該是數字或布林值，您需要手動進行類型轉換：

# 獲取參數 (字串)
num_str = request.args.get('num', '0')

# 轉換為整數
try:
    num_int = int(num_str)
except ValueError:
    num_int = 0 # 處理轉換失敗的情況

# 轉換為布林值 (注意：所有非空字串在 Python 中都是 True)
bool_str = request.args.get('is_admin', 'false').lower()
is_admin = bool_str == 'true'

動態生成 Flask 路由名稱

在 Flask 中，用於區分路由的關鍵是 Endpoint，而不是您在 Python 程式碼中定義的函式名稱。您可以利用迴圈和 Python 的閉包（Closure）特性來動態定義和註冊路由，並為其指定唯一的 Endpoint。

1. 解決方案：使用 Endpoint 參數和閉包 (推薦)

我們將使用一個工廠函式（Factory Function）來創建每個路由處理器，並在註冊時指定唯一的 `endpoint` 名稱。

Python 實作範例

from flask import Flask, jsonify
import os

app = Flask(__name__)

# 假設這是您的數據源
dynamic_apis = {
    "user_info": {"method": "GET", "handler": lambda: {"data": "User info fetched"}},
    "product_list": {"method": "GET", "handler": lambda: {"data": "Products listed"}},
    "submit_form": {"method": "POST", "handler": lambda: {"data": "Form submitted"}, "methods": ['POST']},
}

filename_base = "db_agent"

# --- 核心邏輯：路由工廠函式 ---

def create_dynamic_route(funstr, handler_func, methods):
    """
    創建並返回一個路由處理函式（閉包）。
    這個函式會捕獲 funstr 和 handler_func 的值。
    """
    def dynamic_route_handler():
        # 函式名稱固定，但在運行時可以存取 funstr
        print(f"處理請求: {funstr}")
        
        # 執行實際的業務邏輯
        result = handler_func()
        
        return jsonify(result)
    
    # 返回創建的函式
    return dynamic_route_handler

# --- 動態註冊迴圈 ---

for funstr, api_info in dynamic_apis.items():
    
    # 1. 構建 URL 路徑
    url_path = f"/{filename_base}/{funstr}"
    
    # 2. 定義 Endpoint 名稱 (使用 funstr 確保唯一性)
    endpoint_name = f"{filename_base}_{funstr}_api" 
    
    # 3. 獲取 HTTP 方法
    methods = api_info.get("methods", ['GET']) # 預設為 GET
    
    # 4. 創建路由處理函式
    handler_func = create_dynamic_route(funstr, api_info["handler"], methods)

    # 5. 註冊路由
    # 使用 endpoint= 參數指定唯一的名稱，取代函式名稱
    app.add_url_rule(
        url_path, 
        endpoint=endpoint_name, 
        view_func=handler_func,
        methods=methods
    )
    
    print(f"已註冊路由: {url_path} (Endpoint: {endpoint_name})")


if __name__ == '__main__':
    # 測試端點，例如: http://127.0.0.1:5000/db_agent/user_info
    app.run(debug=True)

2. 關鍵點解析

使用 `app.add_url_rule()`：這是程式化註冊路由的首選方法，它取代了裝飾器語法。
Endpoint：在 `app.add_url_rule()` 中，我們必須使用 `endpoint` 參數來指定一個唯一的名稱（例如 `db_agent_user_info_api`）。這個名稱是 Flask 內部用來管理和引用路由的鍵（例如在 `url_for()` 中）。
閉包（Closure）：`create_dynamic_route` 函式是關鍵。它返回一個內部函式 `dynamic_route_handler`，這個內部函式「閉包」了（捕獲並記住了）迴圈中當時的 `funstr` 和 `handler_func` 變數的值，確保每個路由處理器都能正確執行其對應的邏輯。
函式名稱（`get_???`）：因為我們使用了 `endpoint` 參數，所以 Python 內部不需要為每個動態創建的函式指定一個唯一的名稱，我們可以直接使用一個通用的 `handler_func` 名稱。

Gradio

Gradio 是一個開源的 Python 庫，旨在讓機器學習模型變得更加可訪問和易於互動。通過簡單的代碼，您可以快速為您的機器學習模型建立一個網頁界面，供他人測試和使用。

Gradio 的主要特點

簡單易用：只需幾行代碼即可創建互動式介面。
即時預覽：能夠在本地或雲端運行後立即查看結果，方便測試和調整模型。
支持多種輸入和輸出類型：包括文字、圖片、音頻、影像等，適用於各類應用場景。
與機器學習框架兼容：Gradio 與 TensorFlow、PyTorch、Scikit-learn 等框架兼容，可以直接用於這些框架訓練好的模型。
分享簡單：生成的網頁介面可以通過鏈接分享，其他用戶無需安裝特殊的軟體即可訪問。

如何使用 Gradio

Gradio 的用法非常簡單，以下是一個基本的範例，顯示如何創建一個簡單的文字輸入和輸出的介面：

import gradio as gr

# 定義處理輸入數據的函數
def greet(name):
    return "你好，" + name + "!"

# 創建 Gradio 介面
iface = gr.Interface(fn=greet, inputs="text", outputs="text")

# 啟動介面
iface.launch()

上面的程式碼將創建一個簡單的網頁介面，讓使用者可以輸入名字，然後顯示個人化的問候語。

Gradio 的應用場景

機器學習模型展示：快速將機器學習模型轉化為可互動的網頁應用，供他人測試和體驗。
資料可視化：可以用來可視化數據處理的結果，便於演示和共享。
用戶測試工具：開發者可以快速生成測試工具，讓使用者試用 AI 應用或其他功能。

結論

Gradio 為開發者提供了一個簡單且強大的工具，能夠快速將機器學習模型轉化為網頁應用，讓更廣泛的使用者能夠輕鬆地測試和體驗 AI 的成果。無論是用於個人項目還是團隊合作，Gradio 都是推廣和展示模型的理想選擇。

Gradio 輸出重定向到 HTTP 伺服器頁面

如果想將 Gradio 介面的輸出重定向到 Apache HTTP 伺服器的頁面（如 `/results`），您可以使用 Python 的 requests 模組來將 Gradio 的結果傳送到伺服器。以下是如何將 Gradio 和 Apache 整合的基本步驟：

步驟 1: 設定 HTTP 伺服器

首先，確保您的 Apache HTTP 伺服器正在運行，並且已經配置好一個能夠處理數據的端點（例如 /results）。這個端點可以是 PHP、Python 或其他後端語言來處理傳入的數據。

步驟 2: 創建 Gradio 應用程式

以下是如何編寫 Gradio 應用程式並將其輸出結果重定向到 HTTP 伺服器的範例代碼：

import gradio as gr
import requests

# 處理 Gradio 輸入並重定向到 HTTP 伺服器
def process_and_redirect(input_data):
    # 對輸入數據進行處理
    result = f"Processed: {input_data}"
    
    # 向 Apache HTTP 伺服器發送 HTTP POST 請求，並攜帶處理後的數據
    url = 'http://your-apache-server-address/results'  # 替換為您的伺服器地址
    payload = {'result': result}
    
    try:
        response = requests.post(url, data=payload)
        if response.status_code == 200:
            return f"成功重定向到 {url}。"
        else:
            return f"重定向失敗。狀態碼: {response.status_code}"
    except Exception as e:
        return f"發生錯誤: {str(e)}"

# 創建 Gradio 介面
iface = gr.Interface(
    fn=process_and_redirect, 
    inputs="text", 
    outputs="text",
    title="Gradio 重定向到 HTTP 伺服器"
)

iface.launch()

步驟 3: 伺服器端處理

您的 Apache 伺服器應該配置好處理 POST 請求的端點，例如一個簡單的 PHP 腳本來接收 Gradio 的數據：

<?php
// 處理來自 Gradio 的 POST 請求
if ($_SERVER["REQUEST_METHOD"] == "POST") {
    $result = $_POST['result'];  // 從 POST 請求中獲取 'result' 參數
    echo "從 Gradio 接收到的數據: " . htmlspecialchars($result);
}
?>

注意事項

安全性: 如果您傳送敏感數據，建議使用 HTTPS 來保護傳輸安全，並考慮加入身份驗證。
錯誤處理: 確保在 Gradio 應用和伺服器端都添加了適當的錯誤處理機制，避免伺服器無法響應或請求失敗。

總結

這樣，您可以使用 Gradio 應用程式將輸出重定向到 Apache HTTP 伺服器，並在伺服器端處理數據。這樣的整合使得 Gradio 的互動功能能夠更廣泛地應用於 Web 環境中。

在 Web伺服器顯示 Gradio 內容

方法一：使用 iframe 嵌入 Gradio 頁面

在 Apache 頁面中嵌入 Gradio 介面最簡單的方式是使用 iframe 標籤。設定 src 屬性為 Gradio 伺服器的 URL。

範例代碼

<!DOCTYPE html>
<html lang="zh">
<head>
    <meta charset="UTF-8">
    <title>Apache 介面嵌入 Gradio</title>
</head>
<body>
    <h1>嵌入 Gradio 介面</h1>
    <iframe src="http://your-gradio-server-address:7860" width="100%" height="800px" frameborder="0"></iframe>
</body>
</html>

方法二：使用反向代理 (Reverse Proxy) 將 Gradio 介面整合至 Apache URL

如果希望透過 Apache 的 URL 直接訪問 Gradio 介面，可以配置反向代理。這樣無需顯示原始的 Gradio URL。

步驟

啟用 Apache 的 mod_proxy 和 mod_proxy_http 模組。執行以下指令：

sudo a2enmod proxy
sudo a2enmod proxy_http

或是un-comment:

#LoadModule proxy_module modules/mod_proxy.so
#LoadModule proxy_http_module modules/mod_proxy_http.so

在 Apache 的配置文件中，新增以下反向代理設置，將 Gradio 介面反向代理至 Apache 的特定路徑 (例如：/gradio)。

<Location "/gradio">
    ProxyPass "http://localhost:7860/"
    ProxyPassReverse "http://localhost:7860/"
</Location>

儲存配置並重新啟動 Apache 服務：

sudo systemctl restart apache2

完成後，您可以透過 http://your-apache-server-address/gradio 在 Apache 頁面中顯示來自 Gradio 的介面內容。

Gradio Static Assets 透過 Apache Proxy

步驟 1：啟用 Proxy 和 Proxy HTTP 模組

在 Apache 中，確保已啟用 proxy 和 proxy_http 模組。若尚未啟用，可以執行以下指令：

sudo a2enmod proxy
sudo a2enmod proxy_http

步驟 2：更新 Apache Virtual Host 配置

在 Gradio 應用的 Apache 配置檔案中 (例如 /etc/apache2/sites-available/yourdomain.conf)，新增以下設定來配置 ProxyPass 和 ProxyPassReverse：

<VirtualHost *:80>
    ServerName yourdomain.com

    # 將 Gradio 根目錄指向 Gradio 伺服器
    ProxyPass / http://localhost:7860/
    ProxyPassReverse / http://localhost:7860/

    # 確保靜態資源能被正常代理
    ProxyPass /static/ http://localhost:7860/static/
    ProxyPassReverse /static/ http://localhost:7860/static/
</VirtualHost>

步驟 3：重啟 Apache

完成設定後，請重啟 Apache 以套用更改：

sudo systemctl restart apache2

這樣的配置可以明確處理對 Gradio 靜態資源 (如 theme.css) 的請求，應能解決缺少樣式的問題。如果 Gradio 的靜態檔案路徑非 /static/，請根據實際情況調整路徑。

Gradio UI 元件列表

輸入元件 (Input Components)

Textbox: 接受單行或多行文字輸入。
Number: 接受數字輸入。
Slider: 接受範圍內的數值輸入，透過拖曳選擇。
Checkbox: 接受布林值 (True/False) 輸入。
Radio: 接受多個選項中選擇一個。
Dropdown: 接受多個選項中選擇一個，以下拉式選單顯示。
CheckboxGroup: 接受多個選項中選擇零個或多個。
Image: 接受圖片輸入，支援上傳或繪圖。
Video: 接受影片輸入。
Audio: 接受音訊輸入，支援上傳或錄製。
File: 接受檔案上傳。
ColorPicker: 接受顏色選擇。
Sketchpad: 允許使用者在畫布上繪圖，作為圖片輸入。
Dataframe: 接受資料框 (表格) 輸入，支援手動編輯或上傳 CSV/JSON。

輸出元件 (Output Components)

Label: 顯示分類結果或文字標籤，通常用於機器學習模型的預測結果。
Textbox: 顯示文字輸出。
Image: 顯示圖片輸出。
Video: 顯示影片輸出。
Audio: 顯示音訊輸出。
HTML: 顯示 HTML 內容。
JSON: 顯示 JSON 格式的資料。
Markdown: 顯示 Markdown 格式的文字。
Dataframe: 顯示資料框 (表格) 輸出。
HighlightedText: 顯示帶有特定標記或高亮區域的文字。
Plot: 顯示各種圖表 (例如 Matplotlib、Plotly 等)。
Gallery: 顯示多張圖片的畫廊。

功能與佈局元件 (Functionality and Layout Components)

Button: 可點擊的按鈕，用於觸發事件或函數。
Tab: 用於組織多個介面區塊的標籤頁。
Row / Column: 用於控制元件的佈局 (水平或垂直排列)。
Group: 用於將多個元件分組，可設定共同的邊框或樣式。
State: 用於在 Gradio 應用程式的不同函數調用之間儲存和傳遞狀態。
Dataset: 用於展示和選擇範例輸入資料集。
Chatbot: 專門用於建構聊天機器人介面的元件。
Blocks: Gradio 宣告式 API 的基礎，允許更精細的佈局和控制。

Gradio 中的 DataFrame 元件

在 Gradio 中可以使用 gr.DataFrame 元件來顯示或編輯表格數據，例如顯示 Pandas DataFrame 或其他表格格式的數據。在這裡，我們將介紹如何在 Gradio 應用中使用 DataFrame 元件來創建交互式的數據表格。

1. 安裝 Gradio

如果尚未安裝 Gradio，可以使用以下命令安裝：

pip install gradio

2. 使用 `gr.DataFrame` 顯示表格數據

以下是如何使用 Gradio 來展示 DataFrame。假設我們有一個 Pandas DataFrame，需要在 Gradio 應用中顯示：


    import gradio as gr

    import pandas as pd



    # 創建示例 DataFrame

    data = {'名稱': ['Alice', 'Bob', 'Charlie'], '年齡': [25, 30, 35], '職業': ['工程師', '設計師', '醫生']}

    df = pd.DataFrame(data)



    # 定義函數以返回 DataFrame

    def show_dataframe():

            return df



    # 創建 Gradio 界面

    interface = gr.Interface(fn=show_dataframe, outputs=gr.DataFrame(), title="人員數據表")

    interface.launch()

說明

import gradio as gr：引入 Gradio 套件。
data：用於創建示例數據的字典，包含姓名、年齡和職業三欄。
show_dataframe：定義函數以返回 Pandas DataFrame 以供顯示。
gr.DataFrame()：創建 DataFrame 元件，用於 Gradio 界面中的表格顯示。
interface.launch()：啟動 Gradio 應用。

3. 使用 `gr.DataFrame` 進行互動編輯

如果希望讓使用者能夠編輯表格，可以在 gr.DataFrame 中設置 editable=True，允許使用者修改表格數據：


    interface = gr.Interface(fn=show_dataframe, outputs=gr.DataFrame(editable=True), title="可編輯的人員數據表")

結果

啟動後的應用會顯示可編輯的表格，使用者可以直接在網頁上對數據進行修改。

強制終止 Gradio 伺服器

步驟 1：查找 Gradio 程序的 PID

可以使用 psutil 模組來查找 Gradio 程序的 PID。首先，確保已安裝 psutil：

pip install psutil

接著可以用以下程式碼找到 Gradio 相關程序的 PID。

import psutil

# 搜索包含 'gradio' 的程序
for process in psutil.process_iter(['pid', 'name', 'cmdline']):
    if 'gradio' in ' '.join(process.info['cmdline']):
        print("找到 Gradio 程序 PID:", process.info['pid'])

步驟 2：強制終止 Gradio 程序

找到 PID 後，可以使用 terminate() 或 kill() 方法來終止該程序。例如：

for process in psutil.process_iter(['pid', 'name', 'cmdline']):
    if 'gradio' in ' '.join(process.info['cmdline']):
        process.kill()  # 強制終止程序
        print(f"已終止 Gradio 程序 PID: {process.info['pid']}")

注意事項

使用 kill() 方法會立即終止程序，因此請確保該程序無正在進行的重要操作。此範例程式碼會終止所有匹配到的 Gradio 程序。

用監聽埠強制終止 Gradio 伺服

步驟 1：查找監聽特定埠的程序

可以使用 psutil 模組來查找監聽特定埠的程序。首先，確保已安裝 psutil：

pip install psutil

接著，可以用以下程式碼查找監聽 7860 埠的程序 PID。

import psutil

# 指定要查找的埠號
target_port = 7860
pid_to_kill = None

# 搜索監聽指定埠的程序
for conn in psutil.net_connections(kind='inet'):
    if conn.laddr.port == target_port and conn.status == psutil.CONN_LISTEN:
        pid_to_kill = conn.pid
        break

if pid_to_kill:
    print("找到監聽埠 7860 的程序 PID:", pid_to_kill)
else:
    print("未找到監聽埠 7860 的程序")

步驟 2：強制終止找到的程序

找到 PID 後，可以使用 psutil.Process 的 kill() 方法來強制終止程序：

if pid_to_kill:
    process = psutil.Process(pid_to_kill)
    process.kill()  # 強制終止程序
    print(f"已終止監聽埠 7860 的程序 PID: {pid_to_kill}")
else:
    print("無法終止程序，因為未找到該 PID")

注意事項

此程式碼將強制終止任何監聽指定埠的程序。請確認該埠確實為 Gradio 使用，以免誤終止其他服務。

Gradio 中添加 HTTP API 伺服器

Gradio 主要是設計用於建立快速、易用的 Web UI，以便展示機器學習模型。它本身已經運行在一個 Web 伺服器上，但其主要目的是提供一個人機互動介面，而不是一個傳統的 RESTful API 端點。

若您想在 Gradio 應用中同時擁有 RESTful API 功能，最推薦的方法是將 Gradio 應用程式嵌入到一個功能更強大的 Web 框架中，例如 **FastAPI** 或 **Flask**。這允許您使用主框架來定義 API 端點，同時將 Gradio UI 掛載到一個子路徑上。

1. 推薦方案：將 Gradio 應用程式嵌入到 FastAPI (首選)

FastAPI 速度快，並且與 Gradio 共同依賴 Starlette 框架，使其嵌入過程非常順暢。

步驟 A: 安裝必要的套件

# 安裝 FastAPI, Uvicorn (伺服器), 和 Gradio
pip install fastapi uvicorn gradio

步驟 B: 實作程式碼

您將使用 Gradio 的 .to_app() 方法將 Gradio 介面轉換為一個 ASGI 應用程式，然後使用 FastAPI 的 mount 功能將其掛載到主應用程式上。

from fastapi import FastAPI
from fastapi.responses import JSONResponse
import gradio as gr

# 1. 定義 Gradio 應用程式邏輯
def greet(name):
    return f"Hello, {name}!"

gr_interface = gr.Interface(fn=greet, inputs="text", outputs="text")

# 2. 將 Gradio 介面轉換為 ASGI 應用程式
gradio_app = gr_interface.to_app()

# 3. 建立 FastAPI 主應用程式
app = FastAPI(
    title="Gradio + FastAPI Server",
    description="同時提供 API 端點和 Gradio UI"
)

# 4. (API SVR) 定義您的 RESTful API 端點
@app.get("/api/v1/status")
def api_status():
    return JSONResponse(content={"status": "API is operational"})

@app.get("/api/v1/model_inference")
def api_inference(data: str):
    # 這裡可以調用您的模型邏輯
    result = f"Processed data: {data.upper()}"
    return JSONResponse(content={"result": result})

# 5. (Gradio SVR) 將 Gradio 應用程式掛載到 /gradio 路徑
# mount() 函式讓您可以將另一個 ASGI 應用程式掛載到指定路徑
app.mount("/gradio", gradio_app)

# 執行伺服器 (假設檔案名為 main.py)
# 在終端機執行: uvicorn main:app --host 0.0.0.0 --port 8000 --reload

存取方式

HTTP API 伺服器：通過 `http://127.0.0.1:8000/api/v1/status` 存取。
Gradio UI 介面：通過 `http://127.0.0.1:8000/gradio` 存取。

2. 替代方案：在 Gradio 內部提供 API

Gradio 本身也提供了一個實驗性的功能，允許您直接通過 URL 參數調用 Gradio 介面底層的函式，而無需額外的 Web 框架。這不是一個標準的 RESTful API，但可以實現簡單的程式化存取。

當 Gradio 應用程式運行時，其內部函式可以透過特定的 API 路徑存取。
您可以使用 POST 請求向 `/api/predict` 或 `/run/<函式名稱>` 端點發送 JSON 格式的輸入數據，並接收 JSON 格式的結果。
具體的 API 路徑和格式可以在 Gradio UI 的「API 文件」頁面（通常在 `/api` 路徑）找到。

然而，使用 FastAPI/Flask 嵌入 Gradio 是更標準、更靈活的方法，可以提供更規範的 API 設計、文件和認證。

Python爬蟲

Requests + BeautifulSoup

這是最常見的爬蟲組合，適合初學者，用於解析靜態網頁。

pip install requests beautifulsoup4

使用範例：

import requests
from bs4 import BeautifulSoup

url = "https://example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
print(soup.title.string)

Scrapy

一個強大的爬蟲框架，適合大型爬蟲專案，支持多線程和分佈式爬蟲。

pip install scrapy

使用範例：

scrapy startproject myproject

在專案內建立爬蟲模組，運行爬取命令。

Selenium

適合需要模擬使用者操作的動態網頁爬取，例如處理JavaScript渲染的內容。

pip install selenium

使用範例：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")
print(driver.title)
driver.quit()

Playwright

另一個處理動態網頁的工具，相比Selenium性能更高，支持多瀏覽器。

pip install playwright
playwright install

使用範例：

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://example.com")
    print(page.title())
    browser.close()

Pyppeteer

基於Puppeteer的Python版，專為爬取動態網頁而設計。

pip install pyppeteer

使用範例：

from pyppeteer import launch

async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto("https://example.com")
    print(await page.title())
    await browser.close()

import asyncio
asyncio.get_event_loop().run_until_complete(main())

HTTPX

用於發送HTTP請求的高效工具，支持異步操作。

pip install httpx

使用範例：

import httpx

async def fetch():
    async with httpx.AsyncClient() as client:
        response = await client.get("https://example.com")
        print(response.text)

import asyncio
asyncio.run(fetch())

Python BeautifulSoup 爬蟲程式

To create a simple web scraper in Python, you can use the requests library to get the page content, and BeautifulSoup to parse the HTML.

Here's an example of a basic web scraper:


        import requests

        from bs4 import BeautifulSoup



        # URL to scrape

        url = "https://example.com"



        # Send a GET request

        response = requests.get(url)

        response.raise_for_status()  # Check for errors



        # Parse the HTML content

        soup = BeautifulSoup(response.content, "html.parser")



        # Extract specific data (e.g., all the headings)

        headings = soup.find_all("h1")



        # Print the headings

        for heading in headings:

            print(heading.text)

Note: You may need to install the libraries with the following commands:


        pip install requests

        pip install beautifulsoup4

BeautifulSoup 找特定標籤和類別中的文字

範例場景

` 標籤中類別為 `xxxclass` 的文字值：



    需要提取的文字
    其他文字

使用 BeautifulSoup 查找並提取文字

以下是使用 `BeautifulSoup` 的 Python 程式碼：

from bs4 import BeautifulSoup

# HTML 文件
html_content = """


    需要提取的文字
    其他文字


"""

# 解析 HTML
soup = BeautifulSoup(html_content, 'html.parser')

# 查找特定標籤和類別
span_tag = soup.find('span', class_='xxxclass')

# 提取文字值
if span_tag:
    print(span_tag.text)  # 輸出：需要提取的文字
else:
    print("未找到匹配的標籤")

方法說明

1. `find(tag, class_=...)`： - `tag`：指定要查找的 HTML 標籤，例如 `span`。 - `class_`：指定類別名，例如 `xxxclass`。需要注意 `class_` 是用底線避免與 Python 的保留字 `class` 衝突。 2. `.text`：提取標籤內的文字內容。

查找多個匹配項

若需要提取多個標籤，可以使用 `find_all`：

# 查找所有匹配的  標籤
span_tags = soup.find_all('span', class_='xxxclass')

# 提取每個標籤的文字
for tag in span_tags:
    print(tag.text)

其他篩選條件

1. **按多個屬性篩選**：

   span_tag = soup.find('span', {'class': 'xxxclass', 'id': 'specific-id'})

2. **使用正則表達式匹配類別**：

   import re
   span_tag = soup.find('span', class_=re.compile(r'^xxx'))

注意事項

1. **HTML 格式**：確保 HTML 是有效的，否則解析可能出現問題。 2. **空結果處理**：查找不到時返回 `None`，應檢查結果是否為空以避免錯誤。

總結

透過 `BeautifulSoup` 的 `find` 或 `find_all` 方法，可以輕鬆提取特定標籤和類別中的文字內容。靈活使用篩選條件和屬性匹配可以處理更複雜的場景。

Selenium

什麼是 Selenium？

Selenium 是一個開源工具，主要用於自動化網頁瀏覽器的操作。它支持多種瀏覽器，包括 Chrome、Firefox、Safari 等，並可用於測試網頁應用程式或進行網頁數據抓取。

核心功能

瀏覽器自動化：模擬使用者操作，如點擊、輸入文字、提交表單等。
跨瀏覽器測試：支持多種瀏覽器和操作系統的自動化測試。
支援多種編程語言：包括 Python、Java、C#、Ruby 等。
擴展性強：可與測試框架（如 pytest、JUnit）和 CI/CD 工具（如 Jenkins）集成。

主要組件

Selenium WebDriver：核心工具，用於與瀏覽器進行交互。
Selenium IDE：一個簡單的錄製和回放工具，適合初學者。
Selenium Grid：用於分佈式測試，支持多瀏覽器和多環境並行測試。

應用場景

功能測試：驗證網頁應用程式的功能是否正常運作。
回歸測試：快速檢測新功能是否影響現有功能。
數據抓取：自動化提取網頁上的公開數據。
持續集成：在 CI/CD 流程中進行自動化測試。

安裝與基本使用

以下是安裝 Selenium 的步驟和簡單的 Python 使用範例：

# 安裝 Selenium
pip install selenium

# 範例代碼
from selenium import webdriver
from selenium.webdriver.common.by import By

# 啟動 WebDriver
driver = webdriver.Chrome()
driver.get("https://www.example.com")

# 查找元素並執行操作
element = driver.find_element(By.TAG_NAME, "h1")
print(element.text)

# 關閉瀏覽器
driver.quit()

優點與挑戰

優點：支持多瀏覽器、多語言，適用範圍廣。
挑戰：對動態網頁的處理需要額外的技巧，如等待元素加載。

Selenium Chrome 使用特定使用者

安裝必要套件

確保已安裝Selenium和ChromeDriver：

pip install selenium

下載並安裝適合您Chrome版本的 ChromeDriver。

設置使用者資料夾

Chrome的使用者資料夾包含書籤、歷史記錄、Cookie等個人資料，您可以指定使用特定的資料夾來啟動瀏覽器。

範例程式碼

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options

# 指定ChromeDriver路徑
chromedriver_path = "/path/to/chromedriver"

# 指定使用者資料夾
user_data_dir = "/path/to/your/user/data"

# 設置Chrome選項
chrome_options = Options()
chrome_options.add_argument(f"--user-data-dir={user_data_dir}")
chrome_options.add_argument("--profile-directory=Default")  # 或其他子資料夾名稱

# 啟動瀏覽器
service = Service(chromedriver_path)
driver = webdriver.Chrome(service=service, options=chrome_options)

# 開啟一個網頁
driver.get("https://example.com")

# 結束程式
driver.quit()

注意事項

確保指定的 user_data_dir 路徑是有效且可寫的目錄。
如果該資料夾已經被其他Chrome進程佔用，啟動時可能會失敗。
可以透過瀏覽器的設定頁面找到使用者資料夾的路徑：

在Chrome中輸入 chrome://version。
查看「個人資料路徑」(Profile Path)。

應用場景

需要使用特定的Cookie、書籤或其他個人化資料。
測試需要登入的網站時，使用已保存的登入資訊。
模擬特定使用者環境的行為。

獲取所有 user_data_dir

1. 安裝必要的庫

確保已安裝 selenium 和 psutil：

pip install selenium psutil

2. 取得所有使用中的 Chrome user_data_dir

以下程式碼會掃描所有運行中的 Chrome，並提取 user-data-dir 參數：

import psutil
import re

def get_all_user_data_dirs():
    user_data_dirs = set()
    for proc in psutil.process_iter(attrs=['pid', 'name', 'cmdline']):
        try:
            if proc.info['name'] and 'chrome' in proc.info['name'].lower():
                cmdline = ' '.join(proc.info['cmdline'])
                match = re.search(r'--user-data-dir=([^\s]+)', cmdline)
                if match:
                    user_data_dirs.add(match.group(1))
        except (psutil.NoSuchProcess, psutil.AccessDenied):
            continue
    return list(user_data_dirs)

print(get_all_user_data_dirs())

3. 在 Selenium 中使用特定 user_data_dir

找到目標 user_data_dir 後，可用於 Selenium：

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options

chrome_user_data_dir = "C:\\Users\\YourUser\\AppData\\Local\\Google\\Chrome\\User Data"

options = Options()
options.add_argument(f"--user-data-dir={chrome_user_data_dir}")

service = Service("chromedriver.exe")
driver = webdriver.Chrome(service=service, options=options)
driver.get("https://www.google.com")

4. 結論

透過 psutil 解析運行中的 Chrome 進程，即可獲取所有 user-data-dir，並在 Selenium 中使用特定的 user_data_dir 啟動瀏覽器。

Chrome 資料目錄取得使用者名稱

問題說明

若要從 Chrome 使用者資料目錄中獲取使用者名稱，您需要訪問該目錄中的檔案，通常是位於以下路徑：

C:\Users\[Username]\AppData\Local\Google\Chrome\User Data\（Windows）
/Users/[Username]/Library/Application Support/Google/Chrome/（macOS）
/home/[Username]/.config/google-chrome/（Linux）

這些資料夾包含許多檔案，您可以讀取 Local State 檔案來獲取使用者的基本資訊。

步驟：讀取 `Local State` 檔案

Chrome 的 Local State 檔案包含一些基本的使用者設定，您可以從中取得使用者的資料。

import json
import os

def get_chrome_user_name(user_data_dir):
    local_state_path = os.path.join(user_data_dir, 'Local State')
    
    # 檢查檔案是否存在
    if not os.path.exists(local_state_path):
        return "Local State file not found"

    with open(local_state_path, 'r', encoding='utf-8') as file:
        local_state = json.load(file)

    # 從 Local State 取得使用者資訊
    user_name = local_state.get('profile', {}).get('name', 'Unknown User')
    
    return user_name

# 示例：Chrome 使用者資料目錄路徑
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

print(get_chrome_user_name(user_data_dir))

解析 Local State

當您讀取 Local State 檔案並將其解析為 JSON 時，可以從中取得許多資料，例如：

profile：包含使用者的配置資料，如名稱、圖片等。
last_version：顯示上次的 Chrome 版本。
is_logged_in：顯示使用者是否登入。

在大多數情況下，使用者名稱將位於 profile 下，並可通過上述方法提取。

注意事項

Local State 檔案會在每次啟動 Chrome 時更新，因此檔案內容會隨著時間變動。

此方法依賴於 Chrome 設定檔資料，若使用者使用不同的 Google 帳號，檔案結構可能有所不同。

結論

通過解析 Local State 檔案中的 JSON 資料，您可以輕鬆地獲取 Chrome 使用者的名稱。

從 Local State 檔案中獲取所有使用者

問題說明

Chrome 的 Local State 檔案存儲了許多使用者的基本資料。若您想從中提取所有使用者名稱，可以讀取該檔案並解析其 JSON 內容。以下是如何實現這一目標的步驟。

步驟：讀取 `Local State` 檔案並解析

您可以讀取位於 Chrome 使用者資料目錄中的 Local State 檔案，然後解析其中的 JSON 格式內容來提取所有使用者的資料。

import json
import os

def get_all_users(user_data_dir):
    local_state_path = os.path.join(user_data_dir, 'Local State')
    
    # 檢查檔案是否存在
    if not os.path.exists(local_state_path):
        return "Local State file not found"

    with open(local_state_path, 'r', encoding='utf-8') as file:
        local_state = json.load(file)

    # 從 Local State 取得所有使用者資料
    profiles = local_state.get('profile', {}).get('info_cache', {})
    
    # 獲取所有使用者名稱
    user_names = [profile.get('name', 'Unknown User') for profile in profiles.values()]
    
    return user_names

# 示例：Chrome 使用者資料目錄路徑
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

print(get_all_users(user_data_dir))

解析 Local State 中的使用者資料

在 Chrome 的 Local State 檔案中，使用者資料通常儲存在 profile 下的 info_cache 中，這是一個字典，其中每個使用者的資料都是以其配置名稱為鍵。

示範：`Local State` 檔案結構

以下是 Local State 檔案中的結構範例：


{
    "profile": {
        "info_cache": {
            "profile1": {
                "name": "User1",
                "avatar": "path/to/avatar1.jpg"
            },
            "profile2": {
                "name": "User2",
                "avatar": "path/to/avatar2.jpg"
            }
        }
    }
}

注意事項

這個方法假設您已經擁有對 Chrome 使用者資料目錄的讀取權限。
某些使用者資料可能存在於不同的檔案結構中，具體取決於 Chrome 的版本或設定。
如果沒有匹配的資料，則會返回 'Unknown User' 作為預設名稱。

結論

通過解析 Local State 檔案，您可以獲取 Chrome 中所有使用者的名稱。這使得可以輕鬆地列出所有帳戶。

Local State 檔案中的使用者資料

問題說明

在 Chrome 的 Local State 檔案中，每個使用者的資料都包含在 info_cache 中。您可以從中提取使用者名稱以及對應的配置子目錄。

步驟：讀取 `Local State` 檔案並解析

以下是如何從 Chrome 的 Local State 檔案中獲取所有使用者的名稱和對應的子目錄的方法。

import json
import os

def get_users_and_profiles(user_data_dir):
    local_state_path = os.path.join(user_data_dir, 'Local State')
    
    # 檢查檔案是否存在
    if not os.path.exists(local_state_path):
        return "Local State file not found"

    with open(local_state_path, 'r', encoding='utf-8') as file:
        local_state = json.load(file)

    # 從 Local State 取得所有使用者資料
    profiles = local_state.get('profile', {}).get('info_cache', {})
    
    # 獲取所有使用者名稱及其對應的子目錄
    user_info = {}
    for profile_key, profile_data in profiles.items():
        user_name = profile_data.get('name', 'Unknown User')
        profile_sub_dir = os.path.join(user_data_dir, 'Profile ' + profile_key)
        user_info[user_name] = profile_sub_dir
    
    return user_info

# 示例：Chrome 使用者資料目錄路徑
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

users_and_profiles = get_users_and_profiles(user_data_dir)
for user_name, profile_dir in users_and_profiles.items():
    print(f"使用者名稱: {user_name}, 子目錄: {profile_dir}")

解析 Local State 中的資料結構

在 Local State 檔案中，所有使用者的資料都位於 profile 下的 info_cache。每個使用者有一個對應的配置鍵（例如 profile1, profile2 等）。每個配置的資料中包含使用者的名稱（name）和其他相關資料。

示範：`Local State` 檔案結構

以下是 Local State 檔案中的結構範例：


{
    "profile": {
        "info_cache": {
            "Profile 1": {
                "name": "User1",
                "avatar": "path/to/avatar1.jpg"
            },
            "Profile 2": {
                "name": "User2",
                "avatar": "path/to/avatar2.jpg"
            }
        }
    }
}

注意事項

每個使用者的配置子目錄通常會以 Profile 開頭，後面跟著數字（如 Profile 1, Profile 2 等）。
這個方法會返回每個使用者的名稱及其對應的配置子目錄路徑。
如果某些使用者的資料缺失，將會返回 'Unknown User' 作為預設名稱。

結論

通過解析 Local State 檔案，您可以獲取所有使用者的名稱及其對應的配置子目錄。這使得您可以輕鬆地找到每個使用者的配置資料位置。

Chrome 使用者的 Gmail

問題說明

若要從 Chrome 使用者資料目錄中獲取 Gmail 帳號，您需要從 Chrome 配置資料中提取相關資訊。這通常可以通過解析 Chrome 的使用者資料檔案來實現，特別是 Google 相關的帳戶資料。

步驟：讀取 Profile 檔案並解析

每個 Chrome 使用者的資料會存在於各自的資料夾中，通常在 User Data 目錄下的 Profile 目錄內。若該使用者已登入 Google 帳號，則可以在配置資料中找到相關的 Gmail 帳號資料。

import os
import json

def get_gmail_from_profile(user_data_dir, profile_name):
    profile_dir = os.path.join(user_data_dir, profile_name)
    accounts_file = os.path.join(profile_dir, 'Web Data')

    # 檢查檔案是否存在
    if not os.path.exists(accounts_file):
        return "Web Data file not found"

    # 嘗試讀取 Web Data 檔案
    try:
        with open(accounts_file, 'r', encoding='utf-8') as file:
            web_data = json.load(file)

        # 從資料中提取 Gmail 賬號
        for row in web_data.get('accounts', []):
            if 'gmail' in row.get('email', ''):
                return row.get('email')
        
        return "No Gmail account found"
    except Exception as e:
        return f"Error reading Web Data file: {e}"

# 示例：Chrome 使用者資料目錄路徑
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

# 假設使用的是 Profile 1
profile_name = 'Profile 1'
print(get_gmail_from_profile(user_data_dir, profile_name))

解析 Web Data 檔案

Web Data 檔案包含了 Chrome 中的多種登入資料，包括帳號的名稱、密碼和其他相關資訊。在此例中，我們尋找其中的 email 欄位，並檢查是否包含 Gmail 的郵箱。

示範：Web Data 檔案結構

以下是 Web Data 檔案的一部分結構範例：


{
    "accounts": [
        {
            "email": "[email protected]",
            "password": "encrypted_password_1"
        },
        {
            "email": "[email protected]",
            "password": "encrypted_password_2"
        }
    ]
}

注意事項

Web Data 檔案是加密存儲的，因此直接解析資料可能無法輕易取得使用者的密碼，但 Gmail 帳號（email）通常可以被提取。
根據 Chrome 的版本，Web Data 檔案的結構和內容可能會有所不同。
如果使用者沒有登入 Google 帳號，則不會在 Web Data 中找到 Gmail 帳號。

結論

通過解析 Chrome 使用者資料中的 Web Data 檔案，您可以輕鬆地獲取使用者的 Gmail 帳號。如果該使用者已經登入 Gmail 帳號，則相應的電子郵件會顯示在資料中。

模擬使用者操作瀏覽網站內頁面

步驟一：使用網頁自動化工具

常見的網頁自動化工具包括 Selenium 和 Playwright。這些工具可以模擬點擊、輸入文字以及其他使用者操作。

步驟二：抓取所有連結

使用工具如 BeautifulSoup 或 Playwright，獲取網站上的所有超連結 (<a href>)，以此來建立需要瀏覽的頁面列表。

步驟三：設定瀏覽器模擬

透過 Selenium 或 Playwright 開啟瀏覽器並模擬使用者的行為，例如點擊按鈕、滾動頁面，甚至觸發動態內容。

步驟四：處理 JavaScript 動態內容

現代網站通常包含大量動態生成的內容，可以使用 Playwright 或 Selenium 來執行 JavaScript，確保正確加載頁面。

步驟五：遞迴訪問所有頁面

根據抓取到的連結，遞迴地訪問網站中的所有頁面，並記錄已經訪問的頁面以避免重複。

步驟六：記錄用戶操作

在瀏覽每個頁面時，模擬常見的使用者行為，例如填寫表單、提交資料，並將操作的結果記錄下來。

步驟七：應用範例

from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化瀏覽器
driver = webdriver.Chrome()

# 開始瀏覽網站
driver.get("https://example.com")

# 抓取所有連結
links = driver.find_elements(By.TAG_NAME, "a")
for link in links:
    href = link.get_attribute("href")
    print(f"發現連結: {href}")

# 模擬點擊
if links:
    links[0].click()

# 關閉瀏覽器
driver.quit()

注意事項

在進行網站瀏覽和模擬操作時，請遵守相關網站的使用條款，避免造成過多的伺服器負擔或違反法律。

用 WebDriver 逐步執行測試

概述

在使用 WebDriver（例如 Selenium WebDriver）進行測試時，可以設計逐步執行的方式來排查問題或模擬用戶操作。以下是一些常見的設計方式。

方法 1：使用顯式等待

透過顯式等待，可以確保每一步執行完成後再進行下一步：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打開目標網站
driver.get("https://example.com")

# 等待按鈕出現並點擊
wait = WebDriverWait(driver, 10)
button = wait.until(EC.element_to_be_clickable((By.ID, "button_id")))
button.click()

# 等待其他元素加載
text_field = wait.until(EC.visibility_of_element_located((By.NAME, "text_field_name")))
text_field.send_keys("測試數據")

# 關閉瀏覽器
driver.quit()

方法 2：手動插入暫停

透過 `time.sleep()` 暫停測試進程，以便觀察每一步的執行效果：

import time
from selenium import webdriver

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打開目標網站
driver.get("https://example.com")
time.sleep(3)  # 暫停 3 秒

# 模擬按鈕點擊
button = driver.find_element(By.ID, "button_id")
button.click()
time.sleep(3)

# 關閉瀏覽器
driver.quit()

**注意**：`time.sleep` 不建議用於正式測試，僅適用於調試過程。

方法 3：逐步執行與斷點設計

透過在代碼中加入條件斷點或輸入提示，可以進行逐步調試：

from selenium import webdriver

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打開目標網站
driver.get("https://example.com")

# 手動確認後繼續
input("按 Enter 繼續下一步...")
button = driver.find_element(By.ID, "button_id")
button.click()

# 繼續執行其他測試
input("按 Enter 繼續下一步...")
driver.quit()

方法 4：使用測試框架設計可控制執行

借助測試框架（如 pytest 或 unittest），可以更靈活地控制測試執行：

import unittest
from selenium import webdriver

class TestExample(unittest.TestCase):
    def setUp(self):
        self.driver = webdriver.Chrome()

    def test_step_by_step(self):
        driver = self.driver
        driver.get("https://example.com")
        input("檢查頁面，按 Enter 繼續...")  # 手動斷點

        button = driver.find_element(By.ID, "button_id")
        button.click()
        input("檢查操作結果，按 Enter 繼續...")  # 手動斷點

    def tearDown(self):
        self.driver.quit()

if __name__ == "__main__":
    unittest.main()

注意事項

1. **等待時間設置**：使用顯式等待代替固定暫停以提高效率和穩定性。 2. **逐步測試用於調試**：逐步執行設計適用於調試過程，不適合長時間執行的自動化測試。 3. **測試框架的靈活性**：使用框架可以更好地組織測試用例和測試步驟。

總結

透過顯式等待、手動斷點、暫停時間或結合測試框架，可以有效設計逐步執行的測試流程，方便調試與優化操作。

Selenium 搜尋特定行開頭文字並提取資料

程式碼範例


from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化 Selenium
driver = webdriver.Chrome()
driver.get("你的目標網頁 URL")

# 搜尋特定行開頭文字
target_text = "目標開頭文字"
rows = driver.find_elements(By.CSS_SELECTOR, "table tr")

# 儲存結果
result_data = []

for row in rows:
    cells = row.find_elements(By.TAG_NAME, "td")
    if cells and cells[0].text.startswith(target_text):
        # 獲取同行後面的資料
        result_data.append([cell.text for cell in cells])

driver.quit()

# 將結果轉換成 HTML
html_output = "<h2>搜尋結果</h2>\n"
for i, row_data in enumerate(result_data, start=1):
    html_output += f"<h3>第 {i} 行</h3>\n<ul>\n"
    for data in row_data:
        html_output += f"  <li>{data}</li>\n"
    html_output += "</ul>\n"

# 顯示結果
print(html_output)

執行結果範例


搜尋結果
第 1 行

  目標開頭文字1
  其他資料1
  其他資料2

第 2 行

  目標開頭文字2
  其他資料1
  其他資料2

注意事項

特定行開頭文字：使用 startswith 方法判斷文字是否符合條件。
HTML 標題結構：依需求使用 <h2> 和 <h3>，並以無序列表 <ul> 組織資料。
無需 <head> 與 <body>：僅生成必要的 HTML 標籤，方便嵌入其他頁面。

find_elements By.XPATH

概述

在 Selenium 中，find_elements(By.XPATH, xpath) 用於根據 XPath 選擇器查找符合條件的所有元素，並返回一個列表。它與 find_element(By.XPATH, xpath) 不同，後者只返回第一個匹配的元素。

基本語法

from selenium import webdriver
from selenium.webdriver.common.by import By

# 啟動瀏覽器
driver = webdriver.Chrome()

# 打開網頁
driver.get("https://example.com")

# 使用 XPath 查找所有符合條件的元素
elements = driver.find_elements(By.XPATH, "//div[@class='example-class']")

# 遍歷找到的元素並輸出內容
for element in elements:
    print(element.text)

# 關閉瀏覽器
driver.quit()

常見 XPath 表達式

XPath 表達式	描述
`//tagname`	選擇所有指定標籤的元素，如 `//div` 代表所有 `div` 元素
`//tagname[@attribute='value']`	根據屬性值選擇元素，例如 `//input[@type='text']`
`//tagname[contains(@attribute, 'value')]`	包含某些文字的屬性，如 `//div[contains(@class, 'header')]`
`//tagname[text()='text']`	選擇完全匹配文字的元素，如 `//button[text()='提交']`
`//tagname[contains(text(), 'text')]`	選擇包含特定文字的元素，如 `//p[contains(text(), '歡迎')]`
`//*[@id='some-id']`	選擇具有特定 ID 的元素
`(//tagname)[index]`	選擇第 `index` 個匹配的元素，例如 `(//div)[1]` 選擇第一個 div

示例：查找多個元素

假設有以下 HTML 結構：


<div class="product">商品 A</div>
<div class="product">商品 B</div>
<div class="product">商品 C</div>

我們可以使用以下 Selenium 代碼獲取所有 product 類別的 div 元素：

elements = driver.find_elements(By.XPATH, "//div[@class='product']")
for element in elements:
    print(element.text)

注意事項

find_elements() 返回的是一個列表，即使只找到一個元素也會返回列表。
如果找不到任何元素，則返回空列表，而不會拋出錯誤。
如果確保只需要一個元素，應使用 find_element()，否則 find_elements()。

結論

find_elements(By.XPATH, xpath) 是 Selenium 中強大且靈活的查找方法，可用於定位網頁上的多個元素，並適用於爬蟲和自動化測試。

By.LINK_TEXT

概述

在 Selenium 中，By.LINK_TEXT 和 By.PARTIAL_LINK_TEXT 用於根據超連結的文字內容來查找元素：

By.LINK_TEXT：根據完整的連結文字精確匹配。
By.PARTIAL_LINK_TEXT：根據部分連結文字進行模糊匹配。

基本語法

from selenium import webdriver
from selenium.webdriver.common.by import By

# 啟動瀏覽器
driver = webdriver.Chrome()

# 打開網頁
driver.get("https://example.com")

# 使用 LINK_TEXT 查找超連結
element = driver.find_element(By.LINK_TEXT, "完整連結文字")
print(element.get_attribute("href"))

# 使用 PARTIAL_LINK_TEXT 查找超連結
element_partial = driver.find_element(By.PARTIAL_LINK_TEXT, "部分文字")
print(element_partial.get_attribute("href"))

# 關閉瀏覽器
driver.quit()

示例 HTML


<a href="https://example.com/page1">完整連結文字</a>
<a href="https://example.com/page2">點擊這裡了解更多</a>

使用 LINK_TEXT

假設要點擊 <a>完整連結文字</a>，可以使用：

driver.find_element(By.LINK_TEXT, "完整連結文字").click()

使用 PARTIAL_LINK_TEXT

如果超連結是「點擊這裡了解更多」，但我們只知道「點擊這裡」，可以使用：

driver.find_element(By.PARTIAL_LINK_TEXT, "點擊這裡").click()

常見應用場景

當超連結文字較長且動態變化時，可使用 By.PARTIAL_LINK_TEXT。
當確保連結文字是唯一時，使用 By.LINK_TEXT 來精確匹配。

注意事項

這些方法僅適用於 <a> 標籤的連結。
如果網頁使用 JavaScript 生成連結，Selenium 可能無法立即找到它，需要等待加載完成。
當頁面有多個類似連結時，find_elements() 會返回一個列表，而 find_element() 只返回第一個匹配的元素。

結論

By.LINK_TEXT 適用於精確查找完整連結，而 By.PARTIAL_LINK_TEXT 更靈活，可用於匹配部分連結文字。

Selenium 處理找不到元素

使用顯性等待 WebDriverWait

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()

try:
    elems = WebDriverWait(driver, 10).until(
        EC.presence_of_all_elements_located((By.CSS_SELECTOR, ".item"))
    )
    print("找到元素:", len(elems))
except:
    print("10 秒內找不到元素")

使用 find_elements 本身不會拋例外，可直接判斷長度

elems = driver.find_elements(By.CSS_SELECTOR, ".item")

if not elems:
    print("找不到元素")
else:
    print("找到元素數量:", len(elems))

處理元素尚未出現（常見原因）

DOM 尚未載入完成 → 使用 WebDriverWait
元素在 iframe 中 → 必須先切換 iframe
元素位於 Shadow DOM → find_elements 不能直接找到
定位方式錯誤 → CSS selector / XPath 要重新檢查
頁面載入時有動態 JS → 需等待動態渲染完成

切換 iframe 後再找元素

# 切換到 iframe 再搜尋
iframe = driver.find_element(By.TAG_NAME, "iframe")
driver.switch_to.frame(iframe)

elems = driver.find_elements(By.CSS_SELECTOR, ".item")
print("找到:", len(elems))

Shadow DOM 需要用 JS 進入 shadowRoot

shadow_host = driver.find_element(By.CSS_SELECTOR, "#shadowHost")
shadow_root = driver.execute_script("return arguments[0].shadowRoot", shadow_host)
elem = shadow_root.find_element(By.CSS_SELECTOR, ".target")

最完整安全的搜尋函式（可重用）

def safe_find_elements(driver, by, selector, timeout=10):
    try:
        return WebDriverWait(driver, timeout).until(
            EC.presence_of_all_elements_located((by, selector))
        )
    except:
        return []  # 找不到回傳空清單

elems = safe_find_elements(driver, By.CSS_SELECTOR, ".item")

if elems:
    print("找到:", len(elems))
else:
    print("找不到元素")

Selenium 處理警示框

類型

簡單警示框 - 只有「確定」按鈕。
確認警示框 - 有「確定」和「取消」按鈕。
提示警示框 - 有輸入框，並帶有「確定」和「取消」按鈕。

處理簡單警示框


from selenium import webdriver
from selenium.webdriver.common.alert import Alert

driver = webdriver.Chrome()
driver.get("URL")

alert = Alert(driver)
print(alert.text)  # 取得警示訊息
alert.accept()  # 點擊確定

driver.quit()

處理確認警示框


alert = Alert(driver)
print(alert.text)

alert.accept()  # 點擊確定
# alert.dismiss()  # 點擊取消

處理提示警示框


alert = Alert(driver)
print(alert.text)

alert.send_keys("測試輸入")  # 輸入內容
alert.accept()  # 點擊確定

最佳實踐

使用 driver.switch_to.alert 切換到警示框。
使用 try-except 處理異常，以避免測試失敗。

使用顯式等待確保警示框已出現：


from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

WebDriverWait(driver, 10).until(EC.alert_is_present())

Selenium 檢查警示框

檢查是否有警示框

在 Selenium 中，可以使用 WebDriverWait 來檢查警示框是否存在，避免因為警示框未出現而導致錯誤。


from selenium import webdriver
from selenium.webdriver.common.alert import Alert
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()
driver.get("URL")

try:
    # 等待 5 秒檢查是否有警示框
    WebDriverWait(driver, 5).until(EC.alert_is_present())
    alert = Alert(driver)
    print("警示框內容:", alert.text)
    alert.accept()  # 點擊確定
except:
    print("沒有發現警示框")

driver.quit()

最佳實踐

使用 WebDriverWait 確保警示框出現後才切換，避免 NoAlertPresentException。
使用 try-except 來防止因為沒有警示框而導致測試失敗。

處理系統警示框

問題

使用 WebDriverWait(driver, 5).until(EC.alert_is_present()) 只能檢測 JavaScript 產生的警示框，而無法檢測 Chrome 系統級別的警示框，例如「儲存密碼」、「網站通知」等。

解決方案

使用 ChromeOptions 禁用系統級別警示框。
若已出現系統警示框，可能需要使用 pyautogui 或 Win32 API 來模擬鍵盤或滑鼠操作。

方法 1：禁用 Chrome System Alert

可以在啟動 Chrome 時，透過 ChromeOptions 來關閉通知和其他系統級彈出視窗。


from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument("--disable-notifications")  # 禁用通知
options.add_argument("--disable-save-password-bubble")  # 禁用儲存密碼提示

driver = webdriver.Chrome(options=options)
driver.get("URL")

方法 2：使用 pyautogui 處理系統警示框

若警示框已出現，可以使用 pyautogui 來模擬按鍵操作，例如按 Enter 或 Esc 來關閉。


import pyautogui
import time

time.sleep(3)  # 等待警示框出現
pyautogui.press("enter")  # 模擬按下 Enter 鍵

方法 3：使用 Win32 API（適用於 Windows）

若在 Windows 環境，可以使用 pygetwindow 和 pywinauto 來偵測並關閉系統級彈出視窗。


import pygetwindow as gw
import pywinauto

windows = gw.getWindowsWithTitle("Google Chrome")  # 獲取 Chrome 視窗
for win in windows:
    if "system alert" in win.title.lower():  # 檢查標題是否包含 "system alert"
        win.close()  # 關閉視窗

最佳實踐

在啟動瀏覽器時，使用 ChromeOptions 來預防警示框。
若系統警示框已出現，考慮使用 pyautogui 或 Win32 API 來模擬鍵盤或視窗操作。

Shadow DOM

什麼是 Shadow DOM？

Shadow DOM 是 Web Components 的一部分，用來封裝 HTML、CSS 和 JavaScript，讓元件的內部實作細節不會干擾到外部。

簡單來說，它是一種「隔離作用域」的 DOM 結構。

---

Shadow DOM 結構示意

<custom-element>
  #shadow-root (open)
    <button>點我</button>
</custom-element>

button 實際存在於 shadow DOM 裡，無法用傳統的 document.querySelector("button") 找到。

---

開放與封閉模式

open：可用 JavaScript 存取 element.shadowRoot
closed：element.shadowRoot 回傳 null，不可存取

---

建立 Shadow DOM（open 模式）

const shadowHost = document.querySelector('#host');
const shadowRoot = shadowHost.attachShadow({ mode: 'open' });
shadowRoot.innerHTML = '<p>Hello from Shadow DOM</p>';

---

使用 slot 插槽

// shadow DOM 裡
<div><slot name="title">預設標題</slot></div>

// 外部使用
<custom-element>
  <span slot="title">自訂標題</span>
</custom-element>

---

Selenium 中操作 Shadow DOM

js = """
const host = document.querySelector('custom-element');
const shadow = host.shadowRoot;
return shadow.querySelector('button');
"""
button = driver.execute_script(js)
button.click()

---

優點

封裝性：CSS/JS 不外洩或被外部影響
組件化：可重用的 UI 元件
安全性：限制開發者只能透過指定 API 操作內部

---

限制

無法用 XPath 或一般 CSS Selector 直接選取 shadow 裡的元素
需用 JavaScript 取出 shadowRoot 後再查找

Selenium 搭配 Tor Browser

基本概念

Tor Browser 本質上是 Firefox ESR 加上 Tor Network 設定與強化隱私設定。Selenium 無法直接「控制 Tor Browser GUI」，但可以透過 Firefox + Tor SOCKS Proxy 的方式，達到與 Tor Browser 相同的匿名效果。

必要條件

已安裝 Tor Browser（或至少 Tor Expert Bundle）
Python 套件：selenium
Firefox 與對應版本 geckodriver

Tor 啟動方式

先確保 Tor 已在本機執行，預設 SOCKS proxy 為：

127.0.0.1:9050

若使用 Tor Browser，啟動後通常是：

127.0.0.1:9150

使用 Selenium 設定 Tor Proxy

from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from selenium.webdriver.firefox.service import Service

options = Options()
options.set_preference("network.proxy.type", 1)
options.set_preference("network.proxy.socks", "127.0.0.1")
options.set_preference("network.proxy.socks_port", 9150)
options.set_preference("network.proxy.socks_remote_dns", True)

service = Service("geckodriver.exe")
driver = webdriver.Firefox(service=service, options=options)

driver.get("https://check.torproject.org")

驗證是否成功走 Tor

進入以下網址，頁面顯示使用 Tor 即代表成功：

https://check.torproject.org

指定 Tor Browser 的 Firefox Binary

若你希望使用 Tor Browser 內建的 Firefox：

options.binary_location = r"C:\Tor Browser\Browser\firefox.exe"

完整範例（Windows）

from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from selenium.webdriver.firefox.service import Service

options = Options()
options.binary_location = r"C:\Tor Browser\Browser\firefox.exe"

options.set_preference("network.proxy.type", 1)
options.set_preference("network.proxy.socks", "127.0.0.1")
options.set_preference("network.proxy.socks_port", 9150)
options.set_preference("network.proxy.socks_remote_dns", True)

service = Service("geckodriver.exe")
driver = webdriver.Firefox(service=service, options=options)

driver.get("https://check.torproject.org")

注意事項

Tor + Selenium 容易被網站識別為自動化行為
Tor Browser 的安全機制可能會因 Selenium 偏好設定而被弱化
請勿登入真實身分帳號，避免關聯性洩漏
Tor 網路速度慢，需增加 Selenium timeout 設定

常見錯誤

無法連線：Tor 未啟動或 SOCKS port 錯誤
Firefox 無法啟動：geckodriver 與 Firefox 版本不相容
IP 未變更：未設定 socks_remote_dns

總結

Selenium 無法直接控制 Tor Browser UI
正確方式是 Firefox + Tor SOCKS Proxy
設定 socks_remote_dns 是匿名的關鍵

Python 提取 Thunderbird 重要郵件

步驟 1：準備環境

要從 Thunderbird 提取電子郵件，可以使用 Python 的 IMAP 協議庫，例如 imaplib 或第三方庫 imapclient。首先，請確保 Thunderbird 已啟用 IMAP 協議並允許外部應用程式連接。

步驟 2：安裝所需的 Python 庫

使用 pip 安裝相關庫：

pip install imapclient pyzmail36

步驟 3：連接到郵件伺服器

使用以下代碼連接到電子郵件伺服器並提取重要電子郵件：


import imapclient
from pyzmail import PyzMessage

# 設定郵件伺服器和登入資訊
IMAP_SERVER = 'imap.example.com'  # 替換為您的 IMAP 伺服器地址
EMAIL = '[email protected]'
PASSWORD = 'your_password'

# 連接到 IMAP 伺服器
with imapclient.IMAPClient(IMAP_SERVER) as client:
    client.login(EMAIL, PASSWORD)
    client.select_folder('INBOX')

    # 搜尋標示為重要的郵件
    messages = client.search(['FLAGGED'])
    for uid in messages:
        raw_message = client.fetch([uid], ['BODY[]'])[uid][b'BODY[]']
        message = PyzMessage.factory(raw_message)
        
        # 顯示郵件資訊
        print(f"Subject: {message.get_subject()}")
        print(f"From: {message.get_address('from')}")
        print(f"Date: {message.get_decoded_header('date')}")

步驟 4：注意事項

請確保 IMAP 伺服器地址正確，並且您的帳戶已啟用 IMAP 協議。
根據您的伺服器設置，可能需要生成應用專用密碼或啟用安全連接（SSL）。
切勿在代碼中直接存儲密碼，建議使用環境變數或密碼管理工具。

步驟 5：測試和調試

執行上述代碼，查看是否能成功提取標示為重要的電子郵件。如果有任何連接問題，可以檢查伺服器設置，或者在 IMAP 協議層進行更詳細的調試。

這樣，您可以成功使用 Python 從 Thunderbird 提取重要電子郵件。

PyAutoGUI

安裝PyAutoGUI

使用以下指令安裝PyAutoGUI：

pip install pyautogui

基本功能

PyAutoGUI 是一個自動化工具，允許模擬滑鼠、鍵盤操作，適合GUI自動化測試或重複性工作。

滑鼠操作

控制滑鼠的位置和操作：

import pyautogui

# 取得螢幕解析度
screen_width, screen_height = pyautogui.size()
print(f"螢幕解析度: {screen_width}x{screen_height}")

# 移動滑鼠到指定座標
pyautogui.moveTo(100, 100, duration=1)

# 從當前位置移動滑鼠
pyautogui.move(50, 50, duration=1)

# 模擬滑鼠點擊
pyautogui.click(200, 200)

# 模擬滑鼠右鍵
pyautogui.rightClick()

# 模擬拖曳操作
pyautogui.dragTo(400, 400, duration=1)

鍵盤操作

模擬鍵盤按鍵輸入：

import pyautogui

# 輸入文字
pyautogui.write("Hello, PyAutoGUI!", interval=0.1)

# 模擬按下特定按鍵
pyautogui.press("enter")

# 同時按下多個按鍵
pyautogui.hotkey("ctrl", "c")  # 複製文字

截圖與影像辨識

擷取螢幕截圖或尋找特定影像：

import pyautogui

# 擷取整個螢幕
screenshot = pyautogui.screenshot()
screenshot.save("screenshot.png")

# 在螢幕中尋找影像
location = pyautogui.locateOnScreen("image.png")
if location:
    print(f"影像位置: {location}")
else:
    print("影像未找到")

警告與安全

防止程式無限執行，可以使用 pyautogui.FAILSAFE：

pyautogui.FAILSAFE = True  # 預設為True
# 將滑鼠移到螢幕左上角 (0, 0) 可立即停止程式

常見應用

自動化重複性操作，例如填表或點擊。
截圖檢測某些UI元素是否存在。
模擬鍵盤與滑鼠操作進行簡單測試。

控制 Surfshark VPN

前置準備

如果 Surfshark VPN 沒有提供命令列工具（如 surfshark-cli），則需要透過 GUI 自動化工具（如 pyautogui）模擬人工操作。

已安裝 Surfshark VPN 桌面應用程式。
Python 已安裝 pyautogui 模組（可透過 pip install pyautogui 安裝）。
確保 Python 腳本具有足夠的權限。

程式邏輯

透過 pyautogui 自動化點擊 Surfshark 的圖形介面按鈕來連接或斷開 VPN。

範例程式碼

以下範例假設 Surfshark VPN 的按鈕位置固定，並使用 pyautogui 進行操作：


import pyautogui
import time

def connect_vpn():
    # 確保 Surfshark 已開啟
    print("嘗試連接 VPN...")
    # 模擬點擊「連接」按鈕，根據實際位置調整座標
    pyautogui.click(x=500, y=300)  # 替換成「連接」按鈕的位置
    time.sleep(5)  # 等待連接完成
    print("VPN 已連接")

def disconnect_vpn():
    # 確保 Surfshark 已開啟
    print("嘗試斷開 VPN...")
    # 模擬點擊「斷開」按鈕，根據實際位置調整座標
    pyautogui.click(x=500, y=350)  # 替換成「斷開」按鈕的位置
    time.sleep(5)  # 等待斷開完成
    print("VPN 已斷開")

# 測試
connect_vpn()
disconnect_vpn()

實際操作中的注意事項

按鈕座標：需要根據螢幕解析度和 Surfshark VPN 介面調整 x 和 y 的座標。
啟動應用程式：確保 Surfshark VPN 已啟動，否則可使用 subprocess 打開應用程式，例如 subprocess.run("start surfshark.exe", shell=True)。
自動化權限：可能需要在 Windows 設置中允許模擬輸入。

替代方法

如果座標方式不穩定，可以使用影像識別（如 pyautogui.locateOnScreen()）來找到按鈕位置，增加靈活性。

Kivy - Python GUI

Kivy 是一個開源的 Python 框架，用來快速開發多點觸控應用程序。它的設計初衷是跨平台支持，允許開發者在 Windows、macOS、Linux、iOS 和 Android 等多個平台上運行同一份代碼。Kivy 特別適合構建用於手機、平板電腦和桌面設備的 GUI 應用程序，並且它有良好的多點觸控支持。

Kivy 的主要功能

跨平台支持：Kivy 支持主流的操作系統，包括 Windows、macOS、Linux 以及移動平台如 Android 和 iOS。
多點觸控：內建對多點觸控事件的支持，適合開發手機和平板應用。
高效的界面設計：Kivy 提供豐富的 UI 控件，並且可以使用 Kivy Language (KV) 快速設計和布局界面。
硬件加速：Kivy 使用 OpenGL ES 2 渲染圖形，保證應用的流暢性和性能。

如何使用 Kivy

Kivy 的應用程序由多個 Widget 組成，這些 Widget 可以通過代碼或 Kivy 的專用語言 KV 文件進行布局。以下是一個簡單的應用程序範例，它顯示了一個按鈕，當按鈕被點擊時會改變顏色。

基本範例


from kivy.app import App
from kivy.uix.button import Button

class MyApp(App):
    def build(self):
        return Button(text='Hello, Kivy!', 
                      background_color=(0, 1, 0, 1))  # 綠色按鈕

if __name__ == '__main__':
    MyApp().run()

安裝 Kivy

可以通過 pip 安裝 Kivy：

pip install kivy

Kivy 的應用場景

Kivy 適用於多種應用場景，包括但不限於：

手機和平板的多點觸控應用
跨平台的桌面應用
遊戲開發
創新型界面和交互設計

Python Kivy 如何遠端顯示

Kivy 是一個用於建立跨平台應用的 Python 框架，但它通常運行在本地裝置上。要將 Kivy 應用程式顯示在遠端，您可以考慮以下幾種方式：

1. 使用 VNC 或遠端桌面工具

您可以使用 VNC（Virtual Network Computing）或其他遠端桌面工具（如 RDP、TeamViewer 等）來遠端控制並顯示 Kivy 應用程式。

在伺服器上安裝 VNC 伺服器或其他遠端桌面軟體。
在本地裝置上安裝對應的客戶端工具。
連接到伺服器，遠端顯示 Kivy 應用程式。

2. 使用 X11 Forwarding（適用於 Linux）

對於使用 Linux 的用戶，您可以使用 X11 forwarding 在遠端顯示圖形界面：

確保您在遠端伺服器上安裝了 X11。
在本地端使用 SSH 命令進行 X11 forwarding：
```
ssh -X username@remote_host
```
執行 Kivy 應用程式，它將顯示在您的本地裝置上。

3. 使用 Kivy + Flask 做為 Web 應用顯示

您可以使用 Flask 或其他 Web 框架將 Kivy 應用程式部分功能暴露給遠端用戶，並使用 Web 瀏覽器顯示：

建立一個 Flask 後端來處理 Kivy 相關的數據或操作。
在 Web 前端顯示相應的輸出（Kivy 不能直接顯示在 Web 中，因此這種方法主要用於數據處理或後端互動）。

4. Docker + Kivy + VNC

如果您希望在容器化環境中運行 Kivy 應用，您可以使用 Docker 和 VNC 進行設置：

將 Kivy 應用打包進 Docker 容器中。
在容器中安裝 VNC 伺服器。
通過 VNC 連接遠端容器，查看 Kivy 應用界面。

No module named 'kivy.garden.tickmarker'

ModuleNotFoundError: No module named 'kivy.garden.tickmarker'

This error indicates that the tickmarker module from Kivy's Garden is not installed. To fix this issue, follow the steps below:

Steps to Resolve the Issue

Install Kivy Garden
If you don’t already have Garden installed, open your terminal or command prompt and run the following command:
```
pip install kivy-garden
```
Install the Tickmarker Widget
After installing Kivy Garden, install the tickmarker widget by running:
```
garden install tickmarker
```

Once you've done these steps, try running your Kivy application again.

Rio UI

簡介

Rio UI 是一個以 Python 為核心的用戶介面框架，設計理念是讓開發者能以簡單、直覺的方式撰寫互動式應用程式。它基於 Python 的程式邏輯，並透過現代化的前端技術呈現 UI。

特色

使用純 Python 語法即可撰寫 UI，降低前後端分離的學習門檻。
支援即時更新與反應式介面。
可搭配 Web 技術，提供跨平台的解決方案。
簡化部署流程，適合快速原型設計。

安裝方法

pip install rio-ui

基本範例


import rio

app = rio.App()

@app.page("/")
def index():
    return rio.Text("Hello, Rio UI with Python!")

if __name__ == "__main__":
    app.run()

應用場景

快速開發小型工具與內部系統
建立互動式數據可視化應用
教育或研究性質的原型系統

email: [email protected]

T:0000

資訊與搜尋 | 回dev首頁 | 回python首頁
email: Yan Sa [email protected] Line: 阿央

電話: 02-27566655 ,03-5924828

阿央
泱泱科技
捷昱科技泱泱企業

Python

軟體開發

多媒體軟體開發

Python常用連結

Python 的優勢

簡潔易學的語法

豐富的標準庫與第三方資源

跨平台的特性

廣泛應用於多個領域

活躍的社群支持

高效的開發速度

Python 開發環境

Anaconda

什麼是 Anaconda？

主要功能

適合對象

如何安裝 Anaconda？

常見問題

Anaconda 環境

什麼是 Anaconda 環境

建立環境

啟動與切換環境

查看環境

匯出與還原環境

刪除環境

Jupyter

什麼是 Jupyter？

核心特點

主要組件

應用範圍

如何使用 Jupyter？

優勢與挑戰

VS Code Python 開發環境

安裝Visual Studio Code

安裝Python擴展

安裝Python

設定Python解譯器

執行Python程式

安裝必要套件

啟用自動完成與除錯

常用快捷鍵

VS Code

VS Code設定Python執行參數

修改launch.json

設定program與args參數

args的用途

在程式中讀取參數

執行範例

VS Code Python Debug 模式

啟用 Debug 模式

設定 launch.json

設置中斷點

調試功能

檢查變數

使用 Debug Console

VS Code 設定 Python 路徑

步驟 1：安裝 Python 與 VS Code

步驟 2：安裝 Python 擴充套件

步驟 3：檢查 Python 安裝路徑

步驟 4：設定 Python 路徑

步驟 5：確認設定

附加資訊

VS Code Python 環境切換

1. 選擇 Python 環境的步驟

2. 如何決定使用 Anaconda 或其他環境

3. 在 Conda 中管理與切換環境

4. 常見問題與解決方案

在 Chromebook 執行 Python

方法一：使用 Linux (Crostini)

方法二：使用線上編譯器

方法三：安裝 Android App

方法四：使用 VS Code

結論

pip 使用指南

1. 什麼是 pip？

2. pip 的基本操作

3. 進階功能

4. 常見問題與解決方案

5. pip 的最佳實踐

pip/cache/http-v2 資料夾

2. 使用 `len()` 函數

3. 使用等值比較 `== []`