本章將正式進入實作階段,目標是在自己電腦上,透過 API 構建 RAG 應用程式。
▌33. 本章課程概述
和之前一樣,課程開始第一節,介紹本章(33 - 51)將進行的主題說明,最後一節總複習。
-
核心生態系:將在 Flowise 介面中,使用 LangChain 和 LangGraph 的功能。
-
LLM 模型:概覽 OpenAI、Gemini、DeepL、Anthropic 等,並介紹 OpenRouter 的使用。
-
實作路徑:
-
OpenAI API 基礎:理解費用、Token 計算與 Playground。
-
環境建置:安裝 NodeJS (使用 NVM 管理版本) 與本地端 Flowise。
-
應用程式演進:
-
基礎 Chatbot:建立、匯出/匯入流程。
-
RAG 應用:結合本地 LLM (Ollama) 與嵌入模型,強調資料隱私。
-
工具代理 (Tool Agents):整合外部 API (如 Gmail, Calendar) 與 ReAct 框架。
-
多代理系統 (Multi-Agents):建立「主管 (CEO)」與「工作者」的協作架構。
-
順序代理 (Sequential Agents) 與 人在迴路 (Human-in-the-loop)。
-
-
▌34. OpenAI API:定價策略與金鑰管理
本節說明如何以最具成本效益的方式使用 OpenAI API。
1. 付費與帳戶設定
-
模式:採用「Pay-as-you-go」(隨用隨付)。
-
建議:即使不綁卡也可使用 Ollama,但強烈建議使用 OpenAI 以獲得最佳穩定性。測試成本極低,約 $5 美元即可涵蓋全課程。
2. 模型選擇策略 (Model Strategy)
| 類別 | 推薦模型 | 特色與成本 | 適用場景 |
|---|---|---|---|
| 課程首選 | GPT-4o mini | CP 值最高 (輸入 $0.15 / 輸出 $0.60) | 通用任務、大部分課程練習 |
| 推理模型 | o4-mini | 推理模型中最實惠 | 代理 (Agent)、複雜推理任務 |
| 邏輯模型 | GPT-4.1 mini | 擅長編碼與邏輯 | 程式碼生成、邏輯判斷 |
| 不推薦使用 |
3. 安全與管理
-
API Key:建立時權限設為 “All”,務必立即複製保存,遺失無法查看。
-
預算控制:強烈建議設定「軟性警報 (Alert)」與「硬性上限 (Hard limit)」(例如 $40),避免意外超支。
-
GDPR:歐洲用戶可選擇歐洲區專案,確保零資料保留。
▌35. OpenAI Playground:測試與 Responses API
不需訂閱 ChatGPT Plus 即可在 Playground 測試所有 API 功能。
1. RAG 建構方式的演進
-
舊方法 (Assistants API):即將於 2026 年退場。功能類似 ChatGPT 的 GPTs,包含 File Search 和 Code Interpreter。
-
新趨勢 (Responses API):
-
未來的核心方向。
-
最大優勢:原生整合 File Search (內部文件) + Web Search (網路搜尋),功能更強大。
-
2. 其他 API 功能測試
-
Text-to-Speech (TTS):製作語音內容,GPT-4o mini 的 TTS 成本相對低廉。
-
Images (DALL-E 3):生成或編輯圖像,費用依解析度變動。
-
Realtime API (語音對話):警告!非常昂貴 (每百萬 Token 輸出高達 $64),開發時需謹慎使用。
▌36. Flowise, LangChain 與 LangGraph
為何選擇 Flowise 作為開發平台,而非直接編寫程式碼。
-
痛點:LangChain 生態系強大但複雜,直接撰寫 Python / JS 門檻高。
-
解決方案:Flowise
-
定位:低程式碼 (Low-code) / 無程式碼 (No-code) 的視覺化介面。
-
原理:Flowise 是「介面」,底層運行的仍是 LangChain 與 LangGraph。
-
優勢:透過「拖拉節點」即可完成複雜的 AI 流程,僅在必要時撰寫少量 JavaScript。
-
-
LangChain vs. LangGraph:
-
LangChain:適合一般、線性的 AI 應用。
-
LangGraph:專為 AI 代理 (Agents) 設計,擅長處理函式呼叫與多代理協作。
-
▌37. Flowise 安裝前置:NodeJS 環境建置
為了完全掌控資料與節省成本,課程選擇「本地安裝」Flowise。
1. Flowise 部署選項比較
-
雲端版 (Cloud):簡單但免費版限制多 (僅 2 個流程)。
-
自行託管 (Self-Host):如 Render,適合未來接案或服務客戶。
-
本地安裝 (Local) [本課採用]:
-
透過 NodeJS 在 Localhost 運行。
-
優點:完全免費、無功能限制、適合學習與測試。
-
2. 關鍵環境需求:NodeJS
-
版本限制:Flowise 嚴格要求 NodeJS 版本需為
18.15.0或20+。版本錯誤將導致安裝失敗。 -
管理工具:後續將介紹使用 NVM (Node Version Manager) 來切換版本,確保環境正確。
3. 下一步
-
下載並安裝 NodeJS。
-
重要提示:安裝過程中若詢問是否安裝額外工具 (如 Python, Chocolatey),請務必勾選安裝,以避免未來套件相依性問題。
4. 總結
-
註冊 OpenAI API:綁定付款方式,設定預算上限,並取得 API Key。
-
熟悉 Playground:嘗試操作 Responses API,體驗 RAG 與搜尋的結合。
-
準備開發環境:下載並安裝 NodeJS (建議連同額外工具包一起安裝),為下一節安裝 Flowise 做好準備。
▌Gemini 3 帶來的衝擊
Google 剛在兩天前(11 月 18 日)發布了 Gemini 3 系列,在「代理(Agentic)」能力和「推理」上有了顯著的優勢。
我認為課程中 OpenAI 的部分,可以考慮改用 Gemini,不僅模型表現較優,價格還更便宜。(難怪這兩天 google 股價狂漲)
以下是將 OpenAI 模型替換為最新的 Gemini 生態系模型 的對照整理與價格比較(由 Gemini 製表,我還沒驗證):
一、 模型對照表:OpenAI vs. Gemini (2025 最新版)
根據你的課程需求(CP 值 vs. 推理能力),以下是 Gemini 的最佳對應選擇:
| OpenAI 模型 | 角色定位 | Gemini 對應模型 | 選擇理由 |
|---|---|---|---|
| GPT-4o mini | 高 CP 值首選 (日常對話、簡單 RAG) |
Gemini 1.5 Flash-8B (或 Gemini 2.5 Flash) |
這是目前市面上極致便宜且快速的模型。Flash-8B 專為高頻率、低延遲任務設計,非常適合取代 GPT-4o mini 進行大量文本處理。 |
| o4-mini (推理模型) |
邏輯與代理 (Agent, 複雜任務) |
Gemini 3 Pro (最新旗艦) |
剛發布的 Gemini 3 Pro 被稱為「最强代理模型 (Most Agentic)」。雖然它是 Pro 等級(非 Mini),但它針對多步驟推理和編碼進行了優化,是執行課程中「CEO 代理」或「複雜工作流」的最佳選擇。 |
| GPT-4.1 mini (邏輯模型) |
編碼與邏輯 | Gemini 3 Pro | 同上,Gemini 3 Pro 在處理程式碼重構和複雜邏輯上表現超越了舊代模型,適合用來撰寫 System Prompt 或除錯。 |
二、 價格大比拼:Gemini vs. OpenAI
這裡有一個驚人的發現:Gemini 在「高 CP 值」端具有壓倒性的價格優勢。
1. 入門/高 CP 值組 (The Budget Kings)
這是課程中最常用的類別。
| 項目 | OpenAI GPT-4o mini | Gemini 1.5 Flash-8B | 勝出者 |
|---|---|---|---|
| 輸入 (Input) | $0.15 / 1M tokens | $0.0375 / 1M tokens | Gemini (便宜 4 倍) |
| 輸出 (Output) | $0.60 / 1M tokens | $0.15 / 1M tokens | Gemini (便宜 4 倍) |
| 結論 | 雖然 GPT-4o mini 已經很便宜,但 Google 的 Flash-8B 簡直是價格破壞者。如果你想以最低成本跑完這堂課,選 Flash-8B。 |
2. 推理/代理組 (The Reasoning Agents)
這是執行「多代理框架 (Multi-Agents)」或「複雜推理」時的對比。
(註:OpenAI 使用的是 o4-mini 價格,而 Gemini 是以最新的旗艦 Gemini 3 Pro 對比,以獲得最佳效果)
| 項目 | OpenAI o4-mini | Gemini 3 Pro (Preview) | 比較分析 |
|---|---|---|---|
| 輸入 (Input) | $1.10 / 1M tokens | $2.00 / 1M tokens | OpenAI 較便宜 |
| 輸出 (Output) | $4.40 / 1M tokens | $12.00 / 1M tokens | OpenAI 較便宜 |
| 結論 | 注意成本! Gemini 3 Pro 是「旗艦級」模型,價格高於 OpenAI 的「Mini」推理模型。但它提供了更強的上下文理解 (Long Context) 和針對 Agent 優化的能力。 |
3. 模型比較(評分 & 價格)
以下再對 GPT-4o mini, Gemini 1.5 Flash-8B & Gemini 1.5 Flash 做比較。
補充:雖然 GPT-4o mini 在「邏輯推理 (Math/Code)」上略勝一籌,但 Gemini 1.5 Flash 系列 在「RAG 關鍵能力(Context Window)」和「價格」上具有壓倒性優勢。
以下是這三個模型的詳細基準測試 (Benchmark) 與價格對照:
- 基準測試分數 (Benchmarks,分數越高越好)
| 測試項目 | GPT-4o mini | Gemini 1.5 Flash | Gemini 1.5 Flash-8B | 解讀 |
|---|---|---|---|---|
| MMLU (綜合知識) |
82.0% | 78.9% | ~78% | GPT-4o mini 在一般知識回答上稍準確一點,但差距不大。 |
| MATH (數學推理) |
87.0% | ~75% | ~72% | 在處理複雜數學或需要高度邏輯的 Agent 任務時,GPT-4o mini 表現較好。 |
| HumanEval (程式碼能力) |
87.2% | 74.3% | ~70% | 如果你需要寫複雜程式碼,選 GPT-4o mini;如果是簡單的 JSON 處理,Gemini 足矣。 |
| Context Window (上下文窗口) |
128k | 100 萬 (1M) | 100 萬 (1M) | RAG 的關鍵勝負手! Gemini 可以一次吃下整本書或數十個 PDF,而 GPT-4o mini 容量較小。 |
對 RAG 課程的意義:
- GPT-4o mini:適合做「最後的回答者」,因為它講話比較漂亮、邏輯好。
- Gemini 1.5 Flash/8B:適合做「檢索者」或「大量資料處理者」,因為它能讀非常多資料,且讀得非常快。
- 價格對照表 (每 100 萬 Token,美金計價,價格越低越好)
Gemini 1.5 Flash-8B 是目前的價格破壞者,價格僅為 GPT-4o mini 的 1/4。
| 項目 | GPT-4o mini | Gemini 1.5 Flash | Gemini 1.5 Flash-8B | 價格倍率 (vs 4o-mini) |
|---|---|---|---|---|
| 輸入 (Input) (餵給 AI 的文件) |
$0.150 | $0.075 | $0.0375 | 便宜 4 倍 |
| 輸出 (Output) (AI 生成的回答) |
$0.600 | $0.300 | $0.1500 | 便宜 4 倍 |
| 快取 (Cached) (重複使用文件) |
$0.075 | $0.01875 | $0.0100 | 便宜 7.5 倍 |
成本試算:
假設 RAG 要處理 1000 頁的 PDF 文件 (約 50 萬 Token):
- 使用 GPT-4o mini:花費約 $0.075
- 使用 Gemini 1.5 Flash-8B:花費約 $0.018 (幾乎免費)
三、 綜合建議
-
開發階段 (Dev):
- 全部使用 Gemini 1.5 Flash-8B。它的速度極快(低延遲),而且幾乎免費。你在 Flowise 中反覆測試流程時,這會幫你省下很多等待時間和金錢。
-
上線階段 (Prod):
- 如果你的應用需要寫程式或算數學:切換回 GPT-4o mini 或升級到 Gemini 3 Pro。
- 如果你的應用只是單純的「根據文件回答問題 (Q&A)」:繼續使用 Gemini 1.5 Flash,它的 1M 上下文窗口能讓你的 RAG 檢索更精準(可以一次塞入更多上下文)。
建議策略
-
修改 Flowise 設定:在執行 Flowise 時,當切換到
GPT-4o mini時,可改用Gemini 1.5 Flash-8B(或Gemini 1.5 Flash)。速度極快,而且帳單幾乎是零。 -
體驗 Gemini 3:當課程進入「多代理 (Multi-Agent)」章節,需要聰明的「主管 (CEO)」時,試著接上剛發布的
Gemini 3 Pro。雖然貴一點,但它的邏輯推理能力目前是市場頂尖,會比課程中的o4-mini表現得更像人類。 -
善用免費額度:Google AI Studio 提供不錯的免費層級 (Free Tier),開發階段可以善用,搞不好完全不需要付費。