《筆記》RAG Agents: 用 Flowise 建構 RAG 應用程式 (上)

sky · 2025年11月19日14:11

本章將正式進入實作階段，目標是在自己電腦上，透過 API 構建 RAG 應用程式。

▌33. 本章課程概述

和之前一樣，課程開始第一節，介紹本章（33 - 51）將進行的主題說明，最後一節總複習。

核心生態系：將在 Flowise 介面中，使用 LangChain 和 LangGraph 的功能。
LLM 模型：概覽 OpenAI、Gemini、DeepL、Anthropic 等，並介紹 OpenRouter 的使用。
實作路徑：
1. OpenAI API 基礎：理解費用、Token 計算與 Playground。
2. 環境建置：安裝 NodeJS (使用 NVM 管理版本) 與本地端 Flowise。
3. 應用程式演進：
  - 基礎 Chatbot：建立、匯出/匯入流程。
  - RAG 應用：結合本地 LLM (Ollama) 與嵌入模型，強調資料隱私。
  - 工具代理 (Tool Agents)：整合外部 API (如 Gmail, Calendar) 與 ReAct 框架。
  - 多代理系統 (Multi-Agents)：建立「主管 (CEO)」與「工作者」的協作架構。
  - 順序代理 (Sequential Agents) 與人在迴路 (Human-in-the-loop)。

▌34. OpenAI API：定價策略與金鑰管理

本節說明如何以最具成本效益的方式使用 OpenAI API。

1. 付費與帳戶設定

模式：採用「Pay-as-you-go」（隨用隨付）。
建議：即使不綁卡也可使用 Ollama，但強烈建議使用 OpenAI 以獲得最佳穩定性。測試成本極低，約 $5 美元即可涵蓋全課程。

2. 模型選擇策略 (Model Strategy)

類別	推薦模型	特色與成本	適用場景
課程首選	GPT-4o mini	CP 值最高 (輸入 $0.15 / 輸出 $0.60)	通用任務、大部分課程練習
推理模型	o4-mini	推理模型中最實惠	代理 (Agent)、複雜推理任務
邏輯模型	GPT-4.1 mini	擅長編碼與邏輯	程式碼生成、邏輯判斷
~~應避免~~	~~GPT-4, 3.5 Turbo~~	~~舊版或過於昂貴~~	不推薦使用

3. 安全與管理

API Key：建立時權限設為 “All”，務必立即複製保存，遺失無法查看。
預算控制：強烈建議設定「軟性警報 (Alert)」與「硬性上限 (Hard limit)」(例如 $40)，避免意外超支。
GDPR：歐洲用戶可選擇歐洲區專案，確保零資料保留。

▌35. OpenAI Playground：測試與 Responses API

不需訂閱 ChatGPT Plus 即可在 Playground 測試所有 API 功能。

1. RAG 建構方式的演進

舊方法 (Assistants API)：即將於 2026 年退場。功能類似 ChatGPT 的 GPTs，包含 File Search 和 Code Interpreter。
新趨勢 (Responses API)：
- 未來的核心方向。
- 最大優勢：原生整合 File Search (內部文件) + Web Search (網路搜尋)，功能更強大。

2. 其他 API 功能測試

Text-to-Speech (TTS)：製作語音內容，GPT-4o mini 的 TTS 成本相對低廉。
Images (DALL-E 3)：生成或編輯圖像，費用依解析度變動。
Realtime API (語音對話)：警告！非常昂貴 (每百萬 Token 輸出高達 $64)，開發時需謹慎使用。

▌36. Flowise, LangChain 與 LangGraph

為何選擇 Flowise 作為開發平台，而非直接編寫程式碼。

痛點：LangChain 生態系強大但複雜，直接撰寫 Python / JS 門檻高。
解決方案：Flowise
- 定位：低程式碼 (Low-code) / 無程式碼 (No-code) 的視覺化介面。
- 原理：Flowise 是「介面」，底層運行的仍是 LangChain 與 LangGraph。
- 優勢：透過「拖拉節點」即可完成複雜的 AI 流程，僅在必要時撰寫少量 JavaScript。
LangChain vs. LangGraph：
- LangChain：適合一般、線性的 AI 應用。
- LangGraph：專為 AI 代理 (Agents) 設計，擅長處理函式呼叫與多代理協作。

▌37. Flowise 安裝前置：NodeJS 環境建置

為了完全掌控資料與節省成本，課程選擇「本地安裝」Flowise。

1. Flowise 部署選項比較

雲端版 (Cloud)：簡單但免費版限制多 (僅 2 個流程)。
自行託管 (Self-Host)：如 Render，適合未來接案或服務客戶。
本地安裝 (Local) [本課採用]：
- 透過 NodeJS 在 Localhost 運行。
- 優點：完全免費、無功能限制、適合學習與測試。

2. 關鍵環境需求：NodeJS

版本限制：Flowise 嚴格要求 NodeJS 版本需為 18.15.0 或 20+。版本錯誤將導致安裝失敗。
管理工具：後續將介紹使用 NVM (Node Version Manager) 來切換版本，確保環境正確。

3. 下一步

下載並安裝 NodeJS。
重要提示：安裝過程中若詢問是否安裝額外工具 (如 Python, Chocolatey)，請務必勾選安裝，以避免未來套件相依性問題。

4. 總結

註冊 OpenAI API：綁定付款方式，設定預算上限，並取得 API Key。
熟悉 Playground：嘗試操作 Responses API，體驗 RAG 與搜尋的結合。
準備開發環境：下載並安裝 NodeJS (建議連同額外工具包一起安裝)，為下一節安裝 Flowise 做好準備。

▌Gemini 3 帶來的衝擊

Google 剛在兩天前（11 月 18 日）發布了 Gemini 3 系列，在「代理（Agentic）」能力和「推理」上有了顯著的優勢。

我認為課程中 OpenAI 的部分，可以考慮改用 Gemini，不僅模型表現較優，價格還更便宜。（難怪這兩天 google 股價狂漲）

以下是將 OpenAI 模型替換為最新的 Gemini 生態系模型 的對照整理與價格比較（由 Gemini 製表，我還沒驗證）：

一、模型對照表：OpenAI vs. Gemini (2025 最新版)

根據你的課程需求（CP 值 vs. 推理能力），以下是 Gemini 的最佳對應選擇：

OpenAI 模型	角色定位	Gemini 對應模型	選擇理由
GPT-4o mini	高 CP 值首選 (日常對話、簡單 RAG)	Gemini 1.5 Flash-8B (或 Gemini 2.5 Flash)	這是目前市面上極致便宜且快速的模型。Flash-8B 專為高頻率、低延遲任務設計，非常適合取代 GPT-4o mini 進行大量文本處理。
o4-mini (推理模型)	邏輯與代理 (Agent, 複雜任務)	Gemini 3 Pro (最新旗艦)	剛發布的 Gemini 3 Pro 被稱為「最强代理模型 (Most Agentic)」。雖然它是 Pro 等級（非 Mini），但它針對多步驟推理和編碼進行了優化，是執行課程中「CEO 代理」或「複雜工作流」的最佳選擇。
GPT-4.1 mini (邏輯模型)	編碼與邏輯	Gemini 3 Pro	同上，Gemini 3 Pro 在處理程式碼重構和複雜邏輯上表現超越了舊代模型，適合用來撰寫 System Prompt 或除錯。

二、價格大比拼：Gemini vs. OpenAI

這裡有一個驚人的發現：Gemini 在「高 CP 值」端具有壓倒性的價格優勢。

1. 入門/高 CP 值組 (The Budget Kings)

這是課程中最常用的類別。

項目	OpenAI GPT-4o mini	Gemini 1.5 Flash-8B	勝出者
輸入 (Input)	$0.15 / 1M tokens	$0.0375 / 1M tokens	Gemini (便宜 4 倍)
輸出 (Output)	$0.60 / 1M tokens	$0.15 / 1M tokens	Gemini (便宜 4 倍)
結論	雖然 GPT-4o mini 已經很便宜，但 Google 的 Flash-8B 簡直是價格破壞者。如果你想以最低成本跑完這堂課，選 Flash-8B。

2. 推理/代理組 (The Reasoning Agents)

這是執行「多代理框架 (Multi-Agents)」或「複雜推理」時的對比。
(註：OpenAI 使用的是 o4-mini 價格，而 Gemini 是以最新的旗艦 Gemini 3 Pro 對比，以獲得最佳效果)

項目	OpenAI o4-mini	Gemini 3 Pro (Preview)	比較分析
輸入 (Input)	$1.10 / 1M tokens	$2.00 / 1M tokens	OpenAI 較便宜
輸出 (Output)	$4.40 / 1M tokens	$12.00 / 1M tokens	OpenAI 較便宜
結論	注意成本！ Gemini 3 Pro 是「旗艦級」模型，價格高於 OpenAI 的「Mini」推理模型。但它提供了更強的上下文理解 (Long Context) 和針對 Agent 優化的能力。建議策略：在 Flowise 開發和測試流程時，先使用超便宜的 Flash-8B 或 Gemini 2.5 Flash。只有在最後需要「高品質推理」或「最終產出」時，才切換到 Gemini 3 Pro。

3. 模型比較（評分 & 價格）

以下再對 GPT-4o mini, Gemini 1.5 Flash-8B & Gemini 1.5 Flash 做比較。

補充：雖然 GPT-4o mini 在「邏輯推理 (Math/Code)」上略勝一籌，但 Gemini 1.5 Flash 系列 在「RAG 關鍵能力（Context Window）」和「價格」上具有壓倒性優勢。

以下是這三個模型的詳細基準測試 (Benchmark) 與價格對照：

基準測試分數 (Benchmarks，分數越高越好)

測試項目	GPT-4o mini	Gemini 1.5 Flash	Gemini 1.5 Flash-8B	解讀
MMLU (綜合知識)	82.0%	78.9%	~78%	GPT-4o mini 在一般知識回答上稍準確一點，但差距不大。
MATH (數學推理)	87.0%	~75%	~72%	在處理複雜數學或需要高度邏輯的 Agent 任務時，GPT-4o mini 表現較好。
HumanEval (程式碼能力)	87.2%	74.3%	~70%	如果你需要寫複雜程式碼，選 GPT-4o mini；如果是簡單的 JSON 處理，Gemini 足矣。
Context Window (上下文窗口)	128k	100 萬 (1M)	100 萬 (1M)	RAG 的關鍵勝負手！ Gemini 可以一次吃下整本書或數十個 PDF，而 GPT-4o mini 容量較小。

對 RAG 課程的意義：

GPT-4o mini：適合做「最後的回答者」，因為它講話比較漂亮、邏輯好。

Gemini 1.5 Flash/8B：適合做「檢索者」或「大量資料處理者」，因為它能讀非常多資料，且讀得非常快。

價格對照表 (每 100 萬 Token，美金計價，價格越低越好)

Gemini 1.5 Flash-8B 是目前的價格破壞者，價格僅為 GPT-4o mini 的 1/4。

項目	GPT-4o mini	Gemini 1.5 Flash	Gemini 1.5 Flash-8B	價格倍率 (vs 4o-mini)
輸入 (Input) (餵給 AI 的文件)	$0.150	$0.075	$0.0375	便宜 4 倍
輸出 (Output) (AI 生成的回答)	$0.600	$0.300	$0.1500	便宜 4 倍
快取 (Cached) (重複使用文件)	$0.075	$0.01875	$0.0100	便宜 7.5 倍

成本試算：
假設 RAG 要處理 1000 頁的 PDF 文件 (約 50 萬 Token)：

使用 GPT-4o mini：花費約 $0.075

使用 Gemini 1.5 Flash-8B：花費約 $0.018 (幾乎免費)

三、綜合建議

開發階段 (Dev)：
- 全部使用 Gemini 1.5 Flash-8B。它的速度極快（低延遲），而且幾乎免費。你在 Flowise 中反覆測試流程時，這會幫你省下很多等待時間和金錢。
上線階段 (Prod)：
- 如果你的應用需要寫程式或算數學：切換回 GPT-4o mini 或升級到 Gemini 3 Pro。
- 如果你的應用只是單純的「根據文件回答問題 (Q&A)」：繼續使用 Gemini 1.5 Flash，它的 1M 上下文窗口能讓你的 RAG 檢索更精準（可以一次塞入更多上下文）。

建議策略

修改 Flowise 設定：在執行 Flowise 時，當切換到 GPT-4o mini 時，可改用 Gemini 1.5 Flash-8B（或 Gemini 1.5 Flash）。速度極快，而且帳單幾乎是零。
體驗 Gemini 3：當課程進入「多代理 (Multi-Agent)」章節，需要聰明的「主管 (CEO)」時，試著接上剛發布的 Gemini 3 Pro。雖然貴一點，但它的邏輯推理能力目前是市場頂尖，會比課程中的 o4-mini 表現得更像人類。
善用免費額度：Google AI Studio 提供不錯的免費層級 (Free Tier)，開發階段可以善用，搞不好完全不需要付費。