《筆記》RAG Agents: 用 Flowise 建構 RAG 應用程式 (上)

本章將正式進入實作階段,目標是在自己電腦上,透過 API 構建 RAG 應用程式。

▌33. 本章課程概述

和之前一樣,課程開始第一節,介紹本章(33 - 51)將進行的主題說明,最後一節總複習。

  • 核心生態系:將在 Flowise 介面中,使用 LangChain 和 LangGraph 的功能。

  • LLM 模型:概覽 OpenAI、Gemini、DeepL、Anthropic 等,並介紹 OpenRouter 的使用。

  • 實作路徑:

    1. OpenAI API 基礎:理解費用、Token 計算與 Playground。

    2. 環境建置:安裝 NodeJS (使用 NVM 管理版本) 與本地端 Flowise。

    3. 應用程式演進:

      • 基礎 Chatbot:建立、匯出/匯入流程。

      • RAG 應用:結合本地 LLM (Ollama) 與嵌入模型,強調資料隱私。

      • 工具代理 (Tool Agents):整合外部 API (如 Gmail, Calendar) 與 ReAct 框架。

      • 多代理系統 (Multi-Agents):建立「主管 (CEO)」與「工作者」的協作架構。

      • 順序代理 (Sequential Agents) 與 人在迴路 (Human-in-the-loop)。


▌34. OpenAI API:定價策略與金鑰管理

本節說明如何以最具成本效益的方式使用 OpenAI API。

1. 付費與帳戶設定

  • 模式:採用「Pay-as-you-go」(隨用隨付)。

  • 建議:即使不綁卡也可使用 Ollama,但強烈建議使用 OpenAI 以獲得最佳穩定性。測試成本極低,約 $5 美元即可涵蓋全課程。

2. 模型選擇策略 (Model Strategy)

類別 推薦模型 特色與成本 適用場景
課程首選 GPT-4o mini CP 值最高 (輸入 $0.15 / 輸出 $0.60) 通用任務、大部分課程練習
推理模型 o4-mini 推理模型中最實惠 代理 (Agent)、複雜推理任務
邏輯模型 GPT-4.1 mini 擅長編碼與邏輯 程式碼生成、邏輯判斷
應避免 GPT-4, 3.5 Turbo 舊版或過於昂貴 不推薦使用

3. 安全與管理

  • API Key:建立時權限設為 “All”,務必立即複製保存,遺失無法查看。

  • 預算控制:強烈建議設定「軟性警報 (Alert)」與「硬性上限 (Hard limit)」(例如 $40),避免意外超支。

  • GDPR:歐洲用戶可選擇歐洲區專案,確保零資料保留。


▌35. OpenAI Playground:測試與 Responses API

不需訂閱 ChatGPT Plus 即可在 Playground 測試所有 API 功能。

1. RAG 建構方式的演進

  • 舊方法 (Assistants API):即將於 2026 年退場。功能類似 ChatGPT 的 GPTs,包含 File Search 和 Code Interpreter。

  • 新趨勢 (Responses API):

    • 未來的核心方向。

    • 最大優勢:原生整合 File Search (內部文件) + Web Search (網路搜尋),功能更強大。

2. 其他 API 功能測試

  • Text-to-Speech (TTS):製作語音內容,GPT-4o mini 的 TTS 成本相對低廉。

  • Images (DALL-E 3):生成或編輯圖像,費用依解析度變動。

  • Realtime API (語音對話):警告!非常昂貴 (每百萬 Token 輸出高達 $64),開發時需謹慎使用。


▌36. Flowise, LangChain 與 LangGraph

為何選擇 Flowise 作為開發平台,而非直接編寫程式碼。

  • 痛點:LangChain 生態系強大但複雜,直接撰寫 Python / JS 門檻高。

  • 解決方案:Flowise

    • 定位:低程式碼 (Low-code) / 無程式碼 (No-code) 的視覺化介面。

    • 原理:Flowise 是「介面」,底層運行的仍是 LangChain 與 LangGraph。

    • 優勢:透過「拖拉節點」即可完成複雜的 AI 流程,僅在必要時撰寫少量 JavaScript。

  • LangChain vs. LangGraph:

    • LangChain:適合一般、線性的 AI 應用。

    • LangGraph:專為 AI 代理 (Agents) 設計,擅長處理函式呼叫與多代理協作。


▌37. Flowise 安裝前置:NodeJS 環境建置

為了完全掌控資料與節省成本,課程選擇「本地安裝」Flowise。

1. Flowise 部署選項比較

  • 雲端版 (Cloud):簡單但免費版限制多 (僅 2 個流程)。

  • 自行託管 (Self-Host):如 Render,適合未來接案或服務客戶。

  • 本地安裝 (Local) [本課採用]:

    • 透過 NodeJS 在 Localhost 運行。

    • 優點:完全免費、無功能限制、適合學習與測試。

2. 關鍵環境需求:NodeJS

  • 版本限制:Flowise 嚴格要求 NodeJS 版本需為 18.15.020+。版本錯誤將導致安裝失敗。

  • 管理工具:後續將介紹使用 NVM (Node Version Manager) 來切換版本,確保環境正確。

3. 下一步

  • 下載並安裝 NodeJS。

  • 重要提示:安裝過程中若詢問是否安裝額外工具 (如 Python, Chocolatey),請務必勾選安裝,以避免未來套件相依性問題。

4. 總結

  1. 註冊 OpenAI API:綁定付款方式,設定預算上限,並取得 API Key。

  2. 熟悉 Playground:嘗試操作 Responses API,體驗 RAG 與搜尋的結合。

  3. 準備開發環境:下載並安裝 NodeJS (建議連同額外工具包一起安裝),為下一節安裝 Flowise 做好準備。


▌Gemini 3 帶來的衝擊

Google 剛在兩天前(11 月 18 日)發布了 Gemini 3 系列,在「代理(Agentic)」能力和「推理」上有了顯著的優勢。

我認為課程中 OpenAI 的部分,可以考慮改用 Gemini,不僅模型表現較優,價格還更便宜。(難怪這兩天 google 股價狂漲)

以下是將 OpenAI 模型替換為最新的 Gemini 生態系模型 的對照整理與價格比較(由 Gemini 製表,我還沒驗證):

一、 模型對照表:OpenAI vs. Gemini (2025 最新版)

根據你的課程需求(CP 值 vs. 推理能力),以下是 Gemini 的最佳對應選擇:

OpenAI 模型 角色定位 Gemini 對應模型 選擇理由
GPT-4o mini 高 CP 值首選
(日常對話、簡單 RAG)
Gemini 1.5 Flash-8B
(或 Gemini 2.5 Flash)
這是目前市面上極致便宜且快速的模型。Flash-8B 專為高頻率、低延遲任務設計,非常適合取代 GPT-4o mini 進行大量文本處理。
o4-mini
(推理模型)
邏輯與代理
(Agent, 複雜任務)
Gemini 3 Pro
(最新旗艦)
剛發布的 Gemini 3 Pro 被稱為「最强代理模型 (Most Agentic)」。雖然它是 Pro 等級(非 Mini),但它針對多步驟推理編碼進行了優化,是執行課程中「CEO 代理」或「複雜工作流」的最佳選擇。
GPT-4.1 mini
(邏輯模型)
編碼與邏輯 Gemini 3 Pro 同上,Gemini 3 Pro 在處理程式碼重構和複雜邏輯上表現超越了舊代模型,適合用來撰寫 System Prompt 或除錯。

二、 價格大比拼:Gemini vs. OpenAI

這裡有一個驚人的發現:Gemini 在「高 CP 值」端具有壓倒性的價格優勢。

1. 入門/高 CP 值組 (The Budget Kings)

這是課程中最常用的類別。

項目 OpenAI GPT-4o mini Gemini 1.5 Flash-8B 勝出者
輸入 (Input) $0.15 / 1M tokens $0.0375 / 1M tokens Gemini (便宜 4 倍)
輸出 (Output) $0.60 / 1M tokens $0.15 / 1M tokens Gemini (便宜 4 倍)
結論 雖然 GPT-4o mini 已經很便宜,但 Google 的 Flash-8B 簡直是價格破壞者。如果你想以最低成本跑完這堂課,選 Flash-8B。

2. 推理/代理組 (The Reasoning Agents)

這是執行「多代理框架 (Multi-Agents)」或「複雜推理」時的對比。
(註:OpenAI 使用的是 o4-mini 價格,而 Gemini 是以最新的旗艦 Gemini 3 Pro 對比,以獲得最佳效果)

項目 OpenAI o4-mini Gemini 3 Pro (Preview) 比較分析
輸入 (Input) $1.10 / 1M tokens $2.00 / 1M tokens OpenAI 較便宜
輸出 (Output) $4.40 / 1M tokens $12.00 / 1M tokens OpenAI 較便宜
結論 注意成本! Gemini 3 Pro 是「旗艦級」模型,價格高於 OpenAI 的「Mini」推理模型。但它提供了更強的上下文理解 (Long Context) 和針對 Agent 優化的能力。

:light_bulb: 建議策略:在 Flowise 開發和測試流程時,先使用超便宜的 Flash-8BGemini 2.5 Flash。只有在最後需要「高品質推理」或「最終產出」時,才切換到 Gemini 3 Pro

3. 模型比較(評分 & 價格)

以下再對 GPT-4o mini, Gemini 1.5 Flash-8B & Gemini 1.5 Flash 做比較。

補充:雖然 GPT-4o mini 在「邏輯推理 (Math/Code)」上略勝一籌,但 Gemini 1.5 Flash 系列 在「RAG 關鍵能力(Context Window)」和「價格」上具有壓倒性優勢。

以下是這三個模型的詳細基準測試 (Benchmark) 與價格對照:

  1. 基準測試分數 (Benchmarks,分數越高越好)
測試項目 GPT-4o mini Gemini 1.5 Flash Gemini 1.5 Flash-8B 解讀
MMLU
(綜合知識)
82.0% 78.9% ~78% GPT-4o mini 在一般知識回答上稍準確一點,但差距不大。
MATH
(數學推理)
87.0% ~75% ~72% 在處理複雜數學或需要高度邏輯的 Agent 任務時,GPT-4o mini 表現較好。
HumanEval
(程式碼能力)
87.2% 74.3% ~70% 如果你需要寫複雜程式碼,選 GPT-4o mini;如果是簡單的 JSON 處理,Gemini 足矣。
Context Window
(上下文窗口)
128k 100 萬 (1M) 100 萬 (1M) RAG 的關鍵勝負手!
Gemini 可以一次吃下整本書或數十個 PDF,而 GPT-4o mini 容量較小。

對 RAG 課程的意義:

  • GPT-4o mini:適合做「最後的回答者」,因為它講話比較漂亮、邏輯好。
  • Gemini 1.5 Flash/8B:適合做「檢索者」或「大量資料處理者」,因為它能讀非常多資料,且讀得非常快。
  1. 價格對照表 (每 100 萬 Token,美金計價,價格越低越好)

Gemini 1.5 Flash-8B 是目前的價格破壞者,價格僅為 GPT-4o mini 的 1/4

項目 GPT-4o mini Gemini 1.5 Flash Gemini 1.5 Flash-8B 價格倍率 (vs 4o-mini)
輸入 (Input)
(餵給 AI 的文件)
$0.150 $0.075 $0.0375 便宜 4 倍
輸出 (Output)
(AI 生成的回答)
$0.600 $0.300 $0.1500 便宜 4 倍
快取 (Cached)
(重複使用文件)
$0.075 $0.01875 $0.0100 便宜 7.5 倍

:money_bag: 成本試算:
假設 RAG 要處理 1000 頁的 PDF 文件 (約 50 萬 Token):

  • 使用 GPT-4o mini:花費約 $0.075
  • 使用 Gemini 1.5 Flash-8B:花費約 $0.018 (幾乎免費)

三、 綜合建議

  1. 開發階段 (Dev)

    • 全部使用 Gemini 1.5 Flash-8B。它的速度極快(低延遲),而且幾乎免費。你在 Flowise 中反覆測試流程時,這會幫你省下很多等待時間和金錢。
  2. 上線階段 (Prod)

    • 如果你的應用需要寫程式或算數學:切換回 GPT-4o mini 或升級到 Gemini 3 Pro
    • 如果你的應用只是單純的「根據文件回答問題 (Q&A)」:繼續使用 Gemini 1.5 Flash,它的 1M 上下文窗口能讓你的 RAG 檢索更精準(可以一次塞入更多上下文)。

建議策略

  1. 修改 Flowise 設定:在執行 Flowise 時,當切換到 GPT-4o mini 時,可改用 Gemini 1.5 Flash-8B(或 Gemini 1.5 Flash)。速度極快,而且帳單幾乎是零。

  2. 體驗 Gemini 3:當課程進入「多代理 (Multi-Agent)」章節,需要聰明的「主管 (CEO)」時,試著接上剛發布的 Gemini 3 Pro。雖然貴一點,但它的邏輯推理能力目前是市場頂尖,會比課程中的 o4-mini 表現得更像人類。

  3. 善用免費額度:Google AI Studio 提供不錯的免費層級 (Free Tier),開發階段可以善用,搞不好完全不需要付費。