《筆記》託管 RAG 應用程式 - Flowise@Render(62~68)

本章說明如何託管(Hosting)應用程式,包含 Flowise 與 n8n(本筆記為第一部分 Flowise)。

本文由人工智慧(這次是 Gemini)撰寫,工人智慧(我)修正。

▌62. 託管、構建與銷售 RAG

Webhooks 等網路功能,在本地實例(Localhost)常常無法穩定運作,這時網頁託管是較合適的選擇。

Flowise 官方提供的託管服務,費用較高,講師推薦使用 Render 作為伺服器託管平台。本章包含以下內容:

  • 逐步在 Render 上託管 Flowise。

  • 構建 RAG 應用程式實際流程。

  • 利用 Replit 修改外觀、整合客戶 Logo。

  • 嵌入 WordPress 網站。

  • 進階設定。

  • 自行託管、製作 RAG 應用程式、品牌客製化,以及銷售策略。


▌63. 在 Render 上託管 Flowise

操作流程:

  1. GitHub 分支:將官方 GitHub 程式碼 Fork 到你的帳號下。

  2. Render 設定:建立新的 Web Service,並連結到你的 GitHub 儲存庫。

  3. 環境變數(Environment Variables):

    • 設定 FLOWISE_USERNAMEFLOWISE_PASSWORD 作為登入資料。

    • NODE_VERSION 設定為 18.1 或更高版本。

  4. 永久磁碟(Persistent Disk):

    • 免費方案:不支援儲存磁碟,數據會在閒置、重啟後遺失。

    • 付費方案(建議):支援儲存磁碟。需設定掛載路徑及資料庫、金鑰、日誌等路徑變數,以確保資料可以永久保存。

部署完成後,即可透過專屬網址登入並在雲端管理 Chatflows。


▌64. 利用 Flowise Tool Agent 為客戶構建 RAG 機器人

本節展示為客戶建構醫療產品支援的 RAG 應用程式。

  1. 資料準備:在 Document Store 建立專案並上傳產品資料。建議將原始資料轉換為 Markdown 格式以優化檢索品質。

  2. 文本處理:用 Text Splitter 將資料分段(如 Recursive Character Text Splitter)。

  3. 向量資料庫:使用 Pinecone。

  4. 數據嵌入(Embeddings):選擇 OpenAI 的 text-embedding-3-small 模型,並將數據 Upsert 至向量庫。

    Upsert:有就更新(Update),沒有就新增(Insert)。

    Update:有才會更新,沒有的話就不做事。

  5. 代理配置:

    • 使用 Tool Agent 與 Claude 3.7 Sonnet 模型(透過代理介面連結)。

    • 加入 Buffer Window Memory 以保留對話上下文。

    • 連結 Retriever Tool 讓機器人能檢索向量庫中的產品資訊。

      RAG: Retrieval Augmented Generation 檢索增強生成

  6. 系統提示詞(System Prompt):定義機器人為醫療診斷專家,規範其詢問症狀的流程、推薦產品的數量,以及使用的語系(如德語)。


▌65. 用 Replit 修改外觀樣式

  1. 在 Replit 建立 HTML 應用程式進行測試。

  2. 複製 Flowise 提供的嵌入腳本(Embed Code)貼入 HTML 代碼中。

  3. 客製化外觀設定:

    • 修改名稱:將預設標題更換為自定義名稱(如 Doc)。

    • 調整視覺參數:修改背景顏色、按鈕位置(如右下角距離)、字型大小及視窗寬度(例如調至 600x700 像素以適應較長文字)。

    • 移除品牌標籤:在代碼中刪除 Powered by Flowise 及其導向連結,提升專業感。

    • 調整輸入限制:提升字數上限(如 1000 字),並將錯誤訊息轉為客戶要求的語言。


▌66. 嵌入 WordPress 網站

  1. 進入 WordPress 後台管理介面。

  2. 安裝並啟用 WPCode 外掛(Code Snippets 插件)。

  3. 建立新的 HTML 代碼片段,貼上(上一節 Replit)已調整好的程式。

  4. 顯示設定:選擇將腳本放置於 Footer(頁尾),並設定在所有設備(桌面與手機)上運行。

  5. 儲存並啟用後,機器人即會出現在網站上並可正式運作。


▌67. 添加 Logo 與最終視覺微調

  1. 將自定義 Logo 上傳至雲端儲存空間(如 GitHub),取得該圖片的原始連結。(不知道為什麼不使用 WordPress 的多媒體上傳圖片)

  2. 在嵌入程式中,將預設圖示連結替換為你的圖片連結。

  3. 優化使用者體驗:

    • 設定機器人預設為不主動展開(autoOpen: false),需由使用者點擊後開啟。

    • 加入 JavaScript 程式,讓對話輸入框能隨文字內容增加而自動調整高度。


▌68. Flowise 應用的進階設定與監控

可透過右上方設定選單進行管理(講師一樣從左到右,全部很快帶過):

  • 訊息監控(View Messages):查看使用者與機器人的對話內容,並能回饋(Feedback)分數以優化回答。

  • 潛在客戶收集(Leads):啟用此功能後,可要求使用者輸入 Email 等資訊,名單可直接導出或整合至 Google Sheets。

  • 安全性設定(Configurations):

    • Rate Limits(速率限制):設定如「每 60 秒限傳 5 則訊息」,防止 API 被大量刷爆。

    • Allowed Domains:指定允許運行此機器人的網址網域。

  • 互動功能:可設定 Starter Prompts(啟動建議按鈕)或 Speech to Text 語音輸入功能(需配合 Whisper 等模型憑證)。

  • 分析工具:可連結 LangSmith 進行深度對話路徑追蹤與分析。

補充:n8n(69~73)在下篇筆記。