1️⃣ 第六章:Reddit 情緒分析 筆記

第六章:情緒分析

33th Reddit Sentiment Analysis

ChatGPT: 本項目旨在利用開放完成API執行Reddit情緒分析。通過簡單地傳入額外提示,要求API對文本的情緒進行評分。我們將這個想法與另一個API調用結合,即在Reddit上檢索帖子和評論,並對提到的公司的情緒進行評分。過程包括識別公司名稱和評估整體情緒。該模型可能在處理諷刺性或含糊的語言時遇到困難,但它在處理自然語言時仍非常強大。注意,需要創建免費的Reddit帳戶以訪問官方API。下一步將設置Reddit帳戶和API密鑰。

Note: 每個專案中最重要的部分,不在 API 本身,而是在提示的部分,最近蠻多有提到如何進行提示的話題,包含chatgpt的範例,也是在說明如何提示。答案的限縮–限制回應的答案,告訴他我們想要的選項有哪些。針對情緒的選項僅為正面、反面與中性進行回答(搭配 temperature 與 top_p)。

保哥用 chatgpt 翻譯的 提示工程

34th Reddit API Setup

ChatGPT:

  1. 在本講座中,我們將學習如何使用Reddit帳戶API設置從Reddit獲取資訊。
  2. 首先,創建一個免費的Reddit帳戶。
  3. 接著,創建一個官方的Reddit應用程式並獲取應用程式ID和金鑰。
  4. 在Python中使用PRAW(Python Reddit API Wrapper)庫與Reddit應用程式進行交互。
  5. 通過PRAW,我們可以訪問特定subreddit,獲取當前熱門帖子,並提取相關資訊,如標題和內容。
  6. 在後續講座中,將學習如何從Reddit獲取更多相關信息,以及格式化這些信息。

Note: 官網:https://www.reddit.com/
在官網建立一個帳號

創建我們應用程式取得 secret key:https://www.reddit.com/prefs/apps
最下方 create application
輸入 name
選擇 script
redirect uri 為必填,隨便給一個 uri
取得 client_id 與 client_secret

安裝 Reddit libray praw:
pip install praw

取得 finance 的標題練習
將 finance 改為 stocks,股票版比金融版更常提到實際的特定公司

35th Retrieve Reddit Posts and Comments

ChatGPT:
重點整理:

  1. 我們在 Python 包裝器中設置了 Reddit API 密鑰。
  2. 我們使用 Jupyter 筆記本來檢索 subreddit 中的帖子和評論。
  3. 我們探討了 subreddit 屬性,如顯示名稱、標題、活躍帳戶數等。
  4. 我們示範了如何獲取 subreddit 中前五個熱門帖子及其評論。
  5. 我們設置了計數器以限制抓取的評論數量。
  6. 我們確保避免抓取已刪除的評論。

Note: pawn library 操作說明

36th Prompt Generation

Note: 將建立一個函數來生成有助於調用 GPT 的提示,並以有用的方式格式化內容,例如標題和評論。

1個讚