第六章:情緒分析
33th Reddit Sentiment Analysis
ChatGPT: 本項目旨在利用開放完成API執行Reddit情緒分析。通過簡單地傳入額外提示,要求API對文本的情緒進行評分。我們將這個想法與另一個API調用結合,即在Reddit上檢索帖子和評論,並對提到的公司的情緒進行評分。過程包括識別公司名稱和評估整體情緒。該模型可能在處理諷刺性或含糊的語言時遇到困難,但它在處理自然語言時仍非常強大。注意,需要創建免費的Reddit帳戶以訪問官方API。下一步將設置Reddit帳戶和API密鑰。
Note: 每個專案中最重要的部分,不在 API 本身,而是在提示的部分,最近蠻多有提到如何進行提示的話題,包含chatgpt的範例,也是在說明如何提示。答案的限縮–限制回應的答案,告訴他我們想要的選項有哪些。針對情緒的選項僅為正面、反面與中性進行回答(搭配 temperature 與 top_p)。
34th Reddit API Setup
ChatGPT:
- 在本講座中,我們將學習如何使用Reddit帳戶API設置從Reddit獲取資訊。
- 首先,創建一個免費的Reddit帳戶。
- 接著,創建一個官方的Reddit應用程式並獲取應用程式ID和金鑰。
- 在Python中使用PRAW(Python Reddit API Wrapper)庫與Reddit應用程式進行交互。
- 通過PRAW,我們可以訪問特定subreddit,獲取當前熱門帖子,並提取相關資訊,如標題和內容。
- 在後續講座中,將學習如何從Reddit獲取更多相關信息,以及格式化這些信息。
Note: 官網:https://www.reddit.com/
在官網建立一個帳號創建我們應用程式取得 secret key:https://www.reddit.com/prefs/apps
最下方 create application
輸入 name
選擇 script
redirect uri 為必填,隨便給一個 uri
取得 client_id 與 client_secret安裝 Reddit libray praw:
pip install praw
取得 finance 的標題練習
將 finance 改為 stocks,股票版比金融版更常提到實際的特定公司
35th Retrieve Reddit Posts and Comments
ChatGPT:
重點整理:
- 我們在 Python 包裝器中設置了 Reddit API 密鑰。
- 我們使用 Jupyter 筆記本來檢索 subreddit 中的帖子和評論。
- 我們探討了 subreddit 屬性,如顯示名稱、標題、活躍帳戶數等。
- 我們示範了如何獲取 subreddit 中前五個熱門帖子及其評論。
- 我們設置了計數器以限制抓取的評論數量。
- 我們確保避免抓取已刪除的評論。
Note: pawn library 操作說明
36th Prompt Generation
Note: 將建立一個函數來生成有助於調用 GPT 的提示,並以有用的方式格式化內容,例如標題和評論。