Chapter 14 - ETL in Python (154~163) 線上討論

▌導讀:Lulu
2022/10/11 PM9:30

▌本次主題
Chapter 14 - ETL in Python (154~163)

▌課程共同學習主頁:

▌筆記:

▌線上討論及補充:
• Lulu@Discord
線性代數:

• Ray_Hsuan@Discord

在唸書時有用到SVD去做一些實驗,但不知道有沒有開放論文觀看,所以節錄一些當時的想法和應用流程出來分享給大家。

為什麼會用到SVD是因為之前看到Netflix的比賽文章中有提到矩陣分解,其實就是衍伸到後來的SVD,當時實作過R和Python中都有SVD的套件可以直接運用,一個二維數值矩陣帶入後應該都會拆解成三個矩陣。

實驗的部分是針對中間的矩陣Σ(我叫它特徵矩陣)取前n%保留,然後再把三個矩陣乘回去,觀察和使用者實際選擇的準確度,雖然用不同的n和加入一些其他方法作相互比較後發現,確實不保留所有特徵的情況下,可以找出相似的使用者,不過移除過多特徵反而會降低準確度,但因為數據蒐集的不多,所以這實驗算是附加上去的:rofl:,不過大家如果有興趣可以到dblp上搜尋RecSys,它是從2007年開始幾乎每年都有新的推薦系統論文,對推薦應用面有興趣的人還蠻有幫助的~


▌本次錄影