感謝原作者 Howard Ting 的詳細解說和熱情分享,相信可以幫助許多網友找到最合適的課程,原文連結請點此處。
大概 3 個月前,下定決心朝資料科學的方向鑽研的時候,意外地接觸到了 Udemy,然後很快就喜歡上了這個平台。
原因不外乎那超級頻繁的特價活動,還有領先大部分平台的 30 天退款保證(濫用的話似乎會被警告,所以務必真的不喜歡課程再退)。
所以這篇基本上是給對資料科學有興趣或想朝這方向發展的朋友推薦一些個人覺得不錯的課程。
Udemy 一年一度最大的促銷在 11 月的黑色星期五,想購買的朋友們不妨先丟到購物車,等促銷來了後再購買。
最後,切到主題前,做幾點提醒:
本人沒收過任何的廣告費用。
個人因素導致我目前對 R 語言有點排斥,所以任何課程實做的部分基本上都是用 python,想學 R 語言的請自行尋找課程。
推薦的課程我幾乎都有買,或是已經丟在購物車了。但礙於時間因素,幾乎都還未完課或甚至還沒開始上課,因此 課程的內容設計會是我主要的推薦因素,講師的教學能力則較為次要,選課時請務必挑選適合自己的講師。
1. 全套課程:
The Full Stack Data Scientist BootCamp®(本課程已下架,移至講師 自建網站)
類別:IT & Software > IT Certifications > Data Science ║ 內容:124.5小時 ║ 原價:NT$2,290
建立:2022-06-18 ║ 更新:2022-10-10 ║ 註冊:4,504人 ║ 語言:English ║ 字幕:有 ║ 評分:4.51 (509人)
The Full Stack Data Analyst BootCamp®(本課程已下架,移至講師 自建網站)
類別:Business > Business Analytics & Intelligence > Data Analysis ║ 內容:43.5小時(持續增加中) ║ 原價:NT$1,690
建立:2022-09-17 ║ 更新:2022-10-18 ║ 註冊:525人 ║ 語言:English ║ 字幕:有 ║ 評分:4.49 (63人)
說明:
這兩門課就不多做說明了,看時數和名稱應該就能知道是全套的訓練課程。
上面那門內容是真的非常豐富,甚至有一節是教你怎麼讀論文。缺點就是講師的說話速度非常快,最好練好英聽再來。
下面那門還在更新,之後應該會有 R 語言的教學。
2. 基礎數學:
資料科學主要會用到的數學有 (1)線性代數 (2)統計 (3)微積分,其中線性代數和統計又比微積分更重要一些。
- 線性代數
Complete linear algebra: theory and implementation in code
類別:Teaching & Academics > Math > Linear Algebra ║ 內容:34小時 ║ 原價:NT$670
建立:2018-06-03 ║ 更新:2022-09-30 ║ 註冊:26,464人 ║ 語言:English ║ 字幕:有 ║ 評分:4.87 (3,881人)
- 統計
Master statistics & machine learning: intuition, math, code
類別:Teaching & Academics > Humanities > Statistics ║ 內容:38.5小時 ║ 原價:NT$670
建立:2020-06-06 ║ 更新:2022-09-30 ║ 註冊:15,987人 ║ 語言:English ║ 字幕:有 ║ 評分:4.64 (1,429人)
- 微積分
Master calculus 1 using Python: derivatives and applications
類別:IT & Software > Other IT & Software > Calculus ║ 內容:41.5小時 ║ 原價:NT$670
建立:2022-10-11 ║ 更新:2022-10-10 ║ 註冊:706人 ║ 語言:English ║ 字幕:有 ║ 評分:5.00 (8人)
說明:
這幾門課的講師都是 Mike X Cohen,而我目前只有線性代數上完超過一半。
我很喜歡這名講師的其中一個原因是他喜歡搭配 python 去實踐數學上的概念,還會穿插 code challenge 來加強你的思考能力,缺點就是手寫的練習題可能有點少。
另外,他的統計課程應該是 Udemy 上教最深的(但以資料科學家的角度來看可能就是基礎程度)。至於微積分10月才推出 1,明年10月不知道有沒有機會看到 2。
Udemy 上有一個還算熱門的數學老師 Krista King,但是我不太推薦她的線性代數和統計,原因是教太淺。但她的課手寫練習很多,買來當補充課程還是可以的。
線性代數的部分,如果想要更扎實的基礎,建議可以買 Hania Uscka-Wehlou 的 Linear Algebra and Geometry 1~3,3門加起來快150小時,建議有時間再來。
至於統計,Udemy 上很多課程我都覺得教太少,大概就上面的那門能讓我滿意,如果想要學更深的例如貝氏統計,我建議可以去 Cousera 挖,這裡就不多說明了。
3. 深度學習
這部分其實還有很多課程可以自行挖掘,由於我自己有買一些偏實作的書,所以在 Udemy 購買的課程比教偏向理論的講解。
A deep understanding of deep learning (with Python intro)
類別:Development > Data Science > Deep Learning ║ 內容:57.5小時 ║ 原價:NT$670
建立:2021-08-09 ║ 更新:2022-09-30 ║ 註冊:10,861人 ║ 語言:English ║ 字幕:有 ║ 評分:4.77 (1,199人)
說明:
如果是初次接觸深度學習的朋友我強烈建議這門課程,是前面提過的 Mike X Cohen 的課,非常認真講解深度學習的每一個環節,認真上完的話對於深度學習應該能有深刻的理解。缺點就是沒有較新的 attention 和 transformer 等內容。
The Complete Neural Networks Bootcamp: Theory, Applications
類別:Development > Data Science > Deep Learning ║ 內容:44小時 ║ 原價:NT$2,290
建立:2018-08-11 ║ 更新:2021-11-04 ║ 註冊:11,275人 ║ 語言:English ║ 字幕:有 ║ 評分:4.72 (1,356人)
說明:
應該是 Udemy 的單一課程裡,內容最多的深度學習課程。除了較新的 transformer,甚至有講解 YOLO 和 GPT 等這些熱門的模型,不過 GPT 的部分顯然還沒完成,而且快 1 年沒更新了,希望講師以後有想到要補。
4. 機器學習
2022 Python for Machine Learning & Data Science Masterclass
類別:Development > Data Science > Python ║ 內容:44小時 ║ 原價:NT$2,290
建立:2020-10-27 ║ 更新:2021-09-11 ║ 註冊:74,566人 ║ 語言:English ║ 字幕:有 ║ 評分:4.68 (9,617人)
說明:
包含了大部分傳統的機器學習方法,對於不熟悉這些方法的朋友來說應該是 CP 值頗高的課程。
XGBoost Machine Learning for Data Science and Kaggle
類別:Business > Business Analytics & Intelligence > Machine Learning ║ 內容:10小時 ║ 原價:NT$2,290
建立:2020-06-12 ║ 更新:2020-06-08 ║ 註冊:370人 ║ 語言:English ║ 字幕:有 ║ 評分:3.51 (56人)
說明:
這是我 Udemy 上唯一上完的課程,倒不是因為教得多好,而是我當時對 xgboost 很有興趣。課程的缺點大概就 code 有點舊還要自己動手 debug,而且講師的聲音可能會讓一些人很想睡覺,但對於想要學 xgboost 的人來說絕對是不錯的入門課程。
5. 其他的資料科學技能
Feature Engineering for Machine Learning
類別:Development > Data Science > Machine Learning ║ 內容:10.5小時 ║ 原價:NT$2,690
建立:2017-11-15 ║ 更新:2022-06-07 ║ 註冊:18,312人 ║ 語言:English ║ 字幕:有 ║ 評分:4.61 (2,680人)
Feature Selection for Machine Learning
類別:Development > Data Science > Machine Learning ║ 內容:6小時 ║ 原價:NT$2,290
建立:2018-02-16 ║ 更新:2022-06-29 ║ 註冊:12,687人 ║ 語言:English ║ 字幕:有 ║ 評分:4.76 (1,798人)
Machine Learning with Imbalanced Data
類別:Development > Data Science > Machine Learning ║ 內容:11.5小時 ║ 原價:NT$2,290
建立:2020-11-11 ║ 更新:2022-06-07 ║ 註冊:5,686人 ║ 語言:English ║ 字幕:有 ║ 評分:4.89 (509人)
Hyperparameter Optimization for Machine Learning
類別:IT & Software > Other IT & Software > Machine Learning ║ 內容:10小時 ║ 原價:NT$2,290
建立:2021-05-07 ║ 更新:2022-06-07 ║ 註冊:5,202人 ║ 語言:English ║ 字幕:有 ║ 評分:4.63 (347人)
Testing and Monitoring Machine Learning Model Deployments
類別:Development > Data Science > MLOps ║ 內容:8.5小時 ║ 原價:NT$3,190
建立:2020-02-21 ║ 更新:2022-06-07 ║ 註冊:4,919人 ║ 語言:English ║ 字幕:有 ║ 評分:4.43 (375人)
Deployment of Machine Learning Models
類別:Development > Data Science > MLOps ║ 內容:10.5小時 ║ 原價:NT$1,790
建立:2019-02-14 ║ 更新:2022-06-07 ║ 註冊:26,357人 ║ 語言:English ║ 字幕:有 ║ 評分:4.33 (4,168人)
說明:
以上都是 Soledad Galli 的課程,我目前只有聽完一部分的 feature engineering,所以不做太多評價。
比較需要注意的是下面那兩門,因為還有牽涉到其他專業知識所以學習門檻比較高,請謹慎購買。
另外她和別人合夥的 train in data 最近新開了一門 Feature Engineering for Time Series Forecasting 的課程,不知道有沒有打算上傳到 Udemy?
6. 講師推薦
這邊會列出一些我覺得課程品質普遍不錯,可以長期關注的講師,講師排序與推薦程度無關。
課程評價都非常高,除了前面提過的,我還有買一門傅立葉變換的課程。
另外還有 PCA 和神經訊號處理等課程可以參考看看。
請參考上面 第 5 部分,這邊不多做說明。
課程多、學生多、評價高,但是有些課程我覺得 Udemy 上應該能找到 CP 值更高的,請謹慎購買。
會提到她單純是因為她的一些數學課程可能是 Udemy 上最強的,除了線性代數以外還有微積分 3,不知道有沒有打算推出 1 和 2?
他的課程很多不特價的,但看了一些課程評價,內容應該真的很好,請按需求購買。
結語
最後,既然都看到這裡了,那就麻煩再看完我剩下的一些心得或廢話吧。
雖然大學的本科就與資料科學有關,但我是因為期末報告的緣故接觸到 kaggle 後,自此迷上了資料科學並下定決心朝這方向鑽研。
自學到現在大概有5個月了,最深的體悟大概就是實戰經驗的重要性。
而 kaggle 就是一個非常好鍛鍊實戰經驗的平台,它有著非常良好的討論與分享機制,可以幫助初學者迅速成長。
特別是數據分析和特徵工程這種吃經驗的技能,kaggle 上的高手們針對問題所使用的方法常常是課程中學不到的。
讓我有這種體悟的題目是 American Express - Default Prediction,雖然暑假因為還有實習的緣故沒什麼時間動手做,但我幾乎每天都會盯著討論帖的更新看高手們有沒有發現什麼新技巧。
剛開始實戰一定是最難的,應該沒有多少人能一開始就活用自己學過的技能,但有 1 就有 2,多實戰幾次一定會越來越熟練,同時還能從其他高手的身上學到新技巧。
最後一段幾乎是想到什麼就寫什麼,可能有點亂,但意思有傳達到就好了。
祝福想朝資料科學發展的朋友們事業有成。
Photo by Maxim Berg on Unsplash