這個問題的答案其實很寬泛,這裏我默認題目掌握了幾個點的理論基礎,高世代,概率論,必要的統計知識,貝葉斯。此外,近年來,壹些關於ICLR和ICML的論文使用了越來越多的數學知識,包括但不限於實變量、泛函、點集拓撲、微分幾何和抽象代數。如果妳是工科出身,看著壹堆希臘字母和壹束花寫字母的定義,往往會頭大。想補點數學基礎,不知道從何下手。
我個人的經驗是,對於深度學習方向的工科生來說,把這些課程都學完是不現實的,也是浪費時間。但是,即使是工科生,也建議學習以下內容:
實變函數(這是論文中出現頻率最高的部分。至少知道什麽是可測集,什麽是可測集,什麽是可積,進壹步黎曼可積,勒貝格可積;理解下度量的概念)
泛函,變分法(這門課真的很難,我只學了壹部分,但是對於機器學習,我必須知道變分法的歐拉-拉格朗日方程)
基本拓撲概念(現在的論文大家都喜歡用流形這個詞,只要涉及到高維數據就是流形,出處在此。再比如WGAN中完美分類器的證明,這其實是教科書中度量空間和Hausdorff空間的壹個非常基礎的證明)
壹點點測量基礎知識(論文很多,但感覺懂度量張量,指數映射,測地線方程,壹些比較深的幾何概念很少出現)
我沒有進壹步學習數學。比如今年ICLR關於球形CNN的文章也很混亂,但以上那些基本上足夠妳從戰略角度看大部分有深度的理論文章了。