深度學習的概念是Hinton等人在2006年提出的。提出了基於深度信念網絡(DBN)的無監督貪婪逐層訓練算法,為解決深度結構相關的優化問題帶來了希望,進而提出了多層自動編碼器的深度結構。此外,Lecun等人提出的卷積神經網絡是第壹個真正的多層結構學習算法,它利用空間相對關系來減少參數數量,以提高訓練性能。深度學習是機器學習研究的壹個新領域。其動機在於建立和模擬人腦的神經網絡進行分析和學習。它模仿人腦解釋數據的機制,比如圖像、聲音和文本。
深度學習是壹種特征學習方法,通過壹些簡單但非線性的模型,將原始數據轉化為更高級、更抽象的表達。深度學習的深入介紹和深入研究,發現它包含三個核心概念:多層組合、端到端學習和分布式表示。
多層組合多層表示更符合人類的學習風格,而神經網絡作為其中之壹,可以從單壹的感知輸入中產生多種理解,比如壹個單詞的發音(與之相比,深度學習驚人的相似)。壹個單詞的發音和大腦的理解之間有很多隱含層,這和深度學習的過程是壹致的。
多層表示最令人興奮的壹件事是,數據科學家在處理數據分類任務時,以前是用神經網絡建模,但現在他們可以自動生成數據模型。
目前大多數分類、回歸等學習方法都是淺層結構算法,很多情況下只有壹層表示。其局限性在於對樣本和計算單元有限的復雜函數的表示能力有限,對復雜分類問題的泛化能力受到壹定限制。深度學習可以通過學習壹個深度的非線性網絡結構來實現復雜函數的逼近,表征輸入數據的分布表示,展現出從少數樣本集中學習數據集本質特征的強大能力。多層的優點是可以用較少的參數表示復雜的函數。