神經網路訓練為什麼需要大量的樣本?有沒有理論上的解釋?Morning丁先生2019-05-19 10:34:18

回答這個問題,需要理解,什麼是樣本,什麼是神經網路,神經網路的目的是什麼?以及神經網路為了達到自己的目的對大量樣本的需要的必要性。

首先,樣本本身沒有意義,它只是一次不確定性偶然的取樣。但,樣本的意義在於,樣本呈現的背後的隨機空間,因果空間的機率關係和因果關係。而且,樣本量越大越能清晰的體現背後的機率邏輯或因果邏輯。這一點是很容理解的。比如:一個學生一次考試得了100分,還不能說明這個學生成績不錯;如果,這個學生連續10次都考得100分,那麼我可以肯定,這個學生的成績是優秀的。也就是說10次(大量)考試成績(樣本)體現了學生的成績水平(因果邏輯)。在數學上,這個思想可以總結為“大數定理”。

其次,神經網路 是計算機的自學習模型。什麼是自學習?比如,傳統的計算機程式設計對計算機來說也算是一種學習。不過這種學習是人的學習,把習的規律和邏輯結果,透過程式設計的方式輸入計算機,因此,本質上是計算機藉助人實現間接的學習。比如,人透過千百次的觀測和實驗(大量樣本,資料)習得人口變遷的規律,因此,把這種規律輸入計算機後,可以讓計算機來協助預測人口的演變趨勢。而現在,我們把大量的人口資料,直接 輸入計算機,計算機透過神經網路模型可以自己學習到樣本資料背後的規律,進而可以進行人口演變趨勢的預測。

神經網路訓練為什麼需要大量的樣本?有沒有理論上的解釋?禮娜教育2019-05-19 06:36:26

我們在求解N個引數時,往往需要至少N+1個方程,而且要保證這些方程儘量互不相關(矩陣的秩)。 神經網路的引數極大,而且存在著非常多的非線性操作,因此我們更需要大量的訓練樣本(每個樣本就是對應的一個方程),這些樣本還要保證獨立性。所以可想而知,從零開始訓練需要大量的樣本。