神經網路訓練為什麼需要大量的樣本？有沒有理論上的解釋？

Morning丁先生2019-05-19 10:34:18

回答這個問題，需要理解，什麼是樣本，什麼是神經網路，神經網路的目的是什麼？以及神經網路為了達到自己的目的對大量樣本的需要的必要性。

首先，樣本本身沒有意義，它只是一次不確定性偶然的取樣。但，樣本的意義在於，樣本呈現的背後的隨機空間，因果空間的機率關係和因果關係。而且，樣本量越大越能清晰的體現背後的機率邏輯或因果邏輯。這一點是很容理解的。比如：一個學生一次考試得了100分，還不能說明這個學生成績不錯；如果，這個學生連續10次都考得100分，那麼我可以肯定，這個學生的成績是優秀的。也就是說10次（大量）考試成績（樣本）體現了學生的成績水平（因果邏輯）。在數學上，這個思想可以總結為“大數定理”。

其次，神經網路是計算機的自學習模型。什麼是自學習？比如，傳統的計算機程式設計對計算機來說也算是一種學習。不過這種學習是人的學習，把習的規律和邏輯結果，透過程式設計的方式輸入計算機，因此，本質上是計算機藉助人實現間接的學習。比如，人透過千百次的觀測和實驗（大量樣本，資料）習得人口變遷的規律，因此，把這種規律輸入計算機後，可以讓計算機來協助預測人口的演變趨勢。而現在，我們把大量的人口資料，直接輸入計算機，計算機透過神經網路模型可以自己學習到樣本資料背後的規律，進而可以進行人口演變趨勢的預測。

禮娜教育2019-05-19 06:36:26

我們在求解N個引數時，往往需要至少N+1個方程，而且要保證這些方程儘量互不相關（矩陣的秩）。神經網路的引數極大，而且存在著非常多的非線性操作，因此我們更需要大量的訓練樣本（每個樣本就是對應的一個方程），這些樣本還要保證獨立性。所以可想而知，從零開始訓練需要大量的樣本。

小蜜蜂問答

小蜜蜂問答

神經網路訓練為什麼需要大量的樣本？有沒有理論上的解釋？

推薦文章

小蜜蜂問答

小蜜蜂問答

神經網路訓練為什麼需要大量的樣本？有沒有理論上的解釋？

相關文章

你不能吃苦耐勞的句子？

計算機按用途可分為哪幾類？

什麼是增持數量？

我們該如何度量機器學習模型的泛化能力？

推薦文章