利用機器學習方法綜合物候和氣象資料預測水稻產量

文章資訊

標題:Impact of recent vegetation greening on temperature and precipitation over China

期刊:《Agricultural and Forest Meteorology》

單位:中國科學院東北地理與農業生態研究所

背景

在過去的幾十年中,氣候變化已變得越來越重要,並且正在影響農業產量並繼而威脅著全球糧食安全。水稻是主要的農作物,對氣候變暖敏感且易受氣候變化的影響。最近的研究發現,如果不考慮CO2肥效和採取適應措施,全球平均溫度每升高1°C,平均全球水稻產量將下降3。2%,而中國的負面影響更大。物候學發展是重要的指標,它改變了光合有效期的持續時間,然後強烈影響了北方森林碳固存潛力的變化,控制了光合產物的分配過程。因此,水稻產量的變化與溫度變化和降水狀況等氣候變數以及抽穗期和開花日期變化等物候變數都密切相關。但是,氣候和物候變數對水稻產量的相對重要性仍然不清楚,並且尚未發現,使用傳統迴歸方法對水稻產量的預測提出了挑戰。因此,有必要調查氣候和物候變數對稻米產量的相對重要性,並提高稻米產量預測的準確性,以應對全球氣候變化的挑戰並確保全球糧食安全。

統計分析,遙感(RS)和作物模型通常用於預測作物產量。開發了不同的作物模型,並且通常基於日常氣候,土壤,遺傳引數和農業管理實踐。模型中建立的機制可用於在給定環境下模擬,執行和進行數百次甚至數千次實驗,以確定如何最好地管理或控制系統。儘管這些基於過程的模型可以成功地用於預測農作物的產量,但模擬過程背後的機制仍不清楚,特別是在極端氣候變化(例如極端炎熱和寒冷)下模型的效能是不可接受的。此外,這些模型主要依靠輸入資料的高解析度,這相對難以獲得。另外,統計方法也可用於產量預測,儘管它們也受到輸入資料的數量和質量的限制,並可能產生很大的不確定性。傳統的統計方法通常假定稻米產量與影響變數之間呈線性相關,無法準確反映非線性關係。

因此,在這項研究中,使用了基於地點的綜合物候,氣候,季節,地理和1981年至2010年中國早稻產量資料,並使用一種傳統的統計方法模擬了水稻產量:多元線性迴歸(MLR),以及更先進的三種機器學習(ML)方法,即反向傳播神經網路模型(BP),支援向量機(SVM)和隨機森林(RF)。我們旨在解決以下問題:1)使用ML方法預測的產量是否更接近現場記錄? 2)物候對水稻產量預測有影響嗎?為此,我們需要基於ML方法來量化物候和氣候對水稻產量的相對重要性。 3)評估季季對水稻產量預測的影響。

材料和方法

研究區域包括華南地區的75個農業氣象實驗站(AES),並根據基本氣候和種植系統將這些站點分為兩個區域(圖1):長江流域有49個AES。 (YZ)和26個AES位於珠江三角洲(PRD)地區。這些AES由中國氣象局(CMA)進行管理和維護,可以為我們提供1981-2010年間水稻物候,產量和管理措施的長期序列資料集的高質量。對於每個站點,早熟稻(Oryza sativa L。)的物候資料、氣候資料和地理資料都是從每個AES的相應位置獲得的。

使用的模型有一種傳統的線性迴歸方法,即多元線性迴歸(MLR)和三種非線性機器學習(ML)方法,即反向傳播神經網路模型(BP),支援向量機(SVM)和隨機森林法(RF),用於預測水稻產量。分別使用了華南,珠江三角洲和珠三角的現場資料對四種方法(MLR,BP,SVM和RF)進行了培訓和測試,以下各節介紹了詳細資訊。如上所述,自變數是物候,氣候和地理資料。在進行產量預測之前,首先對自變數進行歸一化,而對水稻產量則先進行線性去趨勢再進行歸一化。對於每個模擬,資料集分為兩個部分:訓練(70%)和測試(30%),遵循先前的研究(Zhang et al。,2020)。進行十倍交叉驗證,並使用R2和RMSE評估和評估模型效能。效能較好的模型是測試集中的R2較高且RMSE較低的模型。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖1:中國南方農業氣象實驗站(AES)的空間分佈。黑色陰影是指中國南方的水稻種植地區。綠點分別表示YZ區域中的位置,紅點表示PRD中的位置。

結果與討論

本研究中,使用傳統的基於迴歸的方法(MLR,多元線性迴歸)和更先進的三種機器學習(ML)方法,對11種物候,氣候和地理資料組合進行了測試,以預測基於地點的稻米產量:反向傳播神經網路(BP),支援向量機(SVM)和隨機森林(RF)。結果表明ML方法比MLR方法更精確。使用綜合物候,生長季節氣候和地理資訊進行的組合比單行搜尋方法中的其他組合更好地進行了產量預測。 BP,SVM和RF的預測稻米產量和觀察到稻米產量之間的RMSE(R2)分別為800(0。24),737(0。33)和744(0。31)kg / ha。支援向量機在單產預測中達到了最高的精度,物候變數大大提高了單產預測的準確性,物候變數的相對重要性甚至與氣候變數相似。我們強調需要在作物模型中準確表示物候和氣候,以提高使用整合ML方法在氣候變化條件下水稻產量預測的準確性。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖2:物候變數之間以及所有物候變數和水稻產量之間的偏相關係數(r)矩陣。物候和氣候變數的縮寫已在本研究區域和資料中明確介紹和定義。注意:該圖的星號表示顯著的相關性(P <0。05)。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖3:

條形圖顯示了觀察到的產量與基於MLR(藍色)和ML方法(即BP(紅色),SVM(黃色)和RF(紫色))的模擬之間的RMSE。注意:a和b是僅使用公共物候變數(PTHM)的結果,c和d是僅使用公共氣候變數(CTTPS)的結果,e和f是公共PTHM和公共CTTPS的結果。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖4:

條形圖顯示了觀察到的收益與模擬之間的RMSE(壽命面板)和R2(右面板),其基於機器學習(ML)方法,即BP,SVM和RF,遍及中國南方的所有站點(a和b) )以及跨YZ(c和d)和PRD(e和f)的整個站點。色差條表示不同的Eq。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖5:

使用三種機器學習(ML)方法(即BP,SVM和RF)計算的觀察到的產量與模擬產量之間的平均絕對誤差(MAE)。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖6:使用三種ML方法(即BP,SVM和RF)計算的觀察到的和預測的水稻產量之間的RMSE(a)和R2(b)。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖7:

所有地點的模擬水稻產量的空間分佈。

利用機器學習方法綜合物候和氣象資料預測水稻產量

圖8:

所有地點的預測產量與實際產量之間的差異的頻率直方圖。