Tropical Cocoa Soil Moisture Prediction with Explainable CNN-LSTM and Uncertainty-Aware Deep Learning

熱帶可可園為何需要soil moisture prediction

在熱帶可可種植情境中，soil moisture prediction 不只是農業數據分析問題，更直接關係到根系發育、養分吸收、開花表現與產量穩定。由於降雨變化大、土壤異質性高，加上地下水分反應常有延遲，想要準確預測不同深度的含水量，難度遠高於一般單層土壤監測。

這也是近年研究開始轉向深度學習混合模型的原因之一。與其只看單一時間點或單一深度，研究更重視多層土壤在時間序列中的連動關係，特別是在作物根域內 5–105 cm 的多層變化。對可可園而言，若能更早掌握水分趨勢，就能為灌溉調度與氣候適應型管理提供更可靠的依據。

CNN-LSTM 如何提升多層土壤水分預測

這組研究聚焦於 CNN-LSTM framework 的改良版本，將 CNN 的局部特徵擷取能力與 LSTM 的序列記憶能力結合，並加入 quantile regression，讓模型不只輸出單點預測，還能提供機率式區間。從方法設計來看，CNN 負責抓取短期變化，LSTM 則處理時間依賴，兩者搭配很適合處理雨量驅動、反應延遲明顯的土壤水分資料。

另一個值得注意的設計是滯後視窗優化。研究透過自相關分析選出 lag-7 作為最佳時間窗，表示過去七個時間步的資訊，對後續預測最有幫助。這種做法的意義在於，它不是盲目把更多歷史資料塞進模型，而是根據資料本身的時序結構，選出最有代表性的輸入範圍，提升模型效率與穩定性。

準確率、泛化能力與不確定性估計

在預測表現上，模型在五個深度層位都維持高精度，整體平均 R² 為 0.948，RMSE 落在 0.39–0.79 之間，MAPE 通常低於 3%。更重要的是，研究並未只在同一區域測試，而是以 Zone 1 作訓練與驗證，Zone 2 與 Zone 3 則保留作獨立測試。這種配置能更真實檢驗模型在不同地塊下的轉移能力。

在不確定性方面，量化回歸產生了可靠的 50% 與 80% 預測區間，並以 mean pinball loss、PICP、MPIW 與 Winkler score 等指標驗證區間品質。從研究描述來看，這些結果代表模型不只是「預測得準」，還能清楚告訴使用者預測有多穩、區間有多寬，這對智慧灌溉尤其重要，因為農業決策往往比單一數值更需要風險邊界。

可解釋 AI：從 SHAP 與 IGA 看深層驅動因素

深度學習常被質疑像黑盒子，但這項研究加入 SHAP 與 Integrated Gradients Attribution（IGA）後，讓結果更容易被理解。分析顯示，不同深度的水分變化受氣候因子的影響並不相同：淺層更容易受到短期大氣驅動，而更深層則偏向受較慢變化的季節性因素控制。這種深度分層的解釋，與土壤剖面實際行為相當一致。

如果說準確率回答的是「預測對不對」，那麼可解釋性回答的就是「為什麼會這樣」。對農業現場而言，這種資訊尤其有價值，因為管理者不只想知道某層土壤會不會變乾，更想知道影響它的主因是近期降雨、累積蒸散，還是季節性環境差異。這也讓 explainable CNN-LSTM 不只是研究工具，而更像是輔助決策的知識系統。

從多步預測到現場部署：混合模型的未來

另一篇針對多步預測的研究也提供了有趣對照：在 24h、72h 與 168h 的預測任務中，LSTM hybrid model 與 XGBoost、RF 等方法結合後，能維持相當高的表現，其中 LSTM + XGBoost 在三個時間尺度都展現很高的 R²。這說明在土壤水分預測中，單一模型未必足夠，混合架構往往能在準確度與穩定性之間取得更好的平衡。

不過，模型進一步落地時仍有挑戰。第二篇研究指出，噪聲對高含水量層位影響更大，尤其是更深或微氣候差異更明顯的區域，準確度會受到較明顯干擾。這提醒我們，未來若要把深度學習真正用在可可園管理，除了模型本身，前處理、去噪與資料品質控管也同樣關鍵。總結來說，uncertainty-aware soil moisture forecasting 的價值，不只在於提高預測分數，更在於把「能用」提升到「可解釋、可部署、可決策」；這正是智慧農業下一階段最重要的方向。

熱帶可可園為何需要soil moisture prediction

CNN-LSTM 如何提升多層土壤水分預測

準確率、泛化能力與不確定性估計

可解釋 AI：從 SHAP 與 IGA 看深層驅動因素

從多步預測到現場部署：混合模型的未來

目前趨勢