Machine Learning and Explainable AI for Agricultural Drought Prediction: A Comparative Analysis of Gradient Boosting Methods Using Multi-Source Earth Observation Data

Mirza Md Tasnim Mukarram
Quazi Umme Rukiya
Marc Linderman
Jun Wang

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Drought monitoring and prediction remain critical challenges in climate science and agricultural management, particularly under accelerating climate change. This study presents a comprehensive machine learning framework for drought susceptibility mapping in Iowa, USA, using multi-source Earth observation data and explainable artificial intelligence. We systematically evaluated eleven supervised learning algorithms including gradient boosting methods (LightGBM, XGBoost, CatBoost), ensemble approaches (Random Forest, Extra Trees), and neural networks for classifying drought severity based on United States Drought Monitor (USDM) categories. The models were trained on 8,200 stratified samples derived from satellite-based vegetation indices (NDVI, EVI, LAI, FPAR, VCI, VHI), land surface temperature metrics (LST, TCI), precipitation data (CHIRPS), soil moisture (SMAP), and land cover information spanning 2015-2021. Performance evaluation using confusion matrices, F1-scores, and ROC-AUC analysis revealed that gradient boosting algorithms significantly outperformed traditional machine learning approaches, with LightGBM achieving the highest accuracy (95%) and macro-averaged F1-score (0.94). SHAP (SHapley Additive exPlanations) interpretability analysis identified precipitation deficits, soil moisture anomalies, and vegetation stress as primary drought drivers, with synergistic interactions between elevated temperature and reduced rainfall amplifying severe drought conditions. Spatial predictions demonstrated climatologically consistent patterns, with elevated drought susceptibility in southwestern Iowa and lower risk in northern riverine corridors. The framework's ability to replicate expert-driven drought classifications while providing mechanistic insights establishes machine learning as a viable complement to traditional drought monitoring systems. These findings contribute to the growing body of climate informatics research and provide a transferable methodology for drought early warning systems in agricultural regions globally.

Version published to 10.31223/x53f4b
Feb 21, 2026

Leveraging Machine Learning and Earth Observation for Agricultural Drought Propagation in North-Central Nigeria

This article has 4 authors:
1. Sodiq A. Ajadi
2. Saralees Nadarajah
3. Oluwafemi E. Adeyeri
4. Hammed Akano
This article has no evaluationsLatest version Feb 28, 2026
Data-driven algorithms to estimate Maize Sap Flow Transpiration based on climatic and soil moisture data

This article has 8 authors:
1. Grazia Tosi
2. Marco Legittimo
3. Francesco Crocetti
4. Gabriele Costante
5. Jennifer Bertuzzi
6. Vergni Lorenzo
7. Paolo Valigi
8. Francesca Todisco
This article has no evaluationsLatest version Apr 6, 2026
Explainable Machine Learning for Crop Yield Classification Using Foliar Nutrient Analysis and Management Data in Colombia

This article has 2 authors:
1. Yeison Eduardo Conejo Sandoval
2. Andres Polo
This article has no evaluationsLatest version Mar 26, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Leveraging Machine Learning and Earth Observation for Agricultural Drought Propagation in North-Central Nigeria

Data-driven algorithms to estimate Maize Sap Flow Transpiration based on climatic and soil moisture data

Explainable Machine Learning for Crop Yield Classification Using Foliar Nutrient Analysis and Management Data in Colombia