ChatPaper.aiChatPaper

Het voorspellen van het onvoorspelbare: reproduceerbare BiLSTM-voorspellingen van incidentaantallen in de Global Terrorism Database (GTD)

Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD)

October 16, 2025
Auteurs: Oluwasegun Adegoke
cs.AI

Samenvatting

We bestuderen kortetermijnvoorspellingen van wekelijkse aantallen terroristische incidenten met behulp van de Global Terrorism Database (GTD, 1970–2016). We ontwikkelen een reproduceerbare pijplijn met vaste tijdsgebonden splitsingen en evalueren een Bidirectionele LSTM (BiLSTM) tegen sterke klassieke referentiemodellen (seizoensnaïef, lineair/ARIMA) en een diepe LSTM-Attention-basislijn. Op de afgezonderde testset behaalt de BiLSTM een RMSE van 6,38, wat beter is dan LSTM-Attention (9,19; +30,6%) en een lineaire lag-regressie-basislijn (+35,4% RMSE-verbetering), met parallelle verbeteringen in MAE en MAPE. Ablaties waarbij temporeel geheugen, lengte van de trainingsgeschiedenis, ruimtelijke granulariteit, lookback-grootte en featuregroepen worden gevarieerd, tonen aan dat modellen die getraind zijn op lange historische gegevens het beste generaliseren; een gematigde lookback (20–30 weken) biedt sterke context; en bidirectionele codering is cruciaal voor het vastleggen van zowel opbouw- als nasleep-patronen binnen het venster. Analyse van featuregroepen geeft aan dat kortetermijnstructuur (vertraagde aantallen en rollende statistieken) het meeste bijdraagt, waarbij geografische en slachtoffergerelateerde kenmerken aanvullende verbeteringen bieden. We publiceren code, configuraties en compacte resultatentabellen en verstrekken een data/ethiekverklaring waarin GTD-licenties en uitsluitend onderzoeksgebruik worden gedocumenteerd. Over het algemeen biedt de studie een transparante, basislijn-overstijgende referentie voor het voorspellen van GTD-incidenten.
English
We study short-horizon forecasting of weekly terrorism incident counts using the Global Terrorism Database (GTD, 1970--2016). We build a reproducible pipeline with fixed time-based splits and evaluate a Bidirectional LSTM (BiLSTM) against strong classical anchors (seasonal-naive, linear/ARIMA) and a deep LSTM-Attention baseline. On the held-out test set, the BiLSTM attains RMSE 6.38, outperforming LSTM-Attention (9.19; +30.6\%) and a linear lag-regression baseline (+35.4\% RMSE gain), with parallel improvements in MAE and MAPE. Ablations varying temporal memory, training-history length, spatial grain, lookback size, and feature groups show that models trained on long historical data generalize best; a moderate lookback (20--30 weeks) provides strong context; and bidirectional encoding is critical for capturing both build-up and aftermath patterns within the window. Feature-group analysis indicates that short-horizon structure (lagged counts and rolling statistics) contributes most, with geographic and casualty features adding incremental lift. We release code, configs, and compact result tables, and provide a data/ethics statement documenting GTD licensing and research-only use. Overall, the study offers a transparent, baseline-beating reference for GTD incident forecasting.
PDF12October 22, 2025