Vorhersage des Unvorhersehbaren: Reproduzierbare BiLSTM-Prognosen von Vorfallszahlen in der Global Terrorism Database (GTD)
Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD)
October 16, 2025
papers.authors: Oluwasegun Adegoke
cs.AI
papers.abstract
Wir untersuchen die kurzzeitige Vorhersage von wöchentlichen Terrorismusvorfällen anhand der Global Terrorism Database (GTD, 1970–2016). Wir entwickeln eine reproduzierbare Pipeline mit festen zeitbasierten Aufteilungen und evaluieren ein bidirektionales LSTM (BiLSTM) im Vergleich zu starken klassischen Referenzmodellen (saisonale Naive, lineare/ARIMA) und einem tiefen LSTM-Attention-Baseline-Modell. Auf dem zurückgehaltenen Testdatensatz erreicht das BiLSTM einen RMSE von 6,38 und übertrifft damit das LSTM-Attention-Modell (9,19; +30,6\%) sowie eine lineare Lag-Regressions-Baseline (+35,4\% RMSE-Verbesserung), mit parallelen Verbesserungen in MAE und MAPE. Ablationen, die zeitliches Gedächtnis, Länge der Trainingshistorie, räumliche Granularität, Lookback-Größe und Feature-Gruppen variieren, zeigen, dass Modelle, die auf langen historischen Daten trainiert werden, am besten generalisieren; ein moderater Lookback (20–30 Wochen) bietet einen starken Kontext; und bidirektionale Kodierung ist entscheidend, um sowohl Aufbau- als auch Nachwirkungsmuster innerhalb des Fensters zu erfassen. Die Analyse der Feature-Gruppen zeigt, dass die kurzzeitige Struktur (verzögerte Zählungen und rollierende Statistiken) den größten Beitrag leistet, während geografische und Opfermerkmale zusätzlichen Nutzen bringen. Wir veröffentlichen Code, Konfigurationen und kompakte Ergebnis-Tabellen und stellen ein Daten-/Ethik-Dokument bereit, das die GTD-Lizenzierung und die ausschließliche Nutzung zu Forschungszwecken dokumentiert. Insgesamt bietet die Studie eine transparente, Baseline-übertreffende Referenz für die Vorhersage von GTD-Vorfällen.
English
We study short-horizon forecasting of weekly terrorism incident counts using
the Global Terrorism Database (GTD, 1970--2016). We build a reproducible
pipeline with fixed time-based splits and evaluate a Bidirectional LSTM
(BiLSTM) against strong classical anchors (seasonal-naive, linear/ARIMA) and a
deep LSTM-Attention baseline. On the held-out test set, the BiLSTM attains RMSE
6.38, outperforming LSTM-Attention (9.19; +30.6\%) and a linear lag-regression
baseline (+35.4\% RMSE gain), with parallel improvements in MAE and MAPE.
Ablations varying temporal memory, training-history length, spatial grain,
lookback size, and feature groups show that models trained on long historical
data generalize best; a moderate lookback (20--30 weeks) provides strong
context; and bidirectional encoding is critical for capturing both build-up and
aftermath patterns within the window. Feature-group analysis indicates that
short-horizon structure (lagged counts and rolling statistics) contributes
most, with geographic and casualty features adding incremental lift. We release
code, configs, and compact result tables, and provide a data/ethics statement
documenting GTD licensing and research-only use. Overall, the study offers a
transparent, baseline-beating reference for GTD incident forecasting.