ChatPaper.aiChatPaper

Vorhersage des Unvorhersehbaren: Reproduzierbare BiLSTM-Prognosen von Vorfallszahlen in der Global Terrorism Database (GTD)

Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD)

October 16, 2025
papers.authors: Oluwasegun Adegoke
cs.AI

papers.abstract

Wir untersuchen die kurzzeitige Vorhersage von wöchentlichen Terrorismusvorfällen anhand der Global Terrorism Database (GTD, 1970–2016). Wir entwickeln eine reproduzierbare Pipeline mit festen zeitbasierten Aufteilungen und evaluieren ein bidirektionales LSTM (BiLSTM) im Vergleich zu starken klassischen Referenzmodellen (saisonale Naive, lineare/ARIMA) und einem tiefen LSTM-Attention-Baseline-Modell. Auf dem zurückgehaltenen Testdatensatz erreicht das BiLSTM einen RMSE von 6,38 und übertrifft damit das LSTM-Attention-Modell (9,19; +30,6\%) sowie eine lineare Lag-Regressions-Baseline (+35,4\% RMSE-Verbesserung), mit parallelen Verbesserungen in MAE und MAPE. Ablationen, die zeitliches Gedächtnis, Länge der Trainingshistorie, räumliche Granularität, Lookback-Größe und Feature-Gruppen variieren, zeigen, dass Modelle, die auf langen historischen Daten trainiert werden, am besten generalisieren; ein moderater Lookback (20–30 Wochen) bietet einen starken Kontext; und bidirektionale Kodierung ist entscheidend, um sowohl Aufbau- als auch Nachwirkungsmuster innerhalb des Fensters zu erfassen. Die Analyse der Feature-Gruppen zeigt, dass die kurzzeitige Struktur (verzögerte Zählungen und rollierende Statistiken) den größten Beitrag leistet, während geografische und Opfermerkmale zusätzlichen Nutzen bringen. Wir veröffentlichen Code, Konfigurationen und kompakte Ergebnis-Tabellen und stellen ein Daten-/Ethik-Dokument bereit, das die GTD-Lizenzierung und die ausschließliche Nutzung zu Forschungszwecken dokumentiert. Insgesamt bietet die Studie eine transparente, Baseline-übertreffende Referenz für die Vorhersage von GTD-Vorfällen.
English
We study short-horizon forecasting of weekly terrorism incident counts using the Global Terrorism Database (GTD, 1970--2016). We build a reproducible pipeline with fixed time-based splits and evaluate a Bidirectional LSTM (BiLSTM) against strong classical anchors (seasonal-naive, linear/ARIMA) and a deep LSTM-Attention baseline. On the held-out test set, the BiLSTM attains RMSE 6.38, outperforming LSTM-Attention (9.19; +30.6\%) and a linear lag-regression baseline (+35.4\% RMSE gain), with parallel improvements in MAE and MAPE. Ablations varying temporal memory, training-history length, spatial grain, lookback size, and feature groups show that models trained on long historical data generalize best; a moderate lookback (20--30 weeks) provides strong context; and bidirectional encoding is critical for capturing both build-up and aftermath patterns within the window. Feature-group analysis indicates that short-horizon structure (lagged counts and rolling statistics) contributes most, with geographic and casualty features adding incremental lift. We release code, configs, and compact result tables, and provide a data/ethics statement documenting GTD licensing and research-only use. Overall, the study offers a transparent, baseline-beating reference for GTD incident forecasting.
PDF12October 22, 2025