予測不可能な事象を予測する:グローバル・テロリズム・データベース(GTD)におけるインシデント件数の再現可能なBiLSTM予測
Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD)
October 16, 2025
著者: Oluwasegun Adegoke
cs.AI
要旨
我々は、Global Terrorism Database(GTD、1970-2016)を用いて、週次のテロ事件発生件数の短期予測を研究する。再現可能なパイプラインを固定の時間ベースの分割で構築し、Bidirectional LSTM(BiLSTM)を強力な古典的アンカー(季節的ナイーブ、線形/ARIMA)および深層LSTM-Attentionベースラインと比較評価する。テストセットにおいて、BiLSTMはRMSE 6.38を達成し、LSTM-Attention(9.19;+30.6%)および線形ラグ回帰ベースライン(+35.4% RMSE改善)を上回り、MAEとMAPEにおいても並行して改善を示した。時間的メモリ、トレーニング履歴の長さ、空間粒度、ルックバックサイズ、および特徴グループを変化させたアブレーション研究により、長期的な歴史データでトレーニングされたモデルが最も良い汎化性能を示すこと、中程度のルックバック(20-30週)が強力なコンテキストを提供すること、および双方向エンコーディングがウィンドウ内の蓄積と余波のパターンを捉えるために重要であることが明らかになった。特徴グループの分析によると、短期構造(ラグ付き件数とローリング統計)が最も寄与し、地理的および犠牲者関連の特徴が追加的な向上をもたらすことが示された。我々はコード、設定、およびコンパクトな結果表を公開し、GTDのライセンスと研究専用使用を文書化したデータ/倫理声明を提供する。全体として、本研究はGTD事件予測のための透明性が高く、ベースラインを上回る参照を提供する。
English
We study short-horizon forecasting of weekly terrorism incident counts using
the Global Terrorism Database (GTD, 1970--2016). We build a reproducible
pipeline with fixed time-based splits and evaluate a Bidirectional LSTM
(BiLSTM) against strong classical anchors (seasonal-naive, linear/ARIMA) and a
deep LSTM-Attention baseline. On the held-out test set, the BiLSTM attains RMSE
6.38, outperforming LSTM-Attention (9.19; +30.6\%) and a linear lag-regression
baseline (+35.4\% RMSE gain), with parallel improvements in MAE and MAPE.
Ablations varying temporal memory, training-history length, spatial grain,
lookback size, and feature groups show that models trained on long historical
data generalize best; a moderate lookback (20--30 weeks) provides strong
context; and bidirectional encoding is critical for capturing both build-up and
aftermath patterns within the window. Feature-group analysis indicates that
short-horizon structure (lagged counts and rolling statistics) contributes
most, with geographic and casualty features adding incremental lift. We release
code, configs, and compact result tables, and provide a data/ethics statement
documenting GTD licensing and research-only use. Overall, the study offers a
transparent, baseline-beating reference for GTD incident forecasting.