ChatPaper.aiChatPaper

예측 불가능한 것을 예측하기: 글로벌 테러리즘 데이터베이스(GTD)의 사건 발생 횟수에 대한 재현 가능한 BiLSTM 예측

Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD)

October 16, 2025
저자: Oluwasegun Adegoke
cs.AI

초록

우리는 글로벌 테러리즘 데이터베이스(GTD, 1970-2016)를 사용하여 주간 테러 사건 발생 횟수에 대한 단기 예측을 연구한다. 고정된 시간 기반 분할을 통해 재현 가능한 파이프라인을 구축하고, 양방향 LSTM(BiLSTM)을 강력한 고전적 기준 모델(계절성 나이브, 선형/ARIMA) 및 심층 LSTM-어텐션 기준 모델과 비교 평가한다. 테스트 세트에서 BiLSTM은 RMSE 6.38을 달성하며, LSTM-어텐션(9.19; +30.6%) 및 선형 지연 회귀 기준 모델(+35.4% RMSE 개선)을 능가하며, MAE와 MAPE에서도 병렬적인 개선을 보인다. 시간적 메모리, 학습 기록 길이, 공간적 세분화, 회고 기간 및 특징 그룹을 변화시키는 절제 실험을 통해, 장기 역사 데이터로 학습된 모델이 가장 우수한 일반화 성능을 보이며, 중간 정도의 회고 기간(20-30주)이 강력한 문맥을 제공하고, 양방향 인코딩이 창 내의 사건 발생 전후 패턴을 포착하는 데 중요함을 확인한다. 특징 그룹 분석은 단기 구조(지연된 횟수 및 롤링 통계)가 가장 큰 기여를 하며, 지리적 및 사상자 특징이 점진적인 성능 향상을 제공함을 나타낸다. 코드, 설정 파일 및 간결한 결과 테이블을 공개하고, GTD 라이선스 및 연구 전용 사용을 문서화한 데이터/윤리 성명서를 제공한다. 전반적으로, 이 연구는 GTD 사건 예측을 위한 투명하고 기준 모델을 능가하는 참고 자료를 제공한다.
English
We study short-horizon forecasting of weekly terrorism incident counts using the Global Terrorism Database (GTD, 1970--2016). We build a reproducible pipeline with fixed time-based splits and evaluate a Bidirectional LSTM (BiLSTM) against strong classical anchors (seasonal-naive, linear/ARIMA) and a deep LSTM-Attention baseline. On the held-out test set, the BiLSTM attains RMSE 6.38, outperforming LSTM-Attention (9.19; +30.6\%) and a linear lag-regression baseline (+35.4\% RMSE gain), with parallel improvements in MAE and MAPE. Ablations varying temporal memory, training-history length, spatial grain, lookback size, and feature groups show that models trained on long historical data generalize best; a moderate lookback (20--30 weeks) provides strong context; and bidirectional encoding is critical for capturing both build-up and aftermath patterns within the window. Feature-group analysis indicates that short-horizon structure (lagged counts and rolling statistics) contributes most, with geographic and casualty features adding incremental lift. We release code, configs, and compact result tables, and provide a data/ethics statement documenting GTD licensing and research-only use. Overall, the study offers a transparent, baseline-beating reference for GTD incident forecasting.
PDF12October 22, 2025