Erweiterung des Zugangs zu Verkehrssicherheitsdaten mit Generativer KI: Ein schema-gestütztes Framework für räumliche natürlichsprachliche Abfragen
Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries
May 20, 2026
Autoren: Mahdi Azhdari, Eric J. Gonzales
cs.AI
Zusammenfassung
Die Analyse der Verkehrssicherheit erfordert die Integration von Unfalldaten, Straßeneigenschaften und Geodaten mittels GIS-gestützter Arbeitsabläufe, doch der Zugang bleibt über Behörden und Interessengruppen hinweg ungleichmäßig. Technische Voraussetzungen schaffen eine Kluft zwischen den für die Sicherheitsplanung zentralen Analyseinstrumenten und den praktischen Anwendern, die sie nutzen können. Kommunale Ämter, Schulausschüsse und Anwohner mögen Sicherheitsbedenken haben, aber nur eingeschränkte Möglichkeiten, relevante Daten abzurufen, zu filtern, zu kartieren und zu analysieren. Generative KI bietet einen Weg, diese Kluft zu verkleinern, doch ihr Einsatz im öffentlichen Sektor wirft Fragen nach Zuverlässigkeit, Reproduzierbarkeit und Governance auf. Dieser Beitrag stellt eine schemagebundene, natürlichsprachliche Schnittstelle für die Verkehrssicherheitsanalyse vor, die ein großes Sprachmodell (LLM) zur Interpretation der Benutzerabsicht nutzt, während eine deterministische, nachvollziehbare Ausführung gegenüber einer autoritativen Datenbank gewährleistet wird. Benutzeranfragen werden in strukturierte semantische Frames übersetzt, durch eine regelbasierte Schicht validiert, in einen typisierten gerichteten azyklischen Graphen räumlicher Operationen kompiliert und gegen eine PostGIS-Datenbank ausgeführt. Diese begrenzte Architektur trennt die Sprachinterpretation von der deterministischen Ausführung, hält Ergebnisse reproduzierbar und schemagebunden und baut Zugangsbarrieren ab. Das Framework wird anhand einer landesweiten Verkehrssicherheitsdatenbank von Massachusetts evaluiert, die Unfalldaten, Straßeneigenschaften und Geodatenschichten (u.a. Schulen, Bushaltestellen, Fußgängerüberwege und Gemeindegrenzen) integriert. Alle Anfragen wurden erfolgreich ausgeführt; die Validierungsschicht korrigiert Fehler bei 29 % der Evaluierungsanfragen, was die Diskrepanz zwischen flexibler natürlicher Sprache und strengen schemagebundenen Anforderungen widerspiegelt. Die Ergebnisse deuten darauf hin, dass die Kombination von natürlichsprachlicher Zugänglichkeit mit deterministischer Ausführung ein praktikabler Weg zur Verbreiterung des Zugangs zu Verkehrssicherheitsdaten ist, mit Implikationen für vertrauenswürdige KI in der öffentlichen Planung.
English
Transportation safety analysis requires integrating crash records, roadway attributes, and geospatial data through GIS-based workflows, but access remains uneven across agencies and community stakeholders. Technical prerequisites create a gap between analytical tools central to safety planning and the practitioners able to use them. Local agencies, school committees, and residents may have safety concerns but limited capacity to retrieve, filter, map, and analyze relevant data. Generative AI offers a way to narrow this divide, but its public-sector use raises questions about reliability, reproducibility, and governance. This paper presents a schema-grounded natural language interface for transportation safety analysis, using a large language model (LLM) to interpret user intent while preserving deterministic, reviewable execution against an authoritative database. User queries are translated into structured semantic frames, validated by a rule-based layer, compiled into a typed directed acyclic graph of spatial operations, and executed against a PostGIS database. This bounded design separates language interpretation from deterministic execution, keeping results reproducible and schema-grounded while removing access barriers. The framework is evaluated using a statewide Massachusetts transportation safety database integrating crash records, roadway attributes, and geospatial layers including schools, bus stops, crosswalks, and municipal boundaries. All queries executed successfully; the validation layer corrects errors in 29% of evaluation queries, reflecting the gap between flexible natural language and strict schema-grounded requirements. The results suggest that combining natural language accessibility with deterministic execution is a practical direction for broadening access to transportation safety data, with implications for trustworthy AI in public-sector planning.