Verbeteren van de toegang tot verkeersveiligheidsdata met generatieve AI: een op schema gebaseerd raamwerk voor ruimtelijke natuurlijke-taalquery's

Samenvatting

Verkeersveiligheidsanalyse vereist de integratie van ongevalsgegevens, wegeigenschappen en georuimtelijke data via op GIS gebaseerde workflows, maar de toegang blijft ongelijk verdeeld over instanties en gemeenschapsbelanghebbenden. Technische randvoorwaarden creëren een kloof tussen de analytische instrumenten die essentieel zijn voor veiligheidsplanning en de praktijkmensen die ze kunnen gebruiken. Lokale instanties, schoolcommissies en bewoners kunnen wel veiligheidskwesties hebben, maar slechts beperkte capaciteit om relevante gegevens te verkrijgen, filteren, in kaart te brengen en te analyseren. Generatieve AI biedt een manier om deze kloof te verkleinen, maar het gebruik ervan in de publieke sector roept vragen op over betrouwbaarheid, reproduceerbaarheid en governance. Dit artikel presenteert een schemagebonden natuurlijke taalinterface voor verkeersveiligheidsanalyse, die gebruikmaakt van een groot taalmodel (LLM) om de intentie van de gebruiker te interpreteren, terwijl deterministische, controleerbare uitvoering tegen een gezaghebbende database behouden blijft. Gebruikersvragen worden vertaald naar gestructureerde semantische kaders, gevalideerd door een op regels gebaseerde laag, gecompileerd in een getypeerde gerichte acyclische graaf van ruimtelijke operaties en uitgevoerd tegen een PostGIS-database. Dit begrensde ontwerp scheidt taalinterpretatie van deterministische uitvoering, waardoor resultaten reproduceerbaar en schemagebonden blijven, terwijl toegangsbarrières worden weggenomen. Het raamwerk wordt geëvalueerd met behulp van een landelijke verkeersveiligheidsdatabase in Massachusetts, waarin ongevalsgegevens, wegeigenschappen en georuimtelijke lagen zoals scholen, bushaltes, oversteekplaatsen en gemeentegrenzen zijn geïntegreerd. Alle queries werden succesvol uitgevoerd; de validatielaag corrigeert fouten in 29% van de evaluatiequeries, wat de kloof weerspiegelt tussen flexibele natuurlijke taal en strikte schemagebonden eisen. De resultaten suggereren dat het combineren van natuurlijke taaltoegankelijkheid met deterministische uitvoering een praktische richting is voor het verbreden van de toegang tot verkeersveiligheidsgegevens, met implicaties voor betrouwbare AI in planning in de publieke sector.

English

Transportation safety analysis requires integrating crash records, roadway attributes, and geospatial data through GIS-based workflows, but access remains uneven across agencies and community stakeholders. Technical prerequisites create a gap between analytical tools central to safety planning and the practitioners able to use them. Local agencies, school committees, and residents may have safety concerns but limited capacity to retrieve, filter, map, and analyze relevant data. Generative AI offers a way to narrow this divide, but its public-sector use raises questions about reliability, reproducibility, and governance. This paper presents a schema-grounded natural language interface for transportation safety analysis, using a large language model (LLM) to interpret user intent while preserving deterministic, reviewable execution against an authoritative database. User queries are translated into structured semantic frames, validated by a rule-based layer, compiled into a typed directed acyclic graph of spatial operations, and executed against a PostGIS database. This bounded design separates language interpretation from deterministic execution, keeping results reproducible and schema-grounded while removing access barriers. The framework is evaluated using a statewide Massachusetts transportation safety database integrating crash records, roadway attributes, and geospatial layers including schools, bus stops, crosswalks, and municipal boundaries. All queries executed successfully; the validation layer corrects errors in 29% of evaluation queries, reflecting the gap between flexible natural language and strict schema-grounded requirements. The results suggest that combining natural language accessibility with deterministic execution is a practical direction for broadening access to transportation safety data, with implications for trustworthy AI in public-sector planning.