IndicMedDialog: Een parallelle multi-beurt medische dialoogdataset voor toegankelijke gezondheidszorg in Indische talen

Samenvatting

De meeste bestaande medische dialoogsystemen opereren in een enkelvoudig vraag-en-antwoordparadigma of zijn gebaseerd op sjabloongestuurde datasets, wat de conversationele realisme en meertalige toepasbaarheid beperkt. We introduceren IndicMedDialog, een parallelle meertraps medische dialoogdataset die Engels en negen Indische talen omvat: Assamees, Bengaals, Gujarati, Hindi, Marathi, Punjabi, Tamil, Telugu en Urdu. De dataset breidt MDDial uit met door LLM gegenereerde synthetische consultaties, vertaald met TranslateGemma, geverifieerd door moedertaalsprekers en verfijnd via een schriftbewuste nabehandelingspijplijn om fonetische, lexicale en karakterafstandsfouten te corrigeren. Voortbouwend op deze dataset finetunen we IndicMedLM via parameter-efficiënte aanpassing van een gekwantiseerd klein taalmodel, waarbij optionele patiëntprecontext wordt opgenomen om meertraps symptoomuitvraging te personaliseren. We evalueren tegen zero-shot meertalige basislijnen, voeren systematische foutenanalyse uit over tien talen en valideren klinische plausibiliteit via medische expertbeoordeling.

English

Most existing medical dialogue systems operate in a single-turn question--answering paradigm or rely on template-based datasets, limiting conversational realism and multilingual applicability. We introduce IndicMedDialog, a parallel multi-turn medical dialogue dataset spanning English and nine Indic languages: Assamese, Bengali, Gujarati, Hindi, Marathi, Punjabi, Tamil, Telugu, and Urdu. The dataset extends MDDial with LLM-generated synthetic consultations, translated using TranslateGemma, verified by native speakers, and refined through a script-aware post-processing pipeline to correct phonetic, lexical, and character-spacing errors. Building on this dataset, we fine-tune IndicMedLM via parameter-efficient adaptation of a quantized small language model, incorporating optional patient pre-context to personalise multi-turn symptom elicitation. We evaluate against zero-shot multilingual baselines, conduct systematic error analysis across ten languages, and validate clinical plausibility through medical expert evaluation.