Een deep learning en machine learning benadering om neonatale sterfte te voorspellen in de context van São Paulo
A deep learning and machine learning approach to predict neonatal death in the context of São Paulo
June 20, 2025
Auteurs: Mohon Raihan, Plabon Kumar Saha, Rajan Das Gupta, A Z M Tahmidul Kabir, Afia Anjum Tamanna, Md. Harun-Ur-Rashid, Adnan Bin Abdus Salam, Md Tanvir Anjum, A Z M Ahteshamul Kabir
cs.AI
Samenvatting
Neonatale sterfte blijft een zorgwekkende realiteit voor onderontwikkelde en zelfs sommige ontwikkelde landen. Wereldwijde gegevens van Macro Trades geven aan dat 26.693 baby's op de 1.000 geboorten overlijden. Om dit aantal te verminderen, is vroege voorspelling van risicobaby's cruciaal. Een dergelijke voorspelling biedt de mogelijkheid om voldoende zorg te bieden aan het kind en de moeder, zodat vroege kindersterfte kan worden voorkomen. In dit verband werd machine learning gebruikt om te bepalen of een pasgeboren baby risico loopt. Om het voorspellende model te trainen, werden historische gegevens van 1,4 miljoen pasgeborenen gebruikt. Machine learning- en deep learning-technieken zoals logistische regressie, K-nearest neighbor, random forest classifier, extreme gradient boosting (XGBoost), convolutioneel neuraal netwerk en long short-term memory (LSTM) werden geïmplementeerd met behulp van de dataset om het meest nauwkeurige model te identificeren voor het voorspellen van neonatale sterfte. Onder de machine learning-algoritmen behaalden XGBoost en random forest classifier de beste nauwkeurigheid met 94%, terwijl onder de deep learning-modellen LSTM de hoogste nauwkeurigheid behaalde met 99%. Daarom lijkt het gebruik van LSTM de meest geschikte aanpak om te voorspellen of voorzorgsmaatregelen voor een kind noodzakelijk zijn.
English
Neonatal death is still a concerning reality for underdeveloped and even some
developed countries. Worldwide data indicate that 26.693 babies out of 1,000
births die, according to Macro Trades. To reduce this number, early prediction
of endangered babies is crucial. Such prediction enables the opportunity to
take ample care of the child and mother so that early child death can be
avoided. In this context, machine learning was used to determine whether a
newborn baby is at risk. To train the predictive model, historical data of 1.4
million newborns was used. Machine learning and deep learning techniques such
as logical regression, K-nearest neighbor, random forest classifier, extreme
gradient boosting (XGBoost), convolutional neural network, and long short-term
memory (LSTM) were implemented using the dataset to identify the most accurate
model for predicting neonatal mortality. Among the machine learning algorithms,
XGBoost and random forest classifier achieved the best accuracy with 94%, while
among the deep learning models, LSTM delivered the highest accuracy with 99%.
Therefore, using LSTM appears to be the most suitable approach to predict
whether precautionary measures for a child are necessary.