Un enfoque de aprendizaje profundo y aprendizaje automático para predecir la mortalidad neonatal en el contexto de São Paulo
A deep learning and machine learning approach to predict neonatal death in the context of São Paulo
June 20, 2025
Autores: Mohon Raihan, Plabon Kumar Saha, Rajan Das Gupta, A Z M Tahmidul Kabir, Afia Anjum Tamanna, Md. Harun-Ur-Rashid, Adnan Bin Abdus Salam, Md Tanvir Anjum, A Z M Ahteshamul Kabir
cs.AI
Resumen
La mortalidad neonatal sigue siendo una realidad preocupante en países subdesarrollados e incluso en algunos desarrollados. Datos globales indican que 26,693 bebés de cada 1,000 nacimientos mueren, según Macro Trades. Para reducir esta cifra, la predicción temprana de bebés en riesgo es crucial. Dicha predicción permite la oportunidad de brindar un cuidado adecuado al niño y a la madre, evitando así la muerte temprana del infante. En este contexto, se utilizó el aprendizaje automático para determinar si un recién nacido está en peligro. Para entrenar el modelo predictivo, se emplearon datos históricos de 1,4 millones de recién nacidos. Se implementaron técnicas de aprendizaje automático y aprendizaje profundo, como regresión logística, K-vecinos más cercanos, clasificador de bosque aleatorio, aumento de gradiente extremo (XGBoost), red neuronal convolucional y memoria de corto-largo plazo (LSTM), utilizando el conjunto de datos para identificar el modelo más preciso para predecir la mortalidad neonatal. Entre los algoritmos de aprendizaje automático, XGBoost y el clasificador de bosque aleatorio alcanzaron la mejor precisión con un 94%, mientras que, entre los modelos de aprendizaje profundo, LSTM obtuvo la mayor precisión con un 99%. Por lo tanto, el uso de LSTM parece ser el enfoque más adecuado para predecir si son necesarias medidas preventivas para un niño.
English
Neonatal death is still a concerning reality for underdeveloped and even some
developed countries. Worldwide data indicate that 26.693 babies out of 1,000
births die, according to Macro Trades. To reduce this number, early prediction
of endangered babies is crucial. Such prediction enables the opportunity to
take ample care of the child and mother so that early child death can be
avoided. In this context, machine learning was used to determine whether a
newborn baby is at risk. To train the predictive model, historical data of 1.4
million newborns was used. Machine learning and deep learning techniques such
as logical regression, K-nearest neighbor, random forest classifier, extreme
gradient boosting (XGBoost), convolutional neural network, and long short-term
memory (LSTM) were implemented using the dataset to identify the most accurate
model for predicting neonatal mortality. Among the machine learning algorithms,
XGBoost and random forest classifier achieved the best accuracy with 94%, while
among the deep learning models, LSTM delivered the highest accuracy with 99%.
Therefore, using LSTM appears to be the most suitable approach to predict
whether precautionary measures for a child are necessary.