Подход с использованием глубокого обучения и машинного обучения для прогнозирования неонатальной смертности в контексте Сан-Паулу
A deep learning and machine learning approach to predict neonatal death in the context of São Paulo
June 20, 2025
Авторы: Mohon Raihan, Plabon Kumar Saha, Rajan Das Gupta, A Z M Tahmidul Kabir, Afia Anjum Tamanna, Md. Harun-Ur-Rashid, Adnan Bin Abdus Salam, Md Tanvir Anjum, A Z M Ahteshamul Kabir
cs.AI
Аннотация
Неонатальная смертность остается тревожной реальностью для развивающихся и даже некоторых развитых стран. Согласно данным Macro Trades, во всем мире из 1000 рожденных детей умирают 26,693 младенца. Для снижения этого показателя крайне важна ранняя прогностика младенцев, находящихся в группе риска. Такой прогноз позволяет обеспечить надлежащий уход за ребенком и матерью, что помогает предотвратить раннюю детскую смертность. В данном контексте для определения риска для новорожденного использовались методы машинного обучения. Для обучения прогностической модели были использованы исторические данные о 1,4 миллиона новорожденных. Методы машинного и глубокого обучения, такие как логистическая регрессия, метод k-ближайших соседей, классификатор случайного леса, экстремальное градиентное бустирование (XGBoost), сверточные нейронные сети и долгосрочная краткосрочная память (LSTM), были применены к этому набору данных для выявления наиболее точной модели прогнозирования неонатальной смертности. Среди алгоритмов машинного обучения XGBoost и классификатор случайного леса показали наилучшую точность — 94%, в то время как среди моделей глубокого обучения LSTM достигла наивысшей точности — 99%. Таким образом, использование LSTM представляется наиболее подходящим подходом для прогнозирования необходимости принятия профилактических мер для ребенка.
English
Neonatal death is still a concerning reality for underdeveloped and even some
developed countries. Worldwide data indicate that 26.693 babies out of 1,000
births die, according to Macro Trades. To reduce this number, early prediction
of endangered babies is crucial. Such prediction enables the opportunity to
take ample care of the child and mother so that early child death can be
avoided. In this context, machine learning was used to determine whether a
newborn baby is at risk. To train the predictive model, historical data of 1.4
million newborns was used. Machine learning and deep learning techniques such
as logical regression, K-nearest neighbor, random forest classifier, extreme
gradient boosting (XGBoost), convolutional neural network, and long short-term
memory (LSTM) were implemented using the dataset to identify the most accurate
model for predicting neonatal mortality. Among the machine learning algorithms,
XGBoost and random forest classifier achieved the best accuracy with 94%, while
among the deep learning models, LSTM delivered the highest accuracy with 99%.
Therefore, using LSTM appears to be the most suitable approach to predict
whether precautionary measures for a child are necessary.