Evaluatie van Deep Learning-modellen voor de classificatie van Afrikaanse wildlife-afbeeldingen: van DenseNet tot Vision Transformers
Evaluating Deep Learning Models for African Wildlife Image Classification: From DenseNet to Vision Transformers
July 28, 2025
Auteurs: Lukman Jibril Aliyu, Umar Sani Muhammad, Bilqisu Ismail, Nasiru Muhammad, Almustapha A Wakili, Seid Muhie Yimam, Shamsuddeen Hassan Muhammad, Mustapha Abdullahi
cs.AI
Samenvatting
Wildlife-populaties in Afrika worden geconfronteerd met ernstige bedreigingen, waarbij het aantal gewervelde dieren in de afgelopen vijf decennia met meer dan 65% is afgenomen. Als reactie hierop is beeldclassificatie met behulp van deep learning naar voren gekomen als een veelbelovend hulpmiddel voor biodiversiteitsmonitoring en -behoud. Dit artikel presenteert een vergelijkende studie van deep learning-modellen voor het automatisch classificeren van Afrikaanse wildlife-beelden, met een focus op transfer learning met bevroren feature extractors. Met behulp van een openbare dataset van vier soorten: buffel, olifant, neushoorn en zebra; evalueren we de prestaties van DenseNet-201, ResNet-152, EfficientNet-B4 en Vision Transformer ViT-H/14. DenseNet-201 behaalde de beste prestaties onder de convolutionele netwerken (67% nauwkeurigheid), terwijl ViT-H/14 de hoogste algehele nauwkeurigheid behaalde (99%), maar met aanzienlijk hogere rekenkosten, wat zorgen oproept over implementatie. Onze experimenten benadrukken de afwegingen tussen nauwkeurigheid, resourcebehoeften en implementeerbaarheid. Het best presterende CNN (DenseNet-201) werd geïntegreerd in een Hugging Face Gradio Space voor real-time gebruik in het veld, wat de haalbaarheid aantoont van het inzetten van lichtgewicht modellen in conservatieomgevingen. Dit werk draagt bij aan Afrika-gegrond AI-onderzoek door praktische inzichten te bieden in modelselectie, datasetvoorbereiding en verantwoorde inzet van deep learning-tools voor wildlife-conservatie.
English
Wildlife populations in Africa face severe threats, with vertebrate numbers
declining by over 65% in the past five decades. In response, image
classification using deep learning has emerged as a promising tool for
biodiversity monitoring and conservation. This paper presents a comparative
study of deep learning models for automatically classifying African wildlife
images, focusing on transfer learning with frozen feature extractors. Using a
public dataset of four species: buffalo, elephant, rhinoceros, and zebra; we
evaluate the performance of DenseNet-201, ResNet-152, EfficientNet-B4, and
Vision Transformer ViT-H/14. DenseNet-201 achieved the best performance among
convolutional networks (67% accuracy), while ViT-H/14 achieved the highest
overall accuracy (99%), but with significantly higher computational cost,
raising deployment concerns. Our experiments highlight the trade-offs between
accuracy, resource requirements, and deployability. The best-performing CNN
(DenseNet-201) was integrated into a Hugging Face Gradio Space for real-time
field use, demonstrating the feasibility of deploying lightweight models in
conservation settings. This work contributes to African-grounded AI research by
offering practical insights into model selection, dataset preparation, and
responsible deployment of deep learning tools for wildlife conservation.