ChatPaper.aiChatPaper

Bewertung von Deep-Learning-Modellen für die Klassifizierung afrikanischer Wildtierbilder: Von DenseNet zu Vision Transformers

Evaluating Deep Learning Models for African Wildlife Image Classification: From DenseNet to Vision Transformers

July 28, 2025
papers.authors: Lukman Jibril Aliyu, Umar Sani Muhammad, Bilqisu Ismail, Nasiru Muhammad, Almustapha A Wakili, Seid Muhie Yimam, Shamsuddeen Hassan Muhammad, Mustapha Abdullahi
cs.AI

papers.abstract

Wildlife-Populationen in Afrika stehen vor schwerwiegenden Bedrohungen, wobei die Zahl der Wirbeltiere in den letzten fünf Jahrzehnten um mehr als 65 % zurückgegangen ist. Als Reaktion darauf hat sich die Bildklassifizierung mittels Deep Learning als vielversprechendes Werkzeug für die Überwachung und den Schutz der Biodiversität etabliert. Diese Arbeit präsentiert eine vergleichende Studie von Deep-Learning-Modellen zur automatischen Klassifizierung von afrikanischen Wildtierbildern, wobei der Schwerpunkt auf Transfer Learning mit eingefrorenen Feature-Extraktoren liegt. Unter Verwendung eines öffentlichen Datensatzes von vier Arten – Büffel, Elefant, Nashorn und Zebra – bewerten wir die Leistung von DenseNet-201, ResNet-152, EfficientNet-B4 und Vision Transformer ViT-H/14. DenseNet-201 erzielte die beste Leistung unter den Convolutional Neural Networks (67 % Genauigkeit), während ViT-H/14 die höchste Gesamtgenauigkeit (99 %) erreichte, jedoch mit einem deutlich höheren Rechenaufwand, was Bedenken hinsichtlich der Einsatzfähigkeit aufwirft. Unsere Experimente verdeutlichen die Abwägungen zwischen Genauigkeit, Ressourcenanforderungen und Einsatzfähigkeit. Das leistungsstärkste CNN (DenseNet-201) wurde in einen Hugging Face Gradio Space integriert, um die Echtzeitanwendung im Feld zu demonstrieren und die Machbarkeit des Einsatzes von leichtgewichtigen Modellen in Naturschutzumgebungen zu zeigen. Diese Arbeit leistet einen Beitrag zur afrikabezogenen KI-Forschung, indem sie praktische Einblicke in die Modellauswahl, die Datenaufbereitung und den verantwortungsvollen Einsatz von Deep-Learning-Werkzeugen für den Wildtierschutz bietet.
English
Wildlife populations in Africa face severe threats, with vertebrate numbers declining by over 65% in the past five decades. In response, image classification using deep learning has emerged as a promising tool for biodiversity monitoring and conservation. This paper presents a comparative study of deep learning models for automatically classifying African wildlife images, focusing on transfer learning with frozen feature extractors. Using a public dataset of four species: buffalo, elephant, rhinoceros, and zebra; we evaluate the performance of DenseNet-201, ResNet-152, EfficientNet-B4, and Vision Transformer ViT-H/14. DenseNet-201 achieved the best performance among convolutional networks (67% accuracy), while ViT-H/14 achieved the highest overall accuracy (99%), but with significantly higher computational cost, raising deployment concerns. Our experiments highlight the trade-offs between accuracy, resource requirements, and deployability. The best-performing CNN (DenseNet-201) was integrated into a Hugging Face Gradio Space for real-time field use, demonstrating the feasibility of deploying lightweight models in conservation settings. This work contributes to African-grounded AI research by offering practical insights into model selection, dataset preparation, and responsible deployment of deep learning tools for wildlife conservation.
PDF23July 30, 2025