ChatPaper.aiChatPaper

아프리카 야생동물 이미지 분류를 위한 딥러닝 모델 평가: DenseNet에서 Vision Transformers까지

Evaluating Deep Learning Models for African Wildlife Image Classification: From DenseNet to Vision Transformers

July 28, 2025
저자: Lukman Jibril Aliyu, Umar Sani Muhammad, Bilqisu Ismail, Nasiru Muhammad, Almustapha A Wakili, Seid Muhie Yimam, Shamsuddeen Hassan Muhammad, Mustapha Abdullahi
cs.AI

초록

아프리카의 야생동물 개체군은 심각한 위협에 직면해 있으며, 지난 50년 동안 척추동물의 수가 65% 이상 감소했다. 이에 대응하여 딥러닝을 활용한 이미지 분류 기술이 생물다양성 모니터링 및 보존을 위한 유망한 도구로 부상하고 있다. 본 논문은 아프리카 야생동물 이미지를 자동으로 분류하기 위한 딥러닝 모델의 비교 연구를 제시하며, 고정된 특징 추출기를 사용한 전이 학습에 초점을 맞춘다. 버팔로, 코끼리, 코뿔소, 얼룩말 등 네 종의 공개 데이터셋을 사용하여 DenseNet-201, ResNet-152, EfficientNet-B4, Vision Transformer ViT-H/14의 성능을 평가했다. DenseNet-201은 합성곱 신경망 중에서 가장 우수한 성능(67% 정확도)을 보였으며, ViT-H/14는 전체적으로 가장 높은 정확도(99%)를 달성했지만, 상당히 높은 계산 비용으로 인해 배포에 대한 우려가 제기되었다. 본 실험은 정확도, 자원 요구 사항, 배포 가능성 간의 상충 관계를 강조한다. 가장 우수한 성능을 보인 CNN(DenseNet-201)은 실시간 현장 사용을 위해 Hugging Face Gradio Space에 통합되었으며, 경량 모델을 보존 환경에 배포하는 것이 가능함을 입증했다. 이 연구는 모델 선택, 데이터셋 준비, 야생동물 보존을 위한 딥러닝 도구의 책임 있는 배포에 대한 실질적인 통찰을 제공함으로써 아프리카 기반의 AI 연구에 기여한다.
English
Wildlife populations in Africa face severe threats, with vertebrate numbers declining by over 65% in the past five decades. In response, image classification using deep learning has emerged as a promising tool for biodiversity monitoring and conservation. This paper presents a comparative study of deep learning models for automatically classifying African wildlife images, focusing on transfer learning with frozen feature extractors. Using a public dataset of four species: buffalo, elephant, rhinoceros, and zebra; we evaluate the performance of DenseNet-201, ResNet-152, EfficientNet-B4, and Vision Transformer ViT-H/14. DenseNet-201 achieved the best performance among convolutional networks (67% accuracy), while ViT-H/14 achieved the highest overall accuracy (99%), but with significantly higher computational cost, raising deployment concerns. Our experiments highlight the trade-offs between accuracy, resource requirements, and deployability. The best-performing CNN (DenseNet-201) was integrated into a Hugging Face Gradio Space for real-time field use, demonstrating the feasibility of deploying lightweight models in conservation settings. This work contributes to African-grounded AI research by offering practical insights into model selection, dataset preparation, and responsible deployment of deep learning tools for wildlife conservation.
PDF23July 30, 2025