Mutarjim:利用小型語言模型推進阿拉伯語-英語雙向翻譯Mutarjim: Advancing Bidirectional Arabic-English Translation with a
Small Language Model
我們推出了Mutarjim,這是一個緊湊而強大的雙向阿拉伯語-英語翻譯語言模型。雖然大規模的語言模型(LLMs)在自然語言處理任務,包括機器翻譯方面,已展現出顯著的進展,但較小的模型也有其獨特優勢。基於這一洞察,我們開發了Mutarjim,它基於Kuwain-1.5B,這是一個專為阿拉伯語和英語設計的語言模型。儘管體積適中,Mutarjim在多個已建立的基準測試中超越了許多更大的模型,這得益於其優化的兩階段訓練方法和精心挑選的高質量訓練語料庫。實驗結果顯示,Mutarjim在性能上可與體積大20倍的模型相媲美,同時顯著降低了計算成本和訓練需求。我們還推出了Tarjama-25,這是一個新的基準測試,旨在克服現有阿拉伯語-英語基準數據集的局限性,如領域狹窄、句子長度短和英語源語偏見。Tarjama-25包含5,000對專家審查的句子對,涵蓋廣泛的領域,提供了一個更全面和平衡的評估框架。值得注意的是,Mutarjim在Tarjama-25的英語到阿拉伯語任務中達到了最先進的性能,甚至超越了像GPT-4o mini這樣更大且專有的模型。我們公開發布Tarjama-25,以支持未來的研究並推動阿拉伯語-英語翻譯系統的評估進展。