ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 8th, 2024
Прямая оптимизация Нэша: обучение языковых моделей самосовершенствованию с общими предпочтениями.
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences
Corby Rosset, Ching-An Cheng, Arindam Mitra, Michael Santacroce, Ahmed Awadallah, Tengyang Xie
•
Apr 4, 2024
•
62
1
Поток поиска (SoS): Обучение поиску в языке
Stream of Search (SoS): Learning to Search in Language
Kanishk Gandhi, Denise Lee, Gabriel Grand, Muxin Liu, Winson Cheng, Archit Sharma, Noah D. Goodman
•
Apr 1, 2024
•
32
1
Нет "Нулевого Запуска" без Экспоненциальных Данных: Частота Предварительного Обучения Концепций Определяет Производительность Мультимодельной Модели
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance
Vishaal Udandarao, Ameya Prabhu, Adhiraj Ghosh, Yash Sharma, Philip H. S. Torr, Adel Bibi, Samuel Albanie, Matthias Bethge
•
Apr 4, 2024
•
30
1
AutoWebGLM: Bootstrap и укрепление веб-навигационного агента на основе большой языковой модели
AutoWebGLM: Bootstrap And Reinforce A Large Language Model-based Web Navigating Agent
Hanyu Lai, Xiao Liu, Iat Long Iong, Shuntian Yao, Yuxuan Chen, Pengbo Shen, Hao Yu, Hanchen Zhang, Xiaohan Zhang, Yuxiao Dong, Jie Tang
•
Apr 4, 2024
•
29
3
CantTalkAboutThis: Выравнивание языковых моделей для сохранения темы в диалогах
CantTalkAboutThis: Aligning Language Models to Stay on Topic in Dialogues
Makesh Narsimhan Sreedhar, Traian Rebedea, Shaona Ghosh, Christopher Parisien
•
Apr 4, 2024
•
27
5
Тренировка социальных навыков с использованием больших языковых моделей.
Social Skill Training with Large Language Models
Diyi Yang, Caleb Ziems, William Held, Omar Shaikh, Michael S. Bernstein, John Mitchell
•
Apr 5, 2024
•
16
0
Обучение с подкреплением для моделей согласованности: Более быстрое поколение изображений по тексту с управляемым вознаграждением.
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation
Owen Oertell, Jonathan D. Chang, Yiyi Zhang, Kianté Brantley, Wen Sun
•
Mar 25, 2024
•
16
3
Китайская модель Chinese Tiny LLM: Предварительное обучение крупной языковой модели с акцентом на китайский язык
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model
Xinrun Du, Zhouliang Yu, Songyang Gao, Ding Pan, Yuyang Cheng, Ziyang Ma, Ruibin Yuan, Xingwei Qu, Jiaheng Liu, Tianyu Zheng, Xinchen Luo, Guorui Zhou, Binhang Yuan, Wenhu Chen, Jie Fu, Ge Zhang
•
Apr 5, 2024
•
14
2
Устойчивое гауссово наложение
Robust Gaussian Splatting
François Darmon, Lorenzo Porzi, Samuel Rota-Bulò, Peter Kontschieder
•
Apr 5, 2024
•
10
0
Сигма: Сеть Сиамской Мамба для Мультимодальной Семантической Сегментации
Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation
Zifu Wan, Yuhao Wang, Silong Yong, Pingping Zhang, Simon Stepputtis, Katia Sycara, Yaqi Xie
•
Apr 5, 2024
•
7
1