Ежедневные статьи
UniversalRAG: Генерация с расширением поиска на основе множества корпусов с разнообразными модальностями и уровнями детализацииUniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with
Diverse Modalities and Granularities
UniversalRAG: Генерация с расширением поиска на основе множества корпусов с разнообразными модальностями и уровнями детализации
UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with
Diverse Modalities and Granularities
Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, Jinheon Baek, Sung Ju Hwang•Apr 29, 2025•251
ReasonIR: Обучение ретриверов для задач логического выводаReasonIR: Training Retrievers for Reasoning Tasks
ReasonIR: Обучение ретриверов для задач логического вывода
ReasonIR: Training Retrievers for Reasoning Tasks
Rulin Shao, Rui Qiao, Varsha Kishore, Niklas Muennighoff, Xi Victoria Lin, Daniela Rus, Bryan Kian Hsiang Low, Sewon Min, Wen-tau Yih, Pang Wei Koh, Luke Zettlemoyer•Apr 29, 2025•161
Обучение с подкреплением для логического вывода в больших языковых моделях с одним обучающим примеромReinforcement Learning for Reasoning in Large Language Models with One
Training Example
Обучение с подкреплением для логического вывода в больших языковых моделях с одним обучающим примером
Reinforcement Learning for Reasoning in Large Language Models with One
Training Example
Yiping Wang, Qing Yang, Zhiyuan Zeng, Liliang Ren, Lucas Liu, Baolin Peng, Hao Cheng, Xuehai He, Kuan Wang, Jianfeng Gao, Weizhu Chen, Shuohang Wang, Simon Shaolei Du, Yelong Shen•Apr 29, 2025•132
К развитию оценочного мышления: Мета-оптимизация политик с эволюционирующими моделями вознагражденияToward Evaluative Thinking: Meta Policy Optimization with Evolving
Reward Models
К развитию оценочного мышления: Мета-оптимизация политик с эволюционирующими моделями вознаграждения
Toward Evaluative Thinking: Meta Policy Optimization with Evolving
Reward Models
Zae Myung Kim, Chanwoo Park, Vipul Raheja, Dongyeop Kang•Apr 28, 2025•81
Сертифицированное смягчение наихудшего случая нарушения авторских прав в языковых моделяхCertified Mitigation of Worst-Case LLM Copyright Infringement
Сертифицированное смягчение наихудшего случая нарушения авторских прав в языковых моделях
Certified Mitigation of Worst-Case LLM Copyright Infringement
Jingyu Zhang, Jiacan Yu, Marc Marone, Benjamin Van Durme, Daniel Khashabi•Apr 22, 2025•61
YoChameleon: Персонализированная генерация изображений и текстаYoChameleon: Personalized Vision and Language Generation
YoChameleon: Персонализированная генерация изображений и текста
YoChameleon: Personalized Vision and Language Generation
Thao Nguyen, Krishna Kumar Singh, Jing Shi, Trung Bui, Yong Jae Lee, Yuheng Li•Apr 29, 2025•41
TesserAct: Обучение 4D-воплощённых моделей мираTesserAct: Learning 4D Embodied World Models
TesserAct: Обучение 4D-воплощённых моделей мира
TesserAct: Learning 4D Embodied World Models
Haoyu Zhen, Qiao Sun, Hongxin Zhang, Junyan Li, Siyuan Zhou, Yilun Du, Chuang Gan•Apr 29, 2025•41