ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
January 24th, 2025
Дискуссия способствует обобщению от слабого к сильному.
Debate Helps Weak-to-Strong Generalization
Hao Lang, Fei Huang, Yongbin Li
•
Jan 21, 2025
•
7
2
Step-KTO: Оптимизация математического рассуждения через пошаговую двоичную обратную связь
Step-KTO: Optimizing Mathematical Reasoning through Stepwise Binary Feedback
Yen-Ting Lin, Di Jin, Tengyu Xu, Tianhao Wu, Sainbayar Sukhbaatar, Chen Zhu, Yun He, Yun-Nung Chen, Jason Weston, Yuandong Tian, Arash Rahnama, Sinong Wang, Hao Ma, Han Fang
•
Jan 18, 2025
•
15
3
Улучшение генерации видео с помощью обратной связи от человека
Improving Video Generation with Human Feedback
Jie Liu, Gongye Liu, Jiajun Liang, Ziyang Yuan, Xiaokun Liu, Mingwu Zheng, Xiele Wu, Qiulin Wang, Wenyu Qin, Menghan Xia, Xintao Wang, Xiaohong Liu, Fei Yang, Pengfei Wan, Di Zhang, Kun Gai, Yujiu Yang, Wanli Ouyang
•
Jan 23, 2025
•
50
4
Сигма: Дифференциальное масштабирование запроса, ключа и значения для эффективных языковых моделей
Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models
Zhenghao Lin, Zihao Tang, Xiao Liu, Yeyun Gong, Yi Cheng, Qi Chen, Hang Li, Ying Xin, Ziyue Yang, Kailai Yang, Yu Yan, Xiao Liang, Shuai Lu, Yiming Huang, Zheheng Luo, Lei Qu, Xuan Feng, Yaoxiang Wang, Yuqing Xia, Feiyang Chen, Yuting Jiang, Yasen Hu, Hao Ni, Binyang Li, Guoshuai Zhao, Jui-Hao Chiang, Zhongxin Guo, Chen Lin, Kun Kuang, Wenjie Li, Yelong Shen, Jian Jiao, Peng Cheng, Mao Yang
•
Jan 23, 2025
•
48
2
DiffuEraser: Модель диффузии для видеоинпейнтинга
DiffuEraser: A Diffusion Model for Video Inpainting
Xiaowen Li, Haolan Xue, Peiran Ren, Liefeng Bo
•
Jan 17, 2025
•
14
2
GSTAR: Отслеживание и восстановление поверхности Гаусса
GSTAR: Gaussian Surface Tracking and Reconstruction
Chengwei Zheng, Lixin Xue, Juan Zarate, Jie Song
•
Jan 17, 2025
•
5
2
EchoVideo: Генерация видео с сохранением личности человека путем объединения мультимодальных признаков
EchoVideo: Identity-Preserving Human Video Generation by Multimodal Feature Fusion
Jiangchuan Wei, Shiyue Yan, Wenfeng Lin, Boyuan Liu, Renjie Chen, Mingyu Guo
•
Jan 23, 2025
•
7
2
Управляемый LLM: Управляемая Эволюция для Сохранения Интеллекта в LLM
Control LLM: Controlled Evolution for Intelligence Retention in LLM
Haichao Wei, Yunxiang Ren, Zhoutong Fu, Aman Lunia, Yi-Lin Chen, Alice Leung, Ya Xu
•
Jan 19, 2025
•
6
2
Эволюция и рыцарский слепой пятно машинного обучения
Evolution and The Knightian Blindspot of Machine Learning
Joel Lehman, Elliot Meyerson, Tarek El-Gaaly, Kenneth O. Stanley, Tarin Ziyaee
•
Jan 22, 2025
•
6
2
Оптимизация временных предпочтений для понимания видео большой продолжительности
Temporal Preference Optimization for Long-Form Video Understanding
Rui Li, Xiaohan Wang, Yuhui Zhang, Zeyu Wang, Serena Yeung-Levy
•
Jan 23, 2025
•
22
3
Можем ли мы создавать изображения с помощью CoT? Давайте проверим и укрепим этапы генерации изображения пошагово.
Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Ziyu Guo, Renrui Zhang, Chengzhuo Tong, Zhizheng Zhao, Peng Gao, Hongsheng Li, Pheng-Ann Heng
•
Jan 23, 2025
•
42
2
IMAGINE-E: Оценка интеллекта генерации изображений для передовых моделей текст-в-изображение.
IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models
Jiayi Lei, Renrui Zhang, Xiangfei Hu, Weifeng Lin, Zhen Li, Wenjian Sun, Ruoyi Du, Le Zhuo, Zhongyu Li, Xinyue Li, Shitian Zhao, Ziyu Guo, Yiting Lu, Peng Gao, Hongsheng Li
•
Jan 23, 2025
•
17
2
Одно-запрос-одна-история: Генерация текста в изображение с постоянным бесплатным обедом с использованием одного запроса.
One-Prompt-One-Story: Free-Lunch Consistent Text-to-Image Generation Using a Single Prompt
Tao Liu, Kai Wang, Senmao Li, Joost van de Weijer, Fahad Shahbaz Khan, Shiqi Yang, Yaxing Wang, Jian Yang, Ming-Ming Cheng
•
Jan 23, 2025
•
9
2
EmbodiedEval: Оценка мультимодальных LLM в качестве воплощенных агентов
EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents
Zhili Cheng, Yuge Tu, Ran Li, Shiqi Dai, Jinyi Hu, Shengding Hu, Jiahao Li, Yang Shi, Tianyu Yu, Weize Chen, Lei Shi, Maosong Sun
•
Jan 21, 2025
•
7
2
Видео-МММУ: Оценка усвоения знаний из профессиональных видеороликов многих дисциплин
Video-MMMU: Evaluating Knowledge Acquisition from Multi-Discipline Professional Videos
Kairui Hu, Penghao Wu, Fanyi Pu, Wang Xiao, Yuanhan Zhang, Xiang Yue, Bo Li, Ziwei Liu
•
Jan 23, 2025
•
26
2
SRMT: Общая память для многоагентного планирования пути на протяжении жизни.
SRMT: Shared Memory for Multi-agent Lifelong Pathfinding
Alsu Sagirova, Yuri Kuratov, Mikhail Burtsev
•
Jan 22, 2025
•
68
3
Галлюцинации могут улучшить крупные языковые модели в области поиска лекарств.
Hallucinations Can Improve Large Language Models in Drug Discovery
Shuzhou Yuan, Michael Färber
•
Jan 23, 2025
•
11
8