ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
December 20th, 2024
AceMath: Развитие передового математического рассуждения с помощью пост-тренировки и моделирования вознаграждения
AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling
Zihan Liu, Yang Chen, Mohammad Shoeybi, Bryan Catanzaro, Wei Ping
•
Dec 19, 2024
•
13
2
DateLogicQA: Сравнение временных искажений в крупных языковых моделях
DateLogicQA: Benchmarking Temporal Biases in Large Language Models
Gagan Bhatia, MingZe Tang, Cristina Mahanta, Madiha Kazi
•
Dec 17, 2024
•
2
2
Прогрессивное мультимодальное рассуждение с помощью активного извлечения.
Progressive Multimodal Reasoning via Active Retrieval
Guanting Dong, Chenghao Zhang, Mengjie Deng, Yutao Zhu, Zhicheng Dou, Ji-Rong Wen
•
Dec 19, 2024
•
74
2
TOMG-Bench: Оценка LLM на генерации молекул на основе текста
TOMG-Bench: Evaluating LLMs on Text-based Open Molecule Generation
Jiatong Li, Junxian Li, Yunqing Liu, Dongzhan Zhou, Qing Li
•
Dec 19, 2024
•
4
2
Вставка объекта с учетом возможностей через двойное диффузное распространение с учетом маски.
Affordance-Aware Object Insertion via Mask-Aware Dual Diffusion
Jixuan He, Wanhua Li, Ye Liu, Junsik Kim, Donglai Wei, Hanspeter Pfister
•
Dec 19, 2024
•
15
2
Технический отчёт Qwen2.5
Qwen2.5 Technical Report
Qwen, An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu, Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, Huan Lin, Jian Yang, Jianhong Tu, Jianwei Zhang, Jianxin Yang, Jiaxi Yang, Jingren Zhou, Junyang Lin, Kai Dang, Keming Lu, Keqin Bao, Kexin Yang, Le Yu, Mei Li, Mingfeng Xue, Pei Zhang, Qin Zhu, Rui Men, Runji Lin, Tianhao Li, Tingyu Xia, Xingzhang Ren, Xuancheng Ren, Yang Fan, Yang Su, Yichang Zhang, Yu Wan, Yuqiong Liu, Zeyu Cui, Zhenru Zhang, Zihan Qiu
•
Dec 19, 2024
•
365
11
Как синтезировать текстовые данные без коллапса модели?
How to Synthesize Text Data without Model Collapse?
Xuekai Zhu, Daixuan Cheng, Hengli Li, Kaiyan Zhang, Ermo Hua, Xingtai Lv, Ning Ding, Zhouhan Lin, Zilong Zheng, Bowen Zhou
•
Dec 19, 2024
•
53
4
Улучшение описательного заголовка с помощью визуальных специалистов для мультимодального восприятия.
Descriptive Caption Enhancement with Visual Specialists for Multimodal Perception
Yanpeng Sun, Jing Hao, Ke Zhu, Jiang-Jiang Liu, Yuxiang Zhao, Xiaofan Li, Gang Zhang, Zechao Li, Jingdong Wang
•
Dec 18, 2024
•
6
2
AV-связь: Временно-выровненные диффузионные признаки для кросс-модальной генерации аудио-видео.
AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation
Moayed Haji-Ali, Willi Menapace, Aliaksandr Siarohin, Ivan Skorokhodov, Alper Canberk, Kwot Sin Lee, Vicente Ordonez, Sergey Tulyakov
•
Dec 19, 2024
•
5
2
LeviTor: Синтез изображения в видео на основе трехмерной траектории
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis
Hanlin Wang, Hao Ouyang, Qiuyu Wang, Wen Wang, Ka Leong Cheng, Qifeng Chen, Yujun Shen, Limin Wang
•
Dec 19, 2024
•
15
3
DI-PCG: Диффузионно-основанная эффективная обратная процедурная генерация контента для создания трехмерных активов высокого качества
DI-PCG: Diffusion-based Efficient Inverse Procedural Content Generation for High-quality 3D Asset Creation
Wang Zhao, Yan-Pei Cao, Jiale Xu, Yuejiang Dong, Ying Shan
•
Dec 19, 2024
•
9
2
Генерация движения человека с учетом 2D: Move-in-2D
Move-in-2D: 2D-Conditioned Human Motion Generation
Hsin-Ping Huang, Yang Zhou, Jui-Hsien Wang, Difan Liu, Feng Liu, Ming-Hsuan Yang, Zhan Xu
•
Dec 17, 2024
•
2
2
UIP2P: Неуправляемое редактирование изображений на основе инструкций с помощью циклического редактирования для обеспечения согласованности.
UIP2P: Unsupervised Instruction-based Image Editing via Cycle Edit Consistency
Enis Simsar, Alessio Tonioni, Yongqin Xian, Thomas Hofmann, Federico Tombari
•
Dec 19, 2024
•
5
3
MegaPairs: Массивная синтез данных для универсального мультимодального поиска
MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval
Junjie Zhou, Zheng Liu, Ze Liu, Shitao Xiao, Yueze Wang, Bo Zhao, Chen Jason Zhang, Defu Lian, Yongping Xiong
•
Dec 19, 2024
•
55
2
LongBench v2: К более глубокому пониманию и рассуждениям о реалистичных многозадачных задачах с длинным контекстом.
LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks
Yushi Bai, Shangqing Tu, Jiajie Zhang, Hao Peng, Xiaozhi Wang, Xin Lv, Shulin Cao, Jiazheng Xu, Lei Hou, Yuxiao Dong, Jie Tang, Juanzi Li
•
Dec 19, 2024
•
38
5
PixelMan: Согласованное редактирование объектов с моделями диффузии через манипуляцию и генерацию пикселей
PixelMan: Consistent Object Editing with Diffusion Models via Pixel Manipulation and Generation
Liyao Jiang, Negar Hassanpour, Mohammad Salameh, Mohammadreza Samadi, Jiao He, Fengyu Sun, Di Niu
•
Dec 18, 2024
•
3
4
Переход от слов к пикселям: Фреймворк для эволюции кросс-модальности
Flowing from Words to Pixels: A Framework for Cross-Modality Evolution
Qihao Liu, Xi Yin, Alan Yuille, Andrew Brown, Mannat Singh
•
Dec 19, 2024
•
29
4