ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
February 14th, 2025
Тайфун T1: открытая тайская модель рассуждений
Typhoon T1: An Open Thai Reasoning Model
Pittawat Taveekitworachai, Potsawee Manakul, Kasima Tharnpipitchai, Kunat Pipatanakul
•
Feb 13, 2025
•
16
2
CoSER: Координация симуляции персоны на основе LLM установленных ролей
CoSER: Coordinating LLM-Based Persona Simulation of Established Roles
Xintao Wang, Heng Wang, Yifei Zhang, Xinfeng Yuan, Rui Xu, Jen-tse Huang, Siyu Yuan, Haoran Guo, Jiangjie Chen, Wei Wang, Yanghua Xiao, Shuchang Zhou
•
Feb 13, 2025
•
29
2
Может ли эту модель также распознать собак? Поиск модели с нулевым обучением на весах.
Can this Model Also Recognize Dogs? Zero-Shot Model Search from Weights
Jonathan Kahana, Or Nathan, Eliahu Horwitz, Yedid Hoshen
•
Feb 13, 2025
•
35
2
SelfCite: Самонадзорное выравнивание для контекстной атрибуции в больших языковых моделях
SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models
Yung-Sung Chuang, Benjamin Cohen-Wang, Shannon Zejiang Shen, Zhaofeng Wu, Hu Xu, Xi Victoria Lin, James Glass, Shang-Wen Li, Wen-tau Yih
•
Feb 13, 2025
•
36
2
Улучшение мультимодальных мультиязычных вложений с помощью высококачественных синтетических данных
mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data
Haonan Chen, Liang Wang, Nan Yang, Yutao Zhu, Ziliang Zhao, Furu Wei, Zhicheng Dou
•
Feb 12, 2025
•
13
2
Скрытые радиационные поля с 3D-осознанными 2D-представлениями
Latent Radiance Fields with 3D-aware 2D Representations
Chaoyi Zhou, Xi Liu, Feng Luo, Siyu Huang
•
Feb 13, 2025
•
6
2
Открытый рецепт: Адаптация языко-специфических LLM к модели рассуждений за один день с помощью слияния моделей
An Open Recipe: Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging
Kunat Pipatanakul, Pittawat Taveekitworachai, Potsawee Manakul, Kasima Tharnpipitchai
•
Feb 13, 2025
•
32
4
InfiniteHiP: Расширение контекста языковой модели до 3 миллионов токенов на одном графическом процессоре
InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU
Heejun Lee, Geon Park, Jaduk Suh, Sung Ju Hwang
•
Feb 13, 2025
•
149
6
DexTrack: К общеобобщаемому нейронному управлению отслеживанием для ловкого манипулирования по образцам человека
DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References
Xueyi Liu, Jianibieke Adalibieke, Qianwei Han, Yuzhe Qin, Li Yi
•
Feb 13, 2025
•
12
2
TripoSG: Синтез трехмерных форм высокой точности с использованием моделей потоков большого масштаба с прямоугольными коррекциями
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models
Yangguang Li, Zi-Xin Zou, Zexiang Liu, Dehu Wang, Yuan Liang, Zhipeng Yu, Xingchao Liu, Yuan-Chen Guo, Ding Liang, Wanli Ouyang, Yan-Pei Cao
•
Feb 10, 2025
•
41
4
Skrr: Пропуск и повторное использование слоев кодировщика текста для эффективной генерации изображений из текста.
Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation
Hoigi Seo, Wongi Jeong, Jae-sun Seo, Se Young Chun
•
Feb 12, 2025
•
44
2
Исследование потенциала архитектур без кодировщика в трехмерных LMMs
Exploring the Potential of Encoder-free Architectures in 3D LMMs
Yiwen Tang, Zoey Guo, Zhuhao Wang, Ray Zhang, Qizhi Chen, Junli Liu, Delin Qu, Zhigang Wang, Dong Wang, Xuelong Li, Bin Zhao
•
Feb 13, 2025
•
26
2
EmbodiedBench: Комплексное тестирование мультимодальных крупномасштабных языковых моделей для видеоориентированных инкорпорированных агентов
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents
Rui Yang, Hanyang Chen, Junyu Zhang, Mark Zhao, Cheng Qian, Kangrui Wang, Qineng Wang, Teja Venkat Koripella, Marziyeh Movahedi, Manling Li, Heng Ji, Huan Zhang, Tong Zhang
•
Feb 13, 2025
•
36
2
Математическое мышление в больших языковых моделях: оценка логических и арифметических ошибок в широком числовом диапазоне
Mathematical Reasoning in Large Language Models: Assessing Logical and Arithmetic Errors across Wide Numerical Ranges
Safal Shrestha, Minwu Kim, Keith Ross
•
Feb 12, 2025
•
11
2
MME-CoT: Сравнение цепочки мыслей в больших мультимодальных моделях для качества рассуждений, устойчивости и эффективности.
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency
Dongzhi Jiang, Renrui Zhang, Ziyu Guo, Yanwei Li, Yu Qi, Xinyan Chen, Liuhui Wang, Jianhan Jin, Claire Guo, Shen Yan, Bo Zhang, Chaoyou Fu, Peng Gao, Hongsheng Li
•
Feb 13, 2025
•
28
2
3CAD: Большой набор данных реального мира продуктов 3C для надзора за аномалиями без учителя
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
•
Feb 9, 2025
•
6
2
CoT-Valve: Настройка цепочки мыслей с возможностью сжатия длины
CoT-Valve: Length-Compressible Chain-of-Thought Tuning
Xinyin Ma, Guangnian Wan, Runpeng Yu, Gongfan Fang, Xinchao Wang
•
Feb 13, 2025
•
14
2
Логическое мышление в крупных языковых моделях: обзор
Logical Reasoning in Large Language Models: A Survey
Hanmeng Liu, Zhizhang Fu, Mengru Ding, Ruoxi Ning, Chaoli Zhang, Xiaozhang Liu, Yue Zhang
•
Feb 13, 2025
•
23
5
Стохастический попугай на плече LLM: Суммативная оценка понимания физических концепций
The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding
Mo Yu, Lemao Liu, Junjie Wu, Tsz Ting Chung, Shunchi Zhang, Jiangnan Li, Dit-Yan Yeung, Jie Zhou
•
Feb 13, 2025
•
194
3
Создатель VFX: Генерация анимированных визуальных эффектов с управляемым трансформером диффузии
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer
Xinyu Liu, Ailing Zeng, Wei Xue, Harry Yang, Wenhan Luo, Qifeng Liu, Yike Guo
•
Feb 9, 2025
•
8
2
SQuARE: Последовательный движок рассуждений по ответам на вопросы для улучшения цепочки мыслей в больших языковых моделях
SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models
Daniel Fleischer, Moshe Berchansky, Gad Markovits, Moshe Wasserblat
•
Feb 13, 2025
•
16
2