ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
January 7th, 2025
STAR: Пространственно-временное увеличение с помощью моделей текста-видео для суперразрешения видео в реальном мире.
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Rui Xie, Yinhong Liu, Penghao Zhou, Chen Zhao, Jun Zhou, Kai Zhang, Zhenyu Zhang, Jian Yang, Zhenheng Yang, Ying Tai
•
Jan 6, 2025
•
56
3
Вычисления во время тестирования: от мышления системы-1 к мышлению системы-2
Test-time Computing: from System-1 Thinking to System-2 Thinking
Yixin Ji, Juntao Li, Hai Ye, Kaixin Wu, Jia Xu, Linjian Mo, Min Zhang
•
Jan 5, 2025
•
46
2
BoostStep: Повышение математических возможностей больших языковых моделей с помощью улучшенного одношагового рассуждения
BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning
Beichen Zhang, Yuhong Liu, Xiaoyi Dong, Yuhang Zang, Pan Zhang, Haodong Duan, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
45
2
Диспайдер: Обеспечение видео LLM с активным взаимодействием в реальном времени через декоррелированное восприятие, принятие решений и реакцию.
Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction
Rui Qian, Shuangrui Ding, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
37
5
Персонализированный графовый поиск для больших языковых моделей
Personalized Graph-Based Retrieval for Large Language Models
Steven Au, Cameron J. Dimacali, Ojasmitha Pedirappagari, Namyong Park, Franck Dernoncourt, Yu Wang, Nikos Kanakaris, Hanieh Deilamsalehy, Ryan A. Rossi, Nesreen K. Ahmed
•
Jan 4, 2025
•
32
2
TransPixar: Развитие генерации видео из текста с прозрачностью
TransPixar: Advancing Text-to-Video Generation with Transparency
Luozhou Wang, Yijun Li, Zhifei Chen, Jui-Hsien Wang, Zhifei Zhang, He Zhang, Zhe Lin, Yingcong Chen
•
Jan 6, 2025
•
27
4
Законы масштабирования для обучения квантования с плавающей запятой
Scaling Laws for Floating Point Quantization Training
Xingwu Sun, Shuaipeng Li, Ruobing Xie, Weidong Han, Kan Wu, Zhen Yang, Yixing Li, An Wang, Shuai Li, Jinbao Xue, Yu Cheng, Yangyu Tao, Zhanhui Kang, Chengzhong Xu, Di Wang, Jie Jiang
•
Jan 5, 2025
•
27
2
Через маску: траектории движения на основе маски для генерации изображения в видеоформат.
Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation
Guy Yariv, Yuval Kirstain, Amit Zohar, Shelly Sheynin, Yaniv Taigman, Yossi Adi, Sagie Benaim, Adam Polyak
•
Jan 6, 2025
•
22
2
МЕТАГЕН-1: Метагеномная модель основы для мониторинга пандемий
METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring
Ollie Liu, Sami Jaghouar, Johannes Hagemann, Shangshang Wang, Jason Wiemels, Jeff Kaufman, Willie Neiswanger
•
Jan 3, 2025
•
21
2
Auto-RT: Автоматическое исследование стратегий для взлома для красной команды больших языковых моделей
Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models
Yanjiang Liu, Shuhen Zhou, Yaojie Lu, Huijia Zhu, Weiqiang Wang, Hongyu Lin, Ben He, Xianpei Han, Le Sun
•
Jan 3, 2025
•
18
2
GS-DiT: Развитие генерации видео с псевдо 4D гауссовыми полями через эффективное плотное трехмерное отслеживание точек.
GS-DiT: Advancing Video Generation with Pseudo 4D Gaussian Fields through Efficient Dense 3D Point Tracking
Weikang Bian, Zhaoyang Huang, Xiaoyu Shi, Yijin Li, Fu-Yun Wang, Hongsheng Li
•
Jan 5, 2025
•
17
3
DepthMaster: Подчинение моделей диффузии для монокулярной оценки глубины
DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
Ziyang Song, Zerong Wang, Bo Li, Hao Zhang, Ruijie Zhu, Li Liu, Peng-Tao Jiang, Tianzhu Zhang
•
Jan 5, 2025
•
15
4
PRMBench: Точный и сложный бенчмарк для моделей вознаграждения на уровне процесса
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
Mingyang Song, Zhaochen Su, Xiaoye Qu, Jiawei Zhou, Yu Cheng
•
Jan 6, 2025
•
14
2
ToolHop: Запросоориентированная метрика для оценки крупных языковых моделей в использовании инструментов с множественными шагами.
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use
Junjie Ye, Zhengyin Du, Xuesong Yao, Weijian Lin, Yufei Xu, Zehui Chen, Zaiyuan Wang, Sining Zhu, Zhiheng Xi, Siyu Yuan, Tao Gui, Qi Zhang, Xuanjing Huang, Jiechao Chen
•
Jan 5, 2025
•
11
3
Samba-asr - это передовая система распознавания речи, использующая структурированные модели пространства состояний.
Samba-asr state-of-the-art speech recognition leveraging structured state-space models
Syed Abdul Gaffar Shakhadri, Kruthika KR, Kartik Basavaraj Angadi
•
Jan 6, 2025
•
9
3
Ингредиенты: Смешивание индивидуальных фотографий с видео трансформерами диффузии.
Ingredients: Blending Custom Photos with Video Diffusion Transformers
Zhengcong Fei, Debang Li, Di Qiu, Changqian Yu, Mingyuan Fan
•
Jan 3, 2025
•
8
2
AutoPresent: Создание структурированных визуальных элементов с нуля
AutoPresent: Designing Structured Visuals from Scratch
Jiaxin Ge, Zora Zhiruo Wang, Xuhui Zhou, Yi-Hao Peng, Sanjay Subramanian, Qinyue Tan, Maarten Sap, Alane Suhr, Daniel Fried, Graham Neubig, Trevor Darrell
•
Jan 1, 2025
•
8
2
Автоматическое создание сложных тестовых вопросов с выбором ответа для оценки моделей обработки зрительной информации и языка.
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
Yuhui Zhang, Yuchang Su, Yiming Liu, Xiaohan Wang, James Burgess, Elaine Sui, Chenyu Wang, Josiah Aklilu, Alejandro Lozano, Anjiang Wei, Ludwig Schmidt, Serena Yeung-Levy
•
Jan 6, 2025
•
7
2
ProTracker: Вероятностное интегрирование для надежного и точного отслеживания точек
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking
Tingyang Zhang, Chen Wang, Zhiyang Dou, Qingzhe Gao, Jiahui Lei, Baoquan Chen, Lingjie Liu
•
Jan 6, 2025
•
4
2