ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
February 19th, 2025
Вы не полностью используете репрезентативную способность трансформера
You Do Not Fully Utilize Transformer's Representation Capacity
Gleb Gerasimov, Yaroslav Aksenov, Nikita Balagansky, Viacheslav Sinii, Daniil Gavrilov
•
Feb 13, 2025
•
38
3
Это ваш окончательный ответ? Масштабирование во время тестирования улучшает избирательное ответы на вопросы
Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering
William Jurayj, Jeffrey Cheng, Benjamin Van Durme
•
Feb 19, 2025
•
3
1
MUDDFormer: Преодоление остаточных узких мест в трансформерах с помощью многосторонних динамических плотных соединений
MUDDFormer: Breaking Residual Bottlenecks in Transformers via Multiway Dynamic Dense Connections
Da Xiao, Qingye Meng, Shengping Li, Xingyuan Yuan
•
Feb 13, 2025
•
12
2
Magma: Базисная модель для мультимодальных ИИ-агентов
Magma: A Foundation Model for Multimodal AI Agents
Jianwei Yang, Reuben Tan, Qianhui Wu, Ruijie Zheng, Baolin Peng, Yongyuan Liang, Yu Gu, Mu Cai, Seonghyeon Ye, Joel Jang, Yuquan Deng, Lars Liden, Jianfeng Gao
•
Feb 18, 2025
•
58
6
PAFT: Тонкая настройка, не зависящая от промптов
PAFT: Prompt-Agnostic Fine-Tuning
Chenxing Wei, Yao Shu, Mingwen Ou, Ying Tiffany He, Fei Richard Yu
•
Feb 18, 2025
•
15
8
Непрерывная диффузионная модель для языкового моделирования
Continuous Diffusion Model for Language Modeling
Jaehyeong Jo, Sung Ju Hwang
•
Feb 17, 2025
•
54
4
Скрытые риски крупных моделей рассуждений: оценка безопасности R1
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1
Kaiwen Zhou, Chengzhi Liu, Xuandong Zhao, Shreedhar Jangam, Jayanth Srinivasa, Gaowen Liu, Dawn Song, Xin Eric Wang
•
Feb 18, 2025
•
7
2
Perovskite-LLM: Модели больших языков с расширенными знаниями для исследований перовскитных солнечных элементов
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research
Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
•
Feb 18, 2025
•
2
2
Использование моделей компьютерного зрения для анализа временных рядов: обзор
Harnessing Vision Models for Time Series Analysis: A Survey
Jingchao Ni, Ziming Zhao, ChengAo Shen, Hanghang Tong, Dongjin Song, Wei Cheng, Dongsheng Luo, Haifeng Chen
•
Feb 13, 2025
•
2
2
Phantom: Создание согласованных с объектом видео через кросс-модальное выравнивание
Phantom: Subject-consistent video generation via cross-modal alignment
Lijie Liu, Tianxiang Ma, Bingchuan Li, Zhuowei Chen, Jiawei Liu, Qian He, Xinglong Wu
•
Feb 16, 2025
•
60
3
Пересмотр масштабируемости моделей типа o1 на этапе тестирования: действительно ли они обладают способностью к масштабированию во время тестирования?
Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities?
Zhiyuan Zeng, Qinyuan Cheng, Zhangyue Yin, Yunhua Zhou, Xipeng Qiu
•
Feb 17, 2025
•
16
2
YOLOv12: Реальные детекторы объектов с фокусом на механизмах внимания
YOLOv12: Attention-Centric Real-Time Object Detectors
Yunjie Tian, Qixiang Ye, David Doermann
•
Feb 18, 2025
•
10
2
OctoTools: Агентная структура с расширяемыми инструментами для сложных рассуждений
OctoTools: An Agentic Framework with Extensible Tools for Complex Reasoning
Pan Lu, Bowen Chen, Sheng Liu, Rahul Thapa, Joseph Boen, James Zou
•
Feb 16, 2025
•
17
3
Масштабирование автономных агентов через автоматическое моделирование вознаграждений и планирование
Scaling Autonomous Agents via Automatic Reward Modeling And Planning
Zhenfang Chen, Delin Chen, Rui Sun, Wenjun Liu, Chuang Gan
•
Feb 17, 2025
•
2
2
Soundwave: меньше значит больше для выравнивания речи и текста в больших языковых моделях
Soundwave: Less is More for Speech-Text Alignment in LLMs
Yuhao Zhang, Zhiheng Liu, Fan Bu, Ruiyu Zhang, Benyou Wang, Haizhou Li
•
Feb 18, 2025
•
86
4
FLAG-Trader: Интеграция LLM-агента с градиентным обучением с подкреплением для финансового трейдинга
FLAG-Trader: Fusion LLM-Agent with Gradient-based Reinforcement Learning for Financial Trading
Guojun Xiong, Zhiyang Deng, Keyi Wang, Yupeng Cao, Haohang Li, Yangyang Yu, Xueqing Peng, Mingquan Lin, Kaleb E Smith, Xiao-Yang Liu, Jimin Huang, Sophia Ananiadou, Qianqian Xie
•
Feb 17, 2025
•
36
2
SoFar: Языково-ориентированная система навигации, объединяющая пространственное мышление и манипуляции с объектами
SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation
Zekun Qi, Wenyao Zhang, Yufei Ding, Runpei Dong, Xinqiang Yu, Jingwen Li, Lingyun Xu, Baoyu Li, Xialin He, Guofan Fan, Jiazhao Zhang, Jiawei He, Jiayuan Gu, Xin Jin, Kaisheng Ma, Zhizheng Zhang, He Wang, Li Yi
•
Feb 18, 2025
•
30
2
Многоязычный энкодер знает больше, чем вы думаете: Совместное обучение с общими весами для языков с крайне ограниченными ресурсами
Multilingual Encoder Knows more than You Realize: Shared Weights Pretraining for Extremely Low-Resource Languages
Zeli Su, Ziyin Zhang, Guixian Xu, Jianing Liu, XU Han, Ting Zhang, Yushuang Dong
•
Feb 15, 2025
•
2
2
RealSyn: Эффективная и масштабируемая мультимодальная парадигма преобразования документов с чередованием данных
RealSyn: An Effective and Scalable Multimodal Interleaved Document Transformation Paradigm
Tiancheng Gu, Kaicheng Yang, Chaoyi Zhang, Yin Xie, Xiang An, Ziyong Feng, Dongnan Liu, Weidong Cai, Jiankang Deng
•
Feb 18, 2025
•
16
2
Предварительное обучение авторегрессивных роботизированных моделей с использованием 4D-представлений
Pre-training Auto-regressive Robotic Models with 4D Representations
Dantong Niu, Yuvan Sharma, Haoru Xue, Giscard Biamby, Junyi Zhang, Ziteng Ji, Trevor Darrell, Roei Herzig
•
Feb 18, 2025
•
5
2
FinMTEB: Финансовый эталонный тест для массового создания текстовых вложений
FinMTEB: Finance Massive Text Embedding Benchmark
Yixuan Tang, Yi Yang
•
Feb 16, 2025
•
3
2
Атом Мыслей для масштабирования марковских языковых моделей во время тестирования
Atom of Thoughts for Markov LLM Test-Time Scaling
Fengwei Teng, Zhaoyang Yu, Quan Shi, Jiayi Zhang, Chenglin Wu, Yuyu Luo
•
Feb 17, 2025
•
16
4
Multimodal Mamba: Декодер-ориентированная мультимодальная модель пространства состояний через дистилляцию от квадратичной к линейной
Multimodal Mamba: Decoder-only Multimodal State Space Model via Quadratic to Linear Distillation
Bencheng Liao, Hongyuan Tao, Qian Zhang, Tianheng Cheng, Yingyue Li, Haoran Yin, Wenyu Liu, Xinggang Wang
•
Feb 18, 2025
•
38
2
Упаковка 1568 токенов в один вектор и обратно: исследование пределов емкости пространства эмбеддингов
Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity
Yuri Kuratov, Mikhail Arkhipov, Aydar Bulatov, Mikhail Burtsev
•
Feb 18, 2025
•
70
4
SafeRoute: Адаптивный выбор моделей для эффективного и точного обеспечения защитных механизмов безопасности в крупных языковых моделях
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models
Seanie Lee, Dong Bok Lee, Dominik Wagner, Minki Kang, Haebin Seong, Tobias Bocklet, Juho Lee, Sung Ju Hwang
•
Feb 18, 2025
•
28
2
Внедрение предметно-ориентированных знаний в крупные языковые модели: всесторонний обзор
Injecting Domain-Specific Knowledge into Large Language Models: A Comprehensive Survey
Zirui Song, Bin Yan, Yuhan Liu, Miao Fang, Mingzhe Li, Rui Yan, Xiuying Chen
•
Feb 15, 2025
•
4
2
Text2World: Оценка крупных языковых моделей для генерации символических моделей мира
Text2World: Benchmarking Large Language Models for Symbolic World Model Generation
Mengkang Hu, Tianxing Chen, Yude Zou, Yuheng Lei, Qiguang Chen, Ming Li, Hongyuan Zhang, Wenqi Shao, Ping Luo
•
Feb 18, 2025
•
13
2
Переосмысление изучения разнообразных человеческих предпочтений через анализ главных компонент
Rethinking Diverse Human Preference Learning through Principal Component Analysis
Feng Luo, Rui Yang, Hao Sun, Chunyuan Deng, Jiarui Yao, Jingyan Shen, Huan Zhang, Hanjie Chen
•
Feb 18, 2025
•
38
3
HeadInfer: Энергоэффективный вывод больших языковых моделей за счет поэтапного выгрузки голов
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading
Cheng Luo, Zefan Cai, Hanshi Sun, Jinqi Xiao, Bo Yuan, Wen Xiao, Junjie Hu, Jiawei Zhao, Beidi Chen, Anima Anandkumar
•
Feb 18, 2025
•
11
2
Коллективное сравнительное рассуждение: раскрытие комплексных оценок для модели "LLM-как-судья"
Crowd Comparative Reasoning: Unlocking Comprehensive Evaluations for LLM-as-a-Judge
Qiyuan Zhang, Yufei Wang, Yuxin Jiang, Liangyou Li, Chuhan Wu, Yasheng Wang, Xin Jiang, Lifeng Shang, Ruiming Tang, Fuyuan Lyu, Chen Ma
•
Feb 18, 2025
•
6
2
Flow-of-Options: Диверсифицированное и улучшенное рассуждение в языковых моделях через анализ возможных вариантов
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options
Lakshmi Nair, Ian Trase, Mark Kim
•
Feb 18, 2025
•
7
3
Оперативные обновления для совмещения коммуникации и вычислений в DiLoCo
Eager Updates For Overlapped Communication and Computation in DiLoCo
Satyen Kale, Arthur Douillard, Yanislav Donchev
•
Feb 18, 2025
•
7
2
HealthGPT: Медицинская крупная визуально-языковая модель для объединения понимания и генерации через адаптацию гетерогенных знаний
HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation
Tianwei Lin, Wenqiao Zhang, Sijing Li, Yuqian Yuan, Binhe Yu, Haoyuan Li, Wanggui He, Hao Jiang, Mengze Li, Xiaohui Song, Siliang Tang, Jun Xiao, Hui Lin, Yueting Zhuang, Beng Chin Ooi
•
Feb 14, 2025
•
10
2