ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
October 3rd, 2024
Является ли выравнивание предпочтений всегда лучшим вариантом для улучшения перевода на основе LLM? Эмпирический анализ
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis
Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro
•
Sep 30, 2024
•
16
2
HarmoniCa: Гармонизация обучения и вывода для улучшения кэша признаков в ускорении диффузионного трансформера.
HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration
Yushi Huang, Zining Wang, Ruihao Gong, Jing Liu, Xinjie Zhang, Jinyang Guo, Xianglong Liu, Jun Zhang
•
Oct 2, 2024
•
5
2
FactAlign: Выравнивание фактичности в длинных текстах больших языковых моделей
FactAlign: Long-form Factuality Alignment of Large Language Models
Chao-Wei Huang, Yun-Nung Chen
•
Oct 2, 2024
•
9
2
Оценка сложности обобщения для больших языковых моделей
Quantifying Generalization Complexity for Large Language Models
Zhenting Qi, Hongyin Luo, Xuliang Huang, Zhuokai Zhao, Yibo Jiang, Xiangjun Fan, Himabindu Lakkaraju, James Glass
•
Oct 2, 2024
•
14
2
Селективная агрегация для адаптации низкоранговых моделей в федеративном обучении
Selective Aggregation for Low-Rank Adaptation in Federated Learning
Pengxin Guo, Shuang Zeng, Yanran Wang, Huijie Fan, Feifei Wang, Liangqiong Qu
•
Oct 2, 2024
•
19
3
Общее моделирование предпочтений с представлениями предпочтений для выравнивания языковых моделей
General Preference Modeling with Preference Representations for Aligning Language Models
Yifan Zhang, Ge Zhang, Yue Wu, Kangping Xu, Quanquan Gu
•
Oct 3, 2024
•
9
4
RATIONALYST: Процесс предварительного обучения с управлением для улучшения рассуждений
RATIONALYST: Pre-training Process-Supervision for Improving Reasoning
Dongwei Jiang, Guoxuan Wang, Yining Lu, Andrew Wang, Jingyu Zhang, Chuyu Liu, Benjamin Van Durme, Daniel Khashabi
•
Oct 1, 2024
•
37
3
Планирование робототехнических действий на длительный срок с обратной связью через моделирование последовательности равновесия.
Closed-loop Long-horizon Robotic Planning via Equilibrium Sequence Modeling
Jinghan Li, Zhicheng Sun, Fei Li, Cao Sheng, Jiazhong Yu, Yadong Mu
•
Oct 2, 2024
•
4
2
LEOPARD: Языковая модель видения для задач с множеством изображений с текстовым контентом
LEOPARD : A Vision Language Model For Text-Rich Multi-Image Tasks
Mengzhao Jia, Wenhao Yu, Kaixin Ma, Tianqing Fang, Zhihan Zhang, Siru Ouyang, Hongming Zhang, Meng Jiang, Dong Yu
•
Oct 2, 2024
•
26
5
HelpSteer2-Preference: Дополнение оценок предпочтениями
HelpSteer2-Preference: Complementing Ratings with Preferences
Zhilin Wang, Alexander Bukharin, Olivier Delalleau, Daniel Egert, Gerald Shen, Jiaqi Zeng, Oleksii Kuchaiev, Yi Dong
•
Oct 2, 2024
•
24
5
E.T. Bench: К открытому пониманию видео на уровне событий с использованием языка
E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding
Ye Liu, Zongyang Ma, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen
•
Sep 26, 2024
•
7
2
MOSEL: 950 000 часов речевых данных для обучения моделей на основе открытого исходного кода на языках ЕС
MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages
Marco Gaido, Sara Papi, Luisa Bentivogli, Alessio Brutti, Mauro Cettolo, Roberto Gretter, Marco Matassoni, Mohamed Nabih, Matteo Negri
•
Oct 1, 2024
•
15
2
SonicSim: настраиваемая платформа симуляции для обработки речи в сценариях с движущимися источниками звука
SonicSim: A customizable simulation platform for speech processing in moving sound source scenarios
Kai Li, Wendi Sang, Chang Zeng, Runxuan Yang, Guo Chen, Xiaolin Hu
•
Oct 2, 2024
•
3
2
От кода к корректности: закрытие последнего этапа генерации кода с иерархическим отладочным инструментом.
From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging
Yuling Shi, Songsong Wang, Chengcheng Wan, Xiaodong Gu
•
Oct 2, 2024
•
33
8
InfiniPot: Бесконечная обработка контекста на ограниченных по памяти LLM.
InfiniPot: Infinite Context Processing on Memory-Constrained LLMs
Minsoo Kim, Kyuhong Shim, Jungwook Choi, Simyung Chang
•
Oct 2, 2024
•
3
2
EmoKnob: Улучшение клонирования голоса с тонким управлением эмоциями
EmoKnob: Enhance Voice Cloning with Fine-Grained Emotion Control
Haozhe Chen, Run Chen, Julia Hirschberg
•
Oct 1, 2024
•
7
2
Не все рассудители LLM созданы равными.
Not All LLM Reasoners Are Created Equal
Arian Hosseini, Alessandro Sordoni, Daniel Toyama, Aaron Courville, Rishabh Agarwal
•
Oct 2, 2024
•
29
2
VLMGuard: Защита VLM от вредоносных подсказок с использованием неразмеченных данных
VLMGuard: Defending VLMs against Malicious Prompts via Unlabeled Data
Xuefeng Du, Reshmi Ghosh, Robert Sim, Ahmed Salem, Vitor Carvalho, Emily Lawton, Yixuan Li, Jack W. Stokes
•
Oct 1, 2024
•
5
2
Старый оптимизатор, новая норма: сборник
Old Optimizer, New Norm: An Anthology
Jeremy Bernstein, Laker Newhouse
•
Sep 30, 2024
•
4
2
PHI-S: Балансировка распределения для дистилляции без ярлыков с использованием нескольких учителей.
PHI-S: Distribution Balancing for Label-Free Multi-Teacher Distillation
Mike Ranzinger, Jon Barker, Greg Heinrich, Pavlo Molchanov, Bryan Catanzaro, Andrew Tao
•
Oct 2, 2024
•
36
4
3DGS-DET: Усиление трехмерного гауссовского сплетения с руководством по границам и выборочной дискретизацией, сосредоточенной на областях, для обнаружения трехмерных объектов.
3DGS-DET: Empower 3D Gaussian Splatting with Boundary Guidance and Box-Focused Sampling for 3D Object Detection
Yang Cao, Yuanliang Jv, Dan Xu
•
Oct 2, 2024
•
31
2
ComfyGen: Адаптивные рабочие процессы для генерации текста в изображения.
ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation
Rinon Gal, Adi Haviv, Yuval Alaluf, Amit H. Bermano, Daniel Cohen-Or, Gal Chechik
•
Oct 2, 2024
•
17
2
BordIRlines: Набор данных для оценки кросс-языкового поисково-дополненного генерирования
BordIRlines: A Dataset for Evaluating Cross-lingual Retrieval-Augmented Generation
Bryan Li, Samar Haider, Fiona Luo, Adwait Agashe, Chris Callison-Burch
•
Oct 2, 2024
•
6
4
EVER: Точная объемная рендеринговая эллипсоидная визуализация для синтеза изображения в реальном времени
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis
Alexander Mai, Peter Hedman, George Kopanas, Dor Verbin, David Futschik, Qiangeng Xu, Falko Kuester, Jon Barron, Yinda Zhang
•
Oct 2, 2024
•
7
2