ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
December 18th, 2024
Исследование: Направленность на генерацию кода с обеспечением безопасности исключений с использованием промежуточного языка и агентов фреймворка.
Seeker: Towards Exception Safety Code Generation with Intermediate Language Agents Framework
Xuanming Zhang, Yuxuan Chen, Yiming Zheng, Zhexin Zhang, Yuan Yuan, Minlie Huang
•
Dec 16, 2024
•
6
2
Способны ли ваши LLM на устойчивое рассуждение?
Are Your LLMs Capable of Stable Reasoning?
Junnan Liu, Hongwei Liu, Linchen Xiao, Ziyi Wang, Kuikun Liu, Songyang Gao, Wenwei Zhang, Songyang Zhang, Kai Chen
•
Dec 17, 2024
•
95
3
Сжатая цепочка мыслей: эффективное рассуждение через плотные представления
Compressed Chain of Thought: Efficient Reasoning Through Dense Representations
Jeffrey Cheng, Benjamin Van Durme
•
Dec 17, 2024
•
36
2
SUGAR: Пользовательская настройка видео на основе субъекта в нулевом режиме обучения
SUGAR: Subject-Driven Video Customization in a Zero-Shot Manner
Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu, Nanxuan Zhao, Jing Shi, Tong Sun
•
Dec 13, 2024
•
5
2
VisDoM: Мультидокументальный вопросно-ответный сервис с использованием визуально насыщенных элементов с помощью мультимодального усиления поиска и генерации.
VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation
Manan Suri, Puneet Mathur, Franck Dernoncourt, Kanika Goswami, Ryan A. Rossi, Dinesh Manocha
•
Dec 14, 2024
•
15
2
Marigold-DC: Нулевая глубина монокулярного завершения с управляемой диффузией
Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion
Massimiliano Viola, Kevin Qu, Nando Metzger, Bingxin Ke, Alexander Becker, Konrad Schindler, Anton Obukhov
•
Dec 18, 2024
•
7
2
Многомерные исследования: оценка персонализации в реальном мире в крупных мультимодальных моделях
Multi-Dimensional Insights: Benchmarking Real-World Personalization in Large Multimodal Models
YiFan Zhang, Shanglin Lei, Runqi Qiao, Zhuoma GongQue, Xiaoshuai Song, Guanting Dong, Qiuna Tan, Zhe Wei, Peiqing Yang, Ye Tian, Yadong Xue, Xiaofei Wang, Honggang Zhang
•
Dec 17, 2024
•
42
3
OmniEval: Омнидирекциональная и автоматическая оценочная база данных RAG в финансовой сфере
OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain
Shuting Wang, Jiejun Tan, Zhicheng Dou, Ji-Rong Wen
•
Dec 17, 2024
•
42
2
Подстройка газа: Пересмотр обрезки визуальных токенов для ускорения моделей видео-языка
Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration
Mark Endo, Xiaohan Wang, Serena Yeung-Levy
•
Dec 17, 2024
•
13
2
MIVE: Новый дизайн и бенчмарк для многозадачного видеомонтажа
MIVE: New Design and Benchmark for Multi-Instance Video Editing
Samuel Teodoro, Agus Gunawan, Soo Ye Kim, Jihyong Oh, Munchurl Kim
•
Dec 17, 2024
•
4
2
Когда говорить, когда воздерживаться: контрастный декодинг с воздержанием
When to Speak, When to Abstain: Contrastive Decoding with Abstention
Hyuhng Joon Kim, Youna Kim, Sang-goo Lee, Taeuk Kim
•
Dec 17, 2024
•
4
2
Предложитель-Агент-Оценщик (ПАО): Автономное обнаружение навыков для агентов Интернет-моделей основы.
Proposer-Agent-Evaluator(PAE): Autonomous Skill Discovery For Foundation Model Internet Agents
Yifei Zhou, Qianlan Yang, Kaixiang Lin, Min Bai, Xiong Zhou, Yu-Xiong Wang, Sergey Levine, Erran Li
•
Dec 17, 2024
•
12
2
Возникновение абстракций: механизм кодирования и декодирования концепций для обучения в контексте в трансформерах
Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers
Seungwook Han, Jinyeop Song, Jeff Gore, Pulkit Agrawal
•
Dec 16, 2024
•
15
2