ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
August 7th, 2024
Масштабирование вычислений LLM во время тестирования может быть более эффективным, чем масштабирование параметров модели.
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters
Charlie Snell, Jaehoon Lee, Kelvin Xu, Aviral Kumar
•
Aug 6, 2024
•
63
3
MMIU: Мультимодальное многокартинное понимание для оценки крупных моделей видео-языка
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models
Fanqing Meng, Jin Wang, Chuanhao Li, Quanfeng Lu, Hao Tian, Jiaqi Liao, Xizhou Zhu, Jifeng Dai, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao
•
Aug 5, 2024
•
62
3
LLaVA-OneVision: Простой перенос визуальных задач
LLaVA-OneVision: Easy Visual Task Transfer
Bo Li, Yuanhan Zhang, Dong Guo, Renrui Zhang, Feng Li, Hao Zhang, Kaichen Zhang, Yanwei Li, Ziwei Liu, Chunyuan Li
•
Aug 6, 2024
•
61
2
Объект стоит 64x64 пикселя: Генерация 3D объекта через диффузию изображения
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion
Xingguang Yan, Han-Hung Lee, Ziyu Wan, Angel X. Chang
•
Aug 6, 2024
•
41
3
MedTrinity-25M: Крупномасштабный мультимодальный набор данных с мультигранулярной разметкой для медицины
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine
Yunfei Xie, Ce Zhou, Lang Gao, Juncheng Wu, Xianhang Li, Hong-Yu Zhou, Sheng Liu, Lei Xing, James Zou, Cihang Xie, Yuyin Zhou
•
Aug 6, 2024
•
30
2
IPAdapter-Instruct: Разрешение неоднозначности в условиях, основанных на изображениях, с использованием инструктивных подсказок.
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
Ciara Rowles, Shimon Vainer, Dante De Nigris, Slava Elizarov, Konstantin Kutsy, Simon Donné
•
Aug 6, 2024
•
23
2
CoverBench: Сложный бенчмарк для верификации сложных утверждений
CoverBench: A Challenging Benchmark for Complex Claim Verification
Alon Jacovi, Moran Ambar, Eyal Ben-David, Uri Shaham, Amir Feder, Mor Geva, Dror Marcus, Avi Caciularu
•
Aug 6, 2024
•
15
2
Модели диффузии как инструменты для добычи данных
Diffusion Models as Data Mining Tools
Ioannis Siglidis, Aleksander Holynski, Alexei A. Efros, Mathieu Aubry, Shiry Ginosar
•
Jul 20, 2024
•
14
2
ReSyncer: Перекоммутация генератора на основе стиля для единой аудиовизуальной синхронизации лицевого исполнителя.
ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer
Jiazhi Guan, Zhiliang Xu, Hang Zhou, Kaisiyuan Wang, Shengyi He, Zhanwang Zhang, Borong Liang, Haocheng Feng, Errui Ding, Jingtuo Liu, Jingdong Wang, Youjian Zhao, Ziwei Liu
•
Aug 6, 2024
•
11
2
Синтез текста в SQL-данные от слабых и сильных моделей языка и логики.
Synthesizing Text-to-SQL Data from Weak and Strong LLMs
Jiaxi Yang, Binyuan Hui, Min Yang, Jian Yang, Junyang Lin, Chang Zhou
•
Aug 6, 2024
•
11
2
StructEval: Углубление и расширение оценки больших языковых моделей через структурированную оценку
StructEval: Deepen and Broaden Large Language Model Assessment via Structured Evaluation
Boxi Cao, Mengjie Ren, Hongyu Lin, Xianpei Han, Feng Zhang, Junfeng Zhan, Le Sun
•
Aug 6, 2024
•
10
2
AVESFormer: Эффективное проектирование трансформера для сегментации аудиовизуальных данных в реальном времени
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation
Zili Wang, Qi Yang, Linsu Shi, Jiazhong Yu, Qinghua Liang, Fei Li, Shiming Xiang
•
Aug 3, 2024
•
4
2