ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
October 8th, 2024
SwiftKV: Быстрое инференцирование с оптимизацией предзаполнения с сохранением знаний при трансформации модели
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation
Aurick Qiao, Zhewei Yao, Samyam Rajbhandari, Yuxiong He
•
Oct 4, 2024
•
2
2
SELECT: крупномасштабный бенчмарк стратегий курирования данных для классификации изображений
SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification
Benjamin Feuer, Jiawei Xu, Niv Cohen, Patrick Yubeaton, Govind Mittal, Chinmay Hegde
•
Oct 7, 2024
•
7
2
Навигация в цифровом мире так, как это делают люди: универсальное визуальное опорное основание для агентов графического пользовательского интерфейса
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents
Boyu Gou, Ruohan Wang, Boyuan Zheng, Yanan Xie, Cheng Chang, Yiheng Shu, Huan Sun, Yu Su
•
Oct 7, 2024
•
19
2
MathHay: Автоматизированный бенчмарк для математического рассуждения с длинным контекстом в LLMs
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs
Lei Wang, Shan Dong, Yuhui Xu, Hanze Dong, Yalu Wang, Amrita Saha, Ee-Peng Lim, Caiming Xiong, Doyen Sahoo
•
Oct 7, 2024
•
13
3
Подача! Сжатие шагов и слоев для ускорения генерации музыки
Presto! Distilling Steps and Layers for Accelerating Music Generation
Zachary Novack, Ge Zhu, Jonah Casebeer, Julian McAuley, Taylor Berg-Kirkpatrick, Nicholas J. Bryan
•
Oct 7, 2024
•
18
4
LLaMA-Berry: Парное оптимизирование для математического рассуждения на уровне олимпиады O1.
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning
Di Zhang, Jianbo Wu, Jingdi Lei, Tong Che, Jiatong Li, Tong Xie, Xiaoshui Huang, Shufei Zhang, Marco Pavone, Yuqiang Li, Wanli Ouyang, Dongzhan Zhou
•
Oct 3, 2024
•
55
4
Именованный бенчмарк распознавания клинических сущностей
Named Clinical Entity Recognition Benchmark
Wadood M Abdul, Marco AF Pimentel, Muhammad Umar Salman, Tathagata Raha, Clément Christophe, Praveen K Kanithi, Nasir Hayat, Ronnie Rajan, Shadab Khan
•
Oct 7, 2024
•
17
3
UniMuMo: Объединенная генерация текста, музыки и движения
UniMuMo: Unified Text, Music and Motion Generation
Han Yang, Kun Su, Yutong Zhang, Jiaben Chen, Kaizhi Qian, Gaowen Liu, Chuang Gan
•
Oct 6, 2024
•
19
2
Синтез взаимодействия автономных персонажей и сцены по текстовым инструкциям
Autonomous Character-Scene Interaction Synthesis from Text Instruction
Nan Jiang, Zimo He, Zi Wang, Hongjie Li, Yixin Chen, Siyuan Huang, Yixin Zhu
•
Oct 4, 2024
•
7
2
GSM-Symbolic: Понимание Ограничений Математического Мышления в Больших Языковых Моделях
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar
•
Oct 7, 2024
•
22
6
ScienceAgentBench: к строгой оценке языковых агентов для научных открытий на основе данных
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery
Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun
•
Oct 7, 2024
•
21
2
Краткое изложение: Модель вознаграждения детектива на уровне токенов для крупных моделей видео-языка.
TLDR: Token-Level Detective Reward Model for Large Vision Language Models
Deqing Fu, Tong Xiao, Rui Wang, Wang Zhu, Pengchuan Zhang, Guan Pang, Robin Jia, Lawrence Chen
•
Oct 7, 2024
•
17
2
Дифференциальный трансформатор
Differential Transformer
Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei
•
Oct 7, 2024
•
178
35
Переопределение Временного Моделирования в Видео Диффузии: Векторизованный Шаг Времени Подход
Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach
Yaofang Liu, Yumeng Ren, Xiaodong Cun, Aitor Artola, Yang Liu, Tieyong Zeng, Raymond H. Chan, Jean-michel Morel
•
Oct 4, 2024
•
5
2
Основание языка в многоперспективной референтной коммуникации
Grounding Language in Multi-Perspective Referential Communication
Zineng Tang, Lingjun Mao, Alane Suhr
•
Oct 4, 2024
•
4
2
Что важно для объединения моделей в масштабе?
What Matters for Model Merging at Scale?
Prateek Yadav, Tu Vu, Jonathan Lai, Alexandra Chronopoulou, Manaal Faruqui, Mohit Bansal, Tsendsuren Munkhdalai
•
Oct 4, 2024
•
8
2
OmniBooth: Обучение скрытому управлению для синтеза изображений с мультимодальным инструктированием
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction
Leheng Li, Weichao Qiu, Xu Yan, Jing He, Kaiqiang Zhou, Yingjie Cai, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 7, 2024
•
9
2
LLM знают больше, чем они показывают: о внутреннем представлении галлюцинаций LLM.
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations
Hadas Orgad, Michael Toker, Zorik Gekhman, Roi Reichart, Idan Szpektor, Hadas Kotek, Yonatan Belinkov
•
Oct 3, 2024
•
49
5
Сети Фурье-анализа (FAN)
FAN: Fourier Analysis Networks
Yihong Dong, Ge Li, Yongding Tao, Xue Jiang, Kechi Zhang, Jia Li, Jing Su, Jun Zhang, Jingjing Xu
•
Oct 3, 2024
•
27
6
MonST3R: Простой подход к оценке геометрии в условиях движения
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion
Junyi Zhang, Charles Herrmann, Junhwa Hur, Varun Jampani, Trevor Darrell, Forrester Cole, Deqing Sun, Ming-Hsuan Yang
•
Oct 4, 2024
•
19
3
Видеоруководство: Улучшение моделей диффузии видео без обучения с помощью Руководства учителя
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide
Dohun Lee, Bryan S Kim, Geon Yeong Park, Jong Chul Ye
•
Oct 6, 2024
•
30
3
TurtleBench: Оценка лучших языковых моделей с помощью реальных головоломок да/нет
TurtleBench: Evaluating Top Language Models via Real-World Yes/No Puzzles
Qingchen Yu, Shichao Song, Ke Fang, Yunfeng Shi, Zifan Zheng, Hanyu Wang, Simin Niu, Zhiyu Li
•
Oct 7, 2024
•
10
2
SePPO: Полуоптимизация предпочтений политики для выравнивания диффузии
SePPO: Semi-Policy Preference Optimization for Diffusion Alignment
Daoan Zhang, Guangchen Lan, Dong-Jun Han, Wenlin Yao, Xiaoman Pan, Hongming Zhang, Mingxiao Li, Pengcheng Chen, Yu Dong, Christopher Brinton, Jiebo Luo
•
Oct 7, 2024
•
5
2