ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
October 2nd, 2024
Embodied-RAG: Общая непараметрическая воплощенная память для поиска и генерации.
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation
Quanting Xie, So Yeon Min, Tianyi Zhang, Aarav Bajaj, Ruslan Salakhutdinov, Matthew Johnson-Roberson, Yonatan Bisk
•
Sep 26, 2024
•
3
2
Один токен, чтобы их всех разделить: сегментация рассуждений на основе языка в видео
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Zheng Zhang, Mike Zheng Shou
•
Sep 29, 2024
•
19
3
Flex3D: Генерация трехмерных изображений с применением гибкой модели восстановления и курирования входного представления.
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation
Junlin Han, Jianyuan Wang, Andrea Vedaldi, Philip Torr, Filippos Kokkinos
•
Oct 1, 2024
•
20
5
TPI-LLM: Эффективное обслуживание LLM масштабом 70 млрд на устройствах с ограниченными ресурсами на краю сети
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices
Zonghang Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Oct 1, 2024
•
33
8
ACE: Универсальный Создатель и Редактор, Следующий Инструкциям через Диффузию Трансформер
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
Zhen Han, Zeyinzi Jiang, Yulin Pan, Jingfeng Zhang, Chaojie Mao, Chenwei Xie, Yu Liu, Jingren Zhou
•
Sep 30, 2024
•
12
2
SyntheOcc: Синтез изображений улиц с управлением геометрии через 3D семантические MPI.
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs
Leheng Li, Weichao Qiu, Yingjie Cai, Xu Yan, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 1, 2024
•
11
2
DressRecon: Свободное 4D восстановление человека из монокулярного видео
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
Jeff Tan, Donglai Xiang, Shubham Tulsiani, Deva Ramanan, Gengshan Yang
•
Sep 30, 2024
•
9
2
Какой вред? Количественная оценка ощутимого влияния гендерного предвзятости в машинном переводе с помощью исследования, ориентированного на человека.
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study
Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof, Luisa Bentivogli
•
Oct 1, 2024
•
5
2
Закон самого слабого звена: Перекрестные возможности больших языковых моделей.
Law of the Weakest Link: Cross Capabilities of Large Language Models
Ming Zhong, Aston Zhang, Xuewei Wang, Rui Hou, Wenhan Xiong, Chenguang Zhu, Zhengxing Chen, Liang Tan, Chloe Bi, Mike Lewis, Sravya Popuri, Sharan Narang, Melanie Kambadur, Dhruv Mahajan, Sergey Edunov, Jiawei Han, Laurens van der Maaten
•
Sep 30, 2024
•
55
2
Atlas-Chat: Адаптация больших языковых моделей для низкоресурсных диалектов марокканского арабского языка
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect
Guokan Shang, Hadi Abdine, Yousef Khoubrane, Amr Mohamed, Yassine Abbahaddou, Sofiane Ennadir, Imane Momayiz, Xuguang Ren, Eric Moulines, Preslav Nakov, Michalis Vazirgiannis, Eric Xing
•
Sep 26, 2024
•
29
2
Расширение визуального контекстного окна: новая перспектива для понимания длинных видео.
Visual Context Window Extension: A New Perspective for Long Video Understanding
Hongchen Wei, Zhenzhong Chen
•
Sep 30, 2024
•
11
2
Последующее среднее исправленное потоковое распределение: к минимизации среднеквадратичной ошибки восстановления фотореалистичного изображения.
Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration
Guy Ohayon, Tomer Michaeli, Michael Elad
•
Oct 1, 2024
•
10
3
Выдающаяся: открытая передовая модель иллюстраций
Illustrious: an Open Advanced Illustration Model
Sang Hyun Park, Jun Young Koh, Junha Lee, Joy Song, Dongha Kim, Hoyeon Moon, Hyunju Lee, Min Song
•
Sep 30, 2024
•
16
3
Полезный DoggyBot: Поиск объектов в открытом мире с использованием четырехногих роботов и моделей зрения-языка
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
Qi Wu, Zipeng Fu, Xuxin Cheng, Xiaolong Wang, Chelsea Finn
•
Sep 30, 2024
•
8
2