ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
September 27th, 2024
Необходимость анализа разговоров в эпоху LLM: Обзор задач, методов и тенденций.
The Imperative of Conversation Analysis in the Era of LLMs: A Survey of Tasks, Techniques, and Trends
Xinghua Zhang, Haiyang Yu, Yongbin Li, Minzheng Wang, Longze Chen, Fei Huang
•
Sep 21, 2024
•
13
2
Лотос: Модель визуального фундамента на основе диффузии для высококачественного плотного прогнозирования
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction
Jing He, Haodong Li, Wei Yin, Yixun Liang, Leheng Li, Kaiqiang Zhou, Hongbo Liu, Bingbing Liu, Ying-Cong Chen
•
Sep 26, 2024
•
34
2
Обнаружение драгоценностей в ранних слоях: ускорение LLM с длинным контекстом с сокращением входных токенов в 1000 раз
Discovering the Gems in Early Layers: Accelerating Long-Context LLMs with 1000x Input Token Reduction
Zhenmei Shi, Yifei Ming, Xuan-Phi Nguyen, Yingyu Liang, Shafiq Joty
•
Sep 25, 2024
•
26
5
Посттренировка латентных моделей диффузии в пространстве пикселей
Pixel-Space Post-Training of Latent Diffusion Models
Christina Zhang, Simran Motwani, Matthew Yu, Ji Hou, Felix Juefei-Xu, Sam Tsai, Peter Vajda, Zijian He, Jialiang Wang
•
Sep 26, 2024
•
22
2
LLaVA-3D: Простой, но эффективный способ придания LMMs трехмерного осознания.
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness
Chenming Zhu, Tai Wang, Wenwei Zhang, Jiangmiao Pang, Xihui Liu
•
Sep 26, 2024
•
35
2
Снижение следа многовекторного поиска с минимальным влиянием на производительность с помощью пула токенов
Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling
Benjamin Clavié, Antoine Chaffin, Griffin Adams
•
Sep 23, 2024
•
11
2
Следование инструкциям без настройки инструкций
Instruction Following without Instruction Tuning
John Hewitt, Nelson F. Liu, Percy Liang, Christopher D. Manning
•
Sep 21, 2024
•
31
4
Disco4D: Раздельная генерация и анимация человека в 4D из одного изображения
Disco4D: Disentangled 4D Human Generation and Animation from a Single Image
Hui En Pang, Shuai Liu, Zhongang Cai, Lei Yang, Tianwei Zhang, Ziwei Liu
•
Sep 25, 2024
•
11
2
MaskLLM: Обучаемая полуструктурированная разреженность для больших языковых моделей
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models
Gongfan Fang, Hongxu Yin, Saurav Muralidharan, Greg Heinrich, Jeff Pool, Jan Kautz, Pavlo Molchanov, Xinchao Wang
•
Sep 26, 2024
•
48
3
EMOVA: Дарящие силу языковые модели видеть, слышать и говорить с яркими эмоциями
EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions
Kai Chen, Yunhao Gou, Runhui Huang, Zhili Liu, Daxin Tan, Jing Xu, Chunwei Wang, Yi Zhu, Yihan Zeng, Kuo Yang, Dingdong Wang, Kun Xiang, Haoyuan Li, Haoli Bai, Jianhua Han, Xiaohui Li, Weike Jin, Nian Xie, Yu Zhang, James T. Kwok, Hengshuang Zhao, Xiaodan Liang, Dit-Yan Yeung, Xiao Chen, Zhenguo Li, Wei Zhang, Qun Liu, Lanqing Hong, Lu Hou, Hang Xu
•
Sep 26, 2024
•
41
13
Робот видит, робот делает: имитация манипулирования артикулированным объектом с монокулярной реконструкцией в 4D
Robot See Robot Do: Imitating Articulated Object Manipulation with Monocular 4D Reconstruction
Justin Kerr, Chung Min Kim, Mingxuan Wu, Brent Yi, Qianqian Wang, Ken Goldberg, Angjoo Kanazawa
•
Sep 26, 2024
•
9
2
Улучшение извлечения структурированных данных с помощью GraphRAG: случай из данных о футболе
Enhancing Structured-Data Retrieval with GraphRAG: Soccer Data Case Study
Zahra Sepasdar, Sushant Gautam, Cise Midoglu, Michael A. Riegler, Pål Halvorsen
•
Sep 26, 2024
•
9
2