ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
July 9th, 2024
MJ-Bench: Действительно ли ваш мультимодальная модель вознаграждения является хорошим судьей для генерации текста в изображение?
MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?
Zhaorun Chen, Yichao Du, Zichen Wen, Yiyang Zhou, Chenhang Cui, Zhenzhen Weng, Haoqin Tu, Chaoqi Wang, Zhengwei Tong, Qinglan Huang, Canyu Chen, Qinghao Ye, Zhihong Zhu, Yuqing Zhang, Jiawei Zhou, Zhuokai Zhao, Rafael Rafailov, Chelsea Finn, Huaxiu Yao
•
Jul 5, 2024
•
57
5
LLaMAX: Расширение лингвистических горизонтов LLM путем улучшения возможностей перевода за пределами 100 языков
LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages
Yinquan Lu, Wenhao Zhu, Lei Li, Yu Qiao, Fei Yuan
•
Jul 8, 2024
•
38
2
Ассоциативный Рекуррентный Памятный Трансформер
Associative Recurrent Memory Transformer
Ivan Rodkin, Yuri Kuratov, Aydar Bulatov, Mikhail Burtsev
•
Jul 5, 2024
•
37
2
Обучение редактированию изображений, сосредоточенное на действиях и рассуждениях, на основе видео и симуляций
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations
Benno Krojer, Dheeraj Vattikonda, Luis Lara, Varun Jampani, Eva Portelance, Christopher Pal, Siva Reddy
•
Jul 3, 2024
•
32
2
ANOLE: Открытые, авторегрессионные, масштабные мультимодальные модели для генерации изображений и текста.
ANOLE: An Open, Autoregressive, Native Large Multimodal Models for Interleaved Image-Text Generation
Ethan Chern, Jiadi Su, Yan Ma, Pengfei Liu
•
Jul 8, 2024
•
23
4
Оценка контекстных окон языковой модели: тест "рабочей памяти" и коррекция во время вывода
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction
Amanda Dsouza, Christopher Glaze, Changho Shin, Frederic Sala
•
Jul 4, 2024
•
17
1
UltraEdit: Инструкционное редактирование изображений с мелкой детализацией в масштабе.
UltraEdit: Instruction-based Fine-Grained Image Editing at Scale
Haozhe Zhao, Xiaojian Ma, Liang Chen, Shuzheng Si, Rujie Wu, Kaikai An, Peiyu Yu, Minjia Zhang, Qing Li, Baobao Chang
•
Jul 7, 2024
•
15
1
Tailor3D: Настройка редактирования и генерации 3D-активов с двусторонними изображениями
Tailor3D: Customized 3D Assets Editing and Generation with Dual-Side Images
Zhangyang Qi, Yunhan Yang, Mengchen Zhang, Long Xing, Xiaoyang Wu, Tong Wu, Dahua Lin, Xihui Liu, Jiaqi Wang, Hengshuang Zhao
•
Jul 8, 2024
•
14
1
InverseCoder: Разблокирование потенциала инструкционно настроенных языковых моделей кода с помощью Inverse-Instruct
InverseCoder: Unleashing the Power of Instruction-Tuned Code LLMs with Inverse-Instruct
Yutong Wu, Di Huang, Wenxuan Shi, Wei Wang, Lingzhe Gao, Shihao Liu, Ziyuan Nan, Kaizhao Yuan, Rui Zhang, Xishan Zhang, Zidong Du, Qi Guo, Yewen Pu, Dawei Yin, Xing Hu, Yunji Chen
•
Jul 8, 2024
•
14
2
Генерация видео как композиционное выравнивание потока
Compositional Video Generation as Flow Equalization
Xingyi Yang, Xinchao Wang
•
Jun 10, 2024
•
14
1
Множественная галлюцинация объектов в моделях видео-языкового восприятия
Multi-Object Hallucination in Vision-Language Models
Xuweiyi Chen, Ziqiao Ma, Xuejun Zhang, Sihan Xu, Shengyi Qian, Jianing Yang, David F. Fouhey, Joyce Chai
•
Jul 8, 2024
•
12
2
PAS: Система увеличения запросов Plug-and-Play с эффективным использованием данных
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System
Miao Zheng, Hao Liang, Fan Yang, Haoze Sun, Tianpeng Li, Lingchu Xiong, Yan Zhang, Yozhen Wu, Kun Li, Yanjun Sheng, Mingan Lin, Tao Zhang, Guosheng Dong, Yujing Qiao, Kun Fang, Weipeng Chen, Bin Cui, Wentao Zhang, Zenan Zhou
•
Jul 8, 2024
•
11
2
Обучение экспертов по задачам с использованием дистилляции на основе извлечения.
Training Task Experts through Retrieval Based Distillation
Jiaxin Ge, Xueying Jia, Vijay Viswanathan, Hongyin Luo, Graham Neubig
•
Jul 7, 2024
•
10
1
Понимание зависимости от визуальных признаков через призму сложности.
Understanding Visual Feature Reliance through the Lens of Complexity
Thomas Fel, Louis Bethune, Andrew Kyle Lampinen, Thomas Serre, Katherine Hermann
•
Jul 8, 2024
•
7
1
PartCraft: Создание творческих объектов по частям
PartCraft: Crafting Creative Objects by Parts
Kam Woh Ng, Xiatian Zhu, Yi-Zhe Song, Tao Xiang
•
Jul 5, 2024
•
6
2
LLMAEL: Большие языковые модели - хорошие дополнители контекста для сопоставления сущностей.
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking
Amy Xin, Yunjia Qi, Zijun Yao, Fangwei Zhu, Kaisheng Zeng, Xu Bin, Lei Hou, Juanzi Li
•
Jul 4, 2024
•
4
1
ANAH-v2: Масштабирование аннотации аналитической галлюцинации для больших языковых моделей
ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models
Yuzhe Gu, Ziwei Ji, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen
•
Jul 5, 2024
•
3
3