ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
August 12th, 2024
VITA: К открытому исходному коду интерактивной общей мультимодальной модели языка.
VITA: Towards Open-Source Interactive Omni Multimodal LLM
Chaoyou Fu, Haojia Lin, Zuwei Long, Yunhang Shen, Meng Zhao, Yifan Zhang, Xiong Wang, Di Yin, Long Ma, Xiawu Zheng, Ran He, Rongrong Ji, Yunsheng Wu, Caifeng Shan, Xing Sun
•
Aug 9, 2024
•
49
3
Gemma Scope: Открытые разреженные автоэнкодеры повсюду одновременно на Gemma 2
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2
Tom Lieberum, Senthooran Rajamanoharan, Arthur Conmy, Lewis Smith, Nicolas Sonnerat, Vikrant Varma, János Kramár, Anca Dragan, Rohin Shah, Neel Nanda
•
Aug 9, 2024
•
40
2
mPLUG-Owl3: К долгосрочному пониманию последовательности изображений в мультимодальных крупномасштабных языковых моделях.
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models
Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou
•
Aug 9, 2024
•
35
2
UniBench: Визуальное мышление требует переосмысления взаимодействия зрения и языка за пределами масштабирования.
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling
Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim
•
Aug 9, 2024
•
25
2
ToolSandbox: Набор данных для оценки возможностей использования инструментов LLM в состоянии диалога и интерактивном режиме.
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities
Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang
•
Aug 8, 2024
•
18
4
Вдохновленное фильтром Калмана распространение признаков для суперразрешения видеоизображений лиц.
Kalman-Inspired Feature Propagation for Video Face Super-Resolution
Ruicheng Feng, Chongyi Li, Chen Change Loy
•
Aug 9, 2024
•
10
3
BRAT: Бонусный ортогональный токен для архитектурно-агностического текстового инвертирования.
BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion
James Baker
•
Aug 8, 2024
•
9
2
MooER: Модели распознавания речи и перевода на основе LLM от Moore Threads
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads
Junhao Xu, Zhenlin Liang, Yi Liu, Yichao Hu, Jian Li, Yajun Zheng, Meng Cai, Hua Wang
•
Aug 9, 2024
•
8
2
MulliVC: Мультиязычное преобразование голоса с циклической последовательностью
MulliVC: Multi-lingual Voice Conversion With Cycle Consistency
Jiawei Huang, Chen Zhang, Yi Ren, Ziyue Jiang, Zhenhui Ye, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao
•
Aug 8, 2024
•
8
2
Формирование новых экспериментальных гипотез с использованием языковых моделей: случайное исследование обобщения кросс-датива
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization
Kanishka Misra, Najoung Kim
•
Aug 9, 2024
•
6
1