ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
July 18th, 2024
Спектры: Комплексное исследование троичных, квантованных и FP16 языковых моделей
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models
Ayush Kaushal, Tejas Pandey, Tejas Vaidhya, Aaryan Bhagat, Irina Rish
•
Jul 17, 2024
•
80
3
GoldFinch: Высокопроизводительный гибрид RWKV/Transformer с линейной предварительной заполненностью и экстремальным сжатием кэша KV.
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
Daniel Goldstein, Fares Obeid, Eric Alcaide, Guangyu Song, Eugene Cheah
•
Jul 16, 2024
•
57
8
Агент Poison: проверка на проникновение агентов LLM с помощью отравления памяти или баз знаний
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li
•
Jul 17, 2024
•
52
3
E5-V: Универсальные вложения с мультимодальными большими языковыми моделями
E5-V: Universal Embeddings with Multimodal Large Language Models
Ting Jiang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang, Deqing Wang, Fuzhen Zhuang
•
Jul 17, 2024
•
41
3
LMMs-Eval: Реальная проверка оценки больших мультимодальных моделей
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models
Kaichen Zhang, Bo Li, Peiyuan Zhang, Fanyi Pu, Joshua Adrian Cahyono, Kairui Hu, Shuai Liu, Yuanhan Zhang, Jingkang Yang, Chunyuan Li, Ziwei Liu
•
Jul 17, 2024
•
36
4
Обучение на уровне патчей для больших языковых моделей
Patch-Level Training for Large Language Models
Chenze Shao, Fandong Meng, Jie Zhou
•
Jul 17, 2024
•
17
3
VD3D: Подчинение крупных видео-диффузионных трансформеров для управления 3D-камерой.
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Sherwin Bahmani, Ivan Skorokhodov, Aliaksandr Siarohin, Willi Menapace, Guocheng Qian, Michael Vasilkovsky, Hsin-Ying Lee, Chaoyang Wang, Jiaxu Zou, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Jul 17, 2024
•
13
3
IMAGDressing-v1: Настраиваемый виртуальный примерочный.
IMAGDressing-v1: Customizable Virtual Dressing
Fei Shen, Xin Jiang, Xin He, Hu Ye, Cong Wang, Xiaoyu Du, Zechao Li, Jinghui Tang
•
Jul 17, 2024
•
13
2
Золотая рыбка: Понимание зрительно-языковой информации в видеорядах произвольной длины
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Kirolos Ataallah, Xiaoqian Shen, Eslam Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny
•
Jul 17, 2024
•
8
2
Case2Code: Обучение индуктивному рассуждению с синтетическими данными
Case2Code: Learning Inductive Reasoning with Synthetic Data
Yunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan, Xipeng Qiu, Xuanjing Huang, Dahua Lin
•
Jul 17, 2024
•
8
7
Аудио-подготовка для генерации музыки с использованием дискретных бутылочных ограничителей.
Audio Conditioning for Music Generation via Discrete Bottleneck Features
Simon Rouard, Yossi Adi, Jade Copet, Axel Roebel, Alexandre Défossez
•
Jul 17, 2024
•
7
2
Splatfacto-W: Реализация метода гауссовского сплетинга в Nerfstudio для неограниченных фотоколлекций
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Congrong Xu, Justin Kerr, Angjoo Kanazawa
•
Jul 17, 2024
•
6
2
ThinkGrasp: Система зрительного языка для стратегического захвата частей в беспорядке
ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter
Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
•
Jul 16, 2024
•
5
2
AUITestAgent: Автоматическое тестирование функций GUI, ориентированное на требования.
AUITestAgent: Automatic Requirements Oriented GUI Function Testing
Yongxiang Hu, Xuan Wang, Yingchuan Wang, Yu Zhang, Shiyu Guo, Chaoyi Chen, Xin Wang, Yangfan Zhou
•
Jul 12, 2024
•
5
2
NavGPT-2: Развитие навигационной способности рассуждений для крупных моделей видео-языка
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu
•
Jul 17, 2024
•
4
2
Практическое забывание для больших языковых моделей
Practical Unlearning for Large Language Models
Chongyang Gao, Lixu Wang, Chenkai Weng, Xiao Wang, Qi Zhu
•
Jul 14, 2024
•
4
2
Искусство говорить "нет": контекстуальное невыполнение в языковых моделях
The Art of Saying No: Contextual Noncompliance in Language Models
Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi
•
Jul 2, 2024
•
4
2
Нулевая кросс-языковая передача для генерации синтетических данных в обнаружении грамматических ошибок.
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection
Gaetan Lopez Latouche, Marc-André Carbonneau, Ben Swanson
•
Jul 16, 2024
•
2
4
К пониманию генерации небезопасных видео
Towards Understanding Unsafe Video Generation
Yan Pang, Aiping Xiong, Yang Zhang, Tianhao Wang
•
Jul 17, 2024
•
0
2