ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
July 18th, 2024
Espectros: Un Estudio Integral de Modelos de Lenguaje Ternarios, Cuantizados y FP16
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models
Ayush Kaushal, Tejas Pandey, Tejas Vaidhya, Aaryan Bhagat, Irina Rish
•
Jul 17, 2024
•
80
3
GoldFinch: Alto Rendimiento Híbrido RWKV/Transformador con Precarga Lineal y Compresión Extrema de Caché KV.
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
Daniel Goldstein, Fares Obeid, Eric Alcaide, Guangyu Song, Eugene Cheah
•
Jul 16, 2024
•
57
8
AgentPoison: Red-Teaming de Agentes LLM a través de Envenenamiento de Memoria o Bases de Conocimiento
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li
•
Jul 17, 2024
•
52
3
E5-V: Incrustaciones Universales con Modelos de Lenguaje Multimodal de Gran Escala
E5-V: Universal Embeddings with Multimodal Large Language Models
Ting Jiang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang, Deqing Wang, Fuzhen Zhuang
•
Jul 17, 2024
•
41
3
LMMs-Eval: Realidad de la Evaluación de Modelos Multimodales Grandes
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models
Kaichen Zhang, Bo Li, Peiyuan Zhang, Fanyi Pu, Joshua Adrian Cahyono, Kairui Hu, Shuai Liu, Yuanhan Zhang, Jingkang Yang, Chunyuan Li, Ziwei Liu
•
Jul 17, 2024
•
36
4
Entrenamiento a Nivel de Parche para Modelos de Lenguaje Grandes
Patch-Level Training for Large Language Models
Chenze Shao, Fandong Meng, Jie Zhou
•
Jul 17, 2024
•
17
3
VD3D: Domando Grandes Transformadores de Difusión de Video para el Control de Cámara 3D
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Sherwin Bahmani, Ivan Skorokhodov, Aliaksandr Siarohin, Willi Menapace, Guocheng Qian, Michael Vasilkovsky, Hsin-Ying Lee, Chaoyang Wang, Jiaxu Zou, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Jul 17, 2024
•
13
3
IMAGDressing-v1: Vestidor Virtual Personalizable
IMAGDressing-v1: Customizable Virtual Dressing
Fei Shen, Xin Jiang, Xin He, Hu Ye, Cong Wang, Xiaoyu Du, Zechao Li, Jinghui Tang
•
Jul 17, 2024
•
13
2
Pez Dorado: Comprensión Visión-Lenguaje de Videos de Longitud Arbitrariamente Larga
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Kirolos Ataallah, Xiaoqian Shen, Eslam Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny
•
Jul 17, 2024
•
8
2
Case2Code: Aprendizaje de Razonamiento Inductivo con Datos Sintéticos
Case2Code: Learning Inductive Reasoning with Synthetic Data
Yunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan, Xipeng Qiu, Xuanjing Huang, Dahua Lin
•
Jul 17, 2024
•
8
7
Acondicionamiento de Audio para la Generación de Música a través de Características de Cuello de Botella Discretas
Audio Conditioning for Music Generation via Discrete Bottleneck Features
Simon Rouard, Yossi Adi, Jade Copet, Axel Roebel, Alexandre Défossez
•
Jul 17, 2024
•
7
2
Splatfacto-W: Una Implementación de Nerfstudio de Splatting Gaussiano para Colecciones de Fotos No Restringidas
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Congrong Xu, Justin Kerr, Angjoo Kanazawa
•
Jul 17, 2024
•
6
2
ThinkGrasp: Un sistema Visión-Lenguaje para la Agarre Estratégico de Partes en Desorden
ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter
Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
•
Jul 16, 2024
•
5
2
AUITestAgent: Pruebas Automáticas de Funciones de Interfaz Gráfica Orientadas a Requisitos
AUITestAgent: Automatic Requirements Oriented GUI Function Testing
Yongxiang Hu, Xuan Wang, Yingchuan Wang, Yu Zhang, Shiyu Guo, Chaoyi Chen, Xin Wang, Yangfan Zhou
•
Jul 12, 2024
•
5
2
NavGPT-2: Liberando la Capacidad de Razonamiento Navegacional para Modelos de Visión-Lenguaje Grandes
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu
•
Jul 17, 2024
•
4
2
Desaprendizaje Práctico para Modelos de Lenguaje Grandes
Practical Unlearning for Large Language Models
Chongyang Gao, Lixu Wang, Chenkai Weng, Xiao Wang, Qi Zhu
•
Jul 14, 2024
•
4
2
El arte de decir no: Incumplimiento contextual en modelos de lenguaje
The Art of Saying No: Contextual Noncompliance in Language Models
Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi
•
Jul 2, 2024
•
4
2
Transferencia interlingüística sin entrenamiento para la generación de datos sintéticos en la detección de errores gramaticales
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection
Gaetan Lopez Latouche, Marc-André Carbonneau, Ben Swanson
•
Jul 16, 2024
•
2
4
Hacia la comprensión de la generación de videos inseguros.
Towards Understanding Unsafe Video Generation
Yan Pang, Aiping Xiong, Yang Zhang, Tianhao Wang
•
Jul 17, 2024
•
0
2