ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
November 27th, 2024
TEXGen: un Modelo Generativo de Difusión para Texturas de Malla
TEXGen: a Generative Diffusion Model for Mesh Textures
Xin Yu, Ze Yuan, Yuan-Chen Guo, Ying-Tian Liu, JianHui Liu, Yangguang Li, Yan-Pei Cao, Ding Liang, Xiaojuan Qi
•
Nov 22, 2024
•
12
2
Prueba de Turing de Contador Visual (VCT^2): Descubriendo los Desafíos para la Detección de Imágenes Generadas por IA e Introduciendo el Índice de IA Visual (V_AI)
Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI)
Nasrin Imanpour, Shashwat Bajpai, Subhankar Ghosh, Sainath Reddy Sankepally, Abhilekh Borah, Hasnat Md Abdullah, Nishoak Kosaraju, Shreyas Dixit, Ashhar Aziz, Shwetangshu Biswas, Vinija Jain, Aman Chadha, Amit Sheth, Amitava Das
•
Nov 24, 2024
•
4
2
DreamMix: Desacoplar Atributos de Objetos para Mejorar la Editabilidad en Reparación de Imágenes Personalizadas
DreamMix: Decoupling Object Attributes for Enhanced Editability in Customized Image Inpainting
Yicheng Yang, Pengxiang Li, Lu Zhang, Liqian Ma, Ping Hu, Siyu Du, Yunzhi Zhuge, Xu Jia, Huchuan Lu
•
Nov 26, 2024
•
5
3
Atención Estelar: Inferencia Eficiente de LLM sobre Secuencias Largas
Star Attention: Efficient LLM Inference over Long Sequences
Shantanu Acharya, Fei Jia, Boris Ginsburg
•
Nov 26, 2024
•
38
2
SketchAgent: Generación de Bocetos Secuenciales Dirigida por Lenguaje
SketchAgent: Language-Driven Sequential Sketch Generation
Yael Vinker, Tamar Rott Shaham, Kristine Zheng, Alex Zhao, Judith E Fan, Antonio Torralba
•
Nov 26, 2024
•
19
4
Aprendizaje de Representaciones 3D a partir de Programas 3D Procedurales
Learning 3D Representations from Procedural 3D Programs
Xuweiyi Chen, Zezhou Cheng
•
Nov 25, 2024
•
9
2
Generación de Imágenes Humanas Controlables con Prendas Múltiples Personalizadas
Controllable Human Image Generation with Personalized Multi-Garments
Yisol Choi, Sangkyung Kwak, Sihyun Yu, Hyungwon Choi, Jinwoo Shin
•
Nov 25, 2024
•
4
2
ShowUI: Un Modelo de Visión-Lenguaje-Acción para Agente Visual de Interfaz Gráfica de Usuario
ShowUI: One Vision-Language-Action Model for GUI Visual Agent
Kevin Qinghong Lin, Linjie Li, Difei Gao, Zhengyuan Yang, Shiwei Wu, Zechen Bai, Weixian Lei, Lijuan Wang, Mike Zheng Shou
•
Nov 26, 2024
•
87
3
La cuantificación de bajo bit favorece a los LLMs subentrenados: Leyes de escala para LLMs cuantificados con 100T tokens de entrenamiento.
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens
Xu Ouyang, Tao Ge, Thomas Hartvigsen, Zhisong Zhang, Haitao Mi, Dong Yu
•
Nov 26, 2024
•
13
5
VLRewardBench: Un desafiante banco de pruebas para modelos generativos de recompensa visión-lenguaje
VLRewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models
Lei Li, Yuancheng Wei, Zhihui Xie, Xuqing Yang, Yifan Song, Peiyi Wang, Chenxin An, Tianyu Liu, Sujian Li, Bill Yuchen Lin, Lingpeng Kong, Qi Liu
•
Nov 26, 2024
•
11
2
SALOVA: Asistente de Video Largo con Segmentos para Recuperación Dirigida y Enrutamiento en el Análisis de Videos de Formato Largo
SALOVA: Segment-Augmented Long Video Assistant for Targeted Retrieval and Routing in Long-Form Video Analysis
Junho Kim, Hyunjun Kim, Hosu Lee, Yong Man Ro
•
Nov 25, 2024
•
10
2
EfficientViM: Visión Eficiente Mamba con Mezclador de Estado Oculto basado en la Dualidad del Espacio de Estados.
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality
Sanghyeok Lee, Joonmyung Choi, Hyunwoo J. Kim
•
Nov 22, 2024
•
6
2
Reconsideración de la Reducción de Tokens en MLLMs: Hacia un Paradigma Unificado para Aceleración sin Entrenamiento.
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration
Yuhang Han, Xuyang Liu, Pengxiang Ding, Donglin Wang, Honggang Chen, Qingsen Yan, Siteng Huang
•
Nov 26, 2024
•
21
2
Vías en el Manifold de Imágenes: Edición de Imágenes a través de Generación de Video
Pathways on the Image Manifold: Image Editing via Video Generation
Noam Rotstein, Gal Yona, Daniel Silver, Roy Velich, David Bensaïd, Ron Kimmel
•
Nov 25, 2024
•
37
2
AnchorCrafter: Animar CiberAnclas Vendiendo Tus Productos a través de la Generación de Videos de Interacción Humano-Objeto
AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation
Ziyi Xu, Ziyao Huang, Juan Cao, Yong Zhang, Xiaodong Cun, Qing Shuai, Yuchen Wang, Linchao Bao, Jintao Li, Fan Tang
•
Nov 26, 2024
•
7
2
FINECAPTION: Generación de subtítulos de imágenes composicionales enfocándose en donde desee en cualquier nivel de granularidad
FINECAPTION: Compositional Image Captioning Focusing on Wherever You Want at Any Granularity
Hang Hua, Qing Liu, Lingzhi Zhang, Jing Shi, Zhifei Zhang, Yilin Wang, Jianming Zhang, Jiebo Luo
•
Nov 23, 2024
•
8
2
MolReFlect: Hacia alineamientos detallados en contexto entre moléculas y textos
MolReFlect: Towards In-Context Fine-grained Alignments between Molecules and Texts
Jiatong Li, Yunqing Liu, Wei Liu, Jingdi Le, Di Zhang, Wenqi Fan, Dongzhan Zhou, Yuqiang Li, Qing Li
•
Nov 22, 2024
•
5
2
MME-Survey: Un Estudio Exhaustivo sobre la Evaluación de Modelos de Lenguaje Multimodales
MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs
Chaoyou Fu, Yi-Fan Zhang, Shukang Yin, Bo Li, Xinyu Fang, Sirui Zhao, Haodong Duan, Xing Sun, Ziwei Liu, Liang Wang, Caifeng Shan, Ran He
•
Nov 22, 2024
•
22
2
SAR3D: Generación y comprensión autoregresiva de objetos 3D a través de VQVAE 3D multinivel
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE
Yongwei Chen, Yushi Lan, Shangchen Zhou, Tengfei Wang, XIngang Pan
•
Nov 25, 2024
•
13
2