ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
December 17th, 2024
SplineGS: Spline Robusto Adaptativo al Movimiento para Gaussiana 3D Dinámica en Tiempo Real a partir de Video Monocular
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello, Jaeho Moon, Jihyong Oh, Munchurl Kim
•
Dec 13, 2024
•
7
3
Whisper-GPT: Un Modelo de Lenguaje Grande de Representación Híbrida de Audio
Whisper-GPT: A Hybrid Representation Audio Large Language Model
Prateek Verma
•
Dec 16, 2024
•
4
2
MaxInfoRL: Impulsando la exploración en aprendizaje por refuerzo a través de la maximización de la ganancia de información
MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximization
Bhavya Sukhija, Stelian Coros, Andreas Krause, Pieter Abbeel, Carmelo Sferrazza
•
Dec 16, 2024
•
5
2
IDArb: Descomposición Intrínseca para un Número Arbitrario de Vistas de Entrada e Iluminaciones
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations
Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin
•
Dec 16, 2024
•
12
2
Transformadores de Difusión Causal para Modelado Generativo
Causal Diffusion Transformers for Generative Modeling
Chaorui Deng, Deyao Zh, Kunchang Li, Shi Guan, Haoqi Fan
•
Dec 16, 2024
•
23
3
Los modelos de lenguaje más pequeños son mejores evolucionadores de instrucciones.
Smaller Language Models Are Better Instruction Evolvers
Tingfeng Hui, Lulu Zhao, Guanting Dong, Yaqi Zhang, Hua Zhou, Sen Su
•
Dec 15, 2024
•
29
2
SPaR: Autojuego con Refinamiento de Búsqueda en Árbol para Mejorar el Seguimiento de Instrucciones en Modelos de Lenguaje Grandes
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models
Jiale Cheng, Xiao Liu, Cunxiang Wang, Xiaotao Gu, Yida Lu, Dan Zhang, Yuxiao Dong, Jie Tang, Hongning Wang, Minlie Huang
•
Dec 16, 2024
•
18
2
VividFace: Un Marco Híbrido Basado en Difusión para el Intercambio de Caras en Video de Alta Fidelidad
VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping
Hao Shao, Shulun Wang, Yang Zhou, Guanglu Song, Dailan He, Shuo Qin, Zhuofan Zong, Bingqi Ma, Yu Liu, Hongsheng Li
•
Dec 15, 2024
•
12
2
Propiedad Gaussiana: Integración de Propiedades Físicas en Gaussianas 3D con LMMs
GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs
Xinli Xu, Wenhang Ge, Dicong Qiu, ZhiFei Chen, Dongyu Yan, Zhuoyun Liu, Haoyu Zhao, Hanfeng Zhao, Shunsi Zhang, Junwei Liang, Ying-Cong Chen
•
Dec 15, 2024
•
13
2
Una simple transformación es suficiente para la protección de datos en el Aprendizaje Federado Vertical.
Just a Simple Transformation is Enough for Data Protection in Vertical Federated Learning
Andrei Semenov, Philip Zmushko, Alexander Pichugin, Aleksandr Beznosikov
•
Dec 16, 2024
•
2
2
MOVIS: Mejorando la Síntesis de Vistas Nuevas de Múltiples Objetos para Escenas Interiores
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes
Ruijie Lu, Yixin Chen, Junfeng Ni, Baoxiong Jia, Yu Liu, Diwen Wan, Gang Zeng, Siyuan Huang
•
Dec 16, 2024
•
6
2
Matrices Maravillosas: Combinándose para una Arquitectura de Modelo Base más Eficiente y Efectiva
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture
Jingze Shi, Bingheng Wu
•
Dec 16, 2024
•
8
2
Agente de Evaluación: Marco de Evaluación Eficiente y Promptable para Modelos Generativos Visuales
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models
Fan Zhang, Shulin Tian, Ziqi Huang, Yu Qiao, Ziwei Liu
•
Dec 10, 2024
•
37
2
DynamicScaler: Generación de Video Fluida y Escalable para Escenas Panorámicas
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes
Jinxiu Liu, Shaoheng Lin, Yinxiao Li, Ming-Hsuan Yang
•
Dec 15, 2024
•
7
2
TidyBot++: Un Manipulador Móvil Holonómico de Código Abierto para el Aprendizaje de Robots
TidyBot++: An Open-Source Holonomic Mobile Manipulator for Robot Learning
Jimmy Wu, William Chong, Robert Holmberg, Aaditya Prasad, Yihuai Gao, Oussama Khatib, Shuran Song, Szymon Rusinkiewicz, Jeannette Bohg
•
Dec 11, 2024
•
5
2
RLDG: Destilación de Políticas Robóticas Generalistas a través del Aprendizaje por Refuerzo
RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning
Charles Xu, Qiyang Li, Jianlan Luo, Sergey Levine
•
Dec 13, 2024
•
1
2
Tablas de clasificación confiables, reproducibles y realmente rápidas con Evalica.
Reliable, Reproducible, and Really Fast Leaderboards with Evalica
Dmitry Ustalov
•
Dec 15, 2024
•
2
2
Emma-X: Un modelo de acción multimodal encarnado con una cadena fundamentada de pensamiento y razonamiento espacial de anticipación.
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning
Qi Sun, Pengfei Hong, Tej Deep Pala, Vernon Toh, U-Xuan Tan, Deepanway Ghosal, Soujanya Poria
•
Dec 16, 2024
•
9
2
StrandHead: Texto a Avatares de Cabeza 3D Desenredados en Hebras Utilizando Priors Geométricos del Cabello
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors
Xiaokun Sun, Zeyu Cai, Zhenyu Zhang, Ying Tai, Jian Yang
•
Dec 16, 2024
•
11
2
Protección casi gratuita contra la imitación mediante modelos de difusión personalizados
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models
Namhyuk Ahn, KiYoon Yoo, Wonhyuk Ahn, Daesik Kim, Seung-Hun Nam
•
Dec 16, 2024
•
2
2
La Ventaja del Código Abierto en Modelos de Lenguaje de Gran Escala (LLMs)
The Open Source Advantage in Large Language Models (LLMs)
Jiya Manchanda, Laura Boettcher, Matheus Westphalen, Jasser Jasser
•
Dec 16, 2024
•
10
2
Wonderland: Navegación en Escenas 3D a partir de una Única Imagen
Wonderland: Navigating 3D Scenes from a Single Image
Hanwen Liang, Junli Cao, Vidit Goel, Guocheng Qian, Sergei Korolev, Demetri Terzopoulos, Konstantinos N. Plataniotis, Sergey Tulyakov, Jian Ren
•
Dec 16, 2024
•
16
2
BrushEdit: Edición e Inpainting de Imágenes Todo en Uno
BrushEdit: All-In-One Image Inpainting and Editing
Yaowei Li, Yuxuan Bian, Xuan Ju, Zhaoyang Zhang, Ying Shan, Qiang Xu
•
Dec 13, 2024
•
35
3
ColorFlow: Colorización de secuencias de imágenes mejorada con recuperación.
ColorFlow: Retrieval-Augmented Image Sequence Colorization
Junhao Zhuang, Xuan Ju, Zhaoyang Zhang, Yong Liu, Shiyi Zhang, Chun Yuan, Ying Shan
•
Dec 16, 2024
•
26
4
Transformador Latente de Bytes: Los Parches Escalan Mejor que los Tokens
Byte Latent Transformer: Patches Scale Better Than Tokens
Artidoro Pagnoni, Ram Pasunuru, Pedro Rodriguez, John Nguyen, Benjamin Muller, Margaret Li, Chunting Zhou, Lili Yu, Jason Weston, Luke Zettlemoyer, Gargi Ghosh, Mike Lewis, Ari Holtzman, Srinivasan Iyer
•
Dec 13, 2024
•
102
8
GeoX: Resolución de Problemas Geométricos a Través del Preentrenamiento Unificado Formalizado de Visión-Lenguaje
GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training
Renqiu Xia, Mingsheng Li, Hancheng Ye, Wenjie Wu, Hongbin Zhou, Jiakang Yuan, Tianshuo Peng, Xinyu Cai, Xiangchao Yan, Bin Wang, Conghui He, Botian Shi, Tao Chen, Junchi Yan, Bo Zhang
•
Dec 16, 2024
•
4
2
SepLLM: Acelerar Modelos de Lenguaje Grandes Comprimiendo un Segmento en un Separador
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator
Guoxuan Chen, Han Shi, Jiawei Li, Yihang Gao, Xiaozhe Ren, Yimeng Chen, Xin Jiang, Zhenguo Li, Weiyang Liu, Chao Huang
•
Dec 16, 2024
•
11
5
RetroLLM: Potenciando Modelos de Lenguaje Grandes para Recuperar Evidencia Detallada dentro de la Generación
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yongkang Wu, Zhonghua Li, Qi Ye, Zhicheng Dou
•
Dec 16, 2024
•
37
4