ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 16th, 2024
Aprende tu modelo de referencia para una alineación verdaderamente efectiva
Learn Your Reference Model for Real Good Alignment
Alexey Gorbatovski, Boris Shaposhnikov, Alexey Malakhov, Nikita Surnachev, Yaroslav Aksenov, Ian Maksimov, Nikita Balagansky, Daniil Gavrilov
•
Apr 15, 2024
•
87
0
Megalodon: Pretrenamiento e Inferencia Eficiente de Modelos de Lenguaje con Longitud de Contexto Ilimitada
Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length
Xuezhe Ma, Xiaomeng Yang, Wenhan Xiong, Beidi Chen, Lili Yu, Hao Zhang, Jonathan May, Luke Zettlemoyer, Omer Levy, Chunting Zhou
•
Apr 12, 2024
•
68
2
TransformerFAM: La atención por retroalimentación es memoria de trabajo
TransformerFAM: Feedback attention is working memory
Dongseong Hwang, Weiran Wang, Zhuoyuan Huo, Khe Chai Sim, Pedro Moreno Mengibar
•
Apr 14, 2024
•
44
0
Video2Game: Entorno en tiempo real, interactivo, realista y compatible con navegadores a partir de un único vídeo
Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video
Hongchi Xia, Zhi-Hao Lin, Wei-Chiu Ma, Shenlong Wang
•
Apr 15, 2024
•
31
2
La compresión representa la inteligencia de manera lineal
Compression Represents Intelligence Linearly
Yuzhen Huang, Jinghan Zhang, Zifei Shan, Junxian He
•
Apr 15, 2024
•
28
1
Ctrl-Adapter: Un Marco Eficiente y Versátil para Adaptar Diversos Controles a Cualquier Modelo de Difusión
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model
Han Lin, Jaemin Cho, Abhay Zala, Mohit Bansal
•
Apr 15, 2024
•
22
0
HQ-Edit: Un conjunto de datos de alta calidad para la edición de imágenes basada en instrucciones
HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing
Mude Hui, Siwei Yang, Bingchen Zhao, Yichun Shi, Heng Wang, Peng Wang, Yuyin Zhou, Cihang Xie
•
Apr 15, 2024
•
13
0
Sobre la Decodificación Especulativa para Modelos de Lenguaje Multimodales de Gran Escala
On Speculative Decoding for Multimodal Large Language Models
Mukul Gagrani, Raghavv Goel, Wonseok Jeon, Junyoung Park, Mingu Lee, Christopher Lott
•
Apr 13, 2024
•
13
2
Tango 2: Alineación de generaciones de texto a audio basadas en difusión mediante optimización directa de preferencias
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization
Navonil Majumder, Chia-Yu Hung, Deepanway Ghosal, Wei-Ning Hsu, Rada Mihalcea, Soujanya Poria
•
Apr 15, 2024
•
12
0
TextHawk: Explorando la percepción eficiente de grano fino en modelos de lenguaje multimodal de gran escala
TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models
Ya-Qi Yu, Minghui Liao, Jihao Wu, Yongxin Liao, Xiaoyu Zheng, Wei Zeng
•
Apr 14, 2024
•
11
0
Domesticación del Modelo de Difusión Latente para la Restauración de Campos de Radiancia Neural
Taming Latent Diffusion Model for Neural Radiance Field Inpainting
Chieh Hubert Lin, Changil Kim, Jia-Bin Huang, Qinbo Li, Chih-Yao Ma, Johannes Kopf, Ming-Hsuan Yang, Hung-Yu Tseng
•
Apr 15, 2024
•
7
0
CompGS: Representación Eficiente de Escenas 3D mediante Splatting Gaussiano Comprimido
CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting
Xiangrui Liu, Xinju Wu, Pingping Zhang, Shiqi Wang, Zhu Li, Sam Kwong
•
Apr 15, 2024
•
7
0