ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
September 4th, 2024
RecetaLarga: Receta para la Generalización Eficiente de Contextos Largos en Modelos de Lenguaje Grandes
LongRecipe: Recipe for Efficient Long Context Generalization in Large Languge Models
Zhiyuan Hu, Yuliang Liu, Jinman Zhao, Suyuchen Wang, Yan Wang, Wei Shen, Qing Gu, Anh Tuan Luu, See-Kiong Ng, Zhiwei Jiang, Bryan Hooi
•
Aug 31, 2024
•
42
2
OD-VAE: Un Compresor de Video Omnidimensional para Mejorar el Modelo de Difusión de Video Latente.
OD-VAE: An Omni-dimensional Video Compressor for Improving Latent Video Diffusion Model
Liuhan Chen, Zongjian Li, Bin Lin, Bin Zhu, Qian Wang, Shenghai Yuan, Xing Zhou, Xinghua Cheng, Li Yuan
•
Sep 2, 2024
•
14
2
DepthCrafter: Generando Secuencias Largas de Profundidad Consistentes para Videos de Mundo Abierto
DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos
Wenbo Hu, Xiangjun Gao, Xiaoyu Li, Sijie Zhao, Xiaodong Cun, Yong Zhang, Long Quan, Ying Shan
•
Sep 3, 2024
•
37
3
Seguir-Tu-Lienzo: Generación de Contenido Extensivo para Rellenar Videos de Alta Resolución
Follow-Your-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation
Qihua Chen, Yue Ma, Hongfa Wang, Junkun Yuan, Wenzhe Zhao, Qi Tian, Hongmei Wang, Shaobo Min, Qifeng Chen, Wei Liu
•
Sep 2, 2024
•
6
2
Generación de Video Consciente en 3D de forma Composicional con Director LLM
Compositional 3D-aware Video Generation with LLM Director
Hanxin Zhu, Tianyu He, Anni Tang, Junliang Guo, Zhibo Chen, Jiang Bian
•
Aug 31, 2024
•
15
2
VideoLLaMB: Comprensión de video de largo contexto con Memoria Recurrente Bridges
VideoLLaMB: Long-context Video Understanding with Recurrent Memory Bridges
Yuxuan Wang, Cihang Xie, Yang Liu, Zilong Zheng
•
Sep 2, 2024
•
28
6
Compresión precisa de modelos de difusión de texto a imagen mediante cuantización de vectores.
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization
Vage Egiazarian, Denis Kuznedelev, Anton Voronov, Ruslan Svirschevski, Michael Goin, Daniil Pavlov, Dan Alistarh, Dmitry Baranchuk
•
Aug 31, 2024
•
11
2
OLMoE: Modelos de Lenguaje de Mezcla de Expertos Abiertos
OLMoE: Open Mixture-of-Experts Language Models
Niklas Muennighoff, Luca Soldaini, Dirk Groeneveld, Kyle Lo, Jacob Morrison, Sewon Min, Weijia Shi, Pete Walsh, Oyvind Tafjord, Nathan Lambert, Yuling Gu, Shane Arora, Akshita Bhagia, Dustin Schwenk, David Wadden, Alexander Wettig, Binyuan Hui, Tim Dettmers, Douwe Kiela, Ali Farhadi, Noah A. Smith, Pang Wei Koh, Amanpreet Singh, Hannaneh Hajishirzi
•
Sep 3, 2024
•
80
4
LinFusion: 1 GPU, 1 Minuto, Imagen de 16K
LinFusion: 1 GPU, 1 Minute, 16K Image
Songhua Liu, Weihao Yu, Zhenxiong Tan, Xinchao Wang
•
Sep 3, 2024
•
35
4
Kvasir-VQA: Un conjunto de datos de pares de texto e imagen del tracto gastrointestinal.
Kvasir-VQA: A Text-Image Pair GI Tract Dataset
Sushant Gautam, Andrea Storås, Cise Midoglu, Steven A. Hicks, Vajira Thambawita, Pål Halvorsen, Michael A. Riegler
•
Sep 2, 2024
•
72
2
Optimización de Políticas de Difusión
Diffusion Policy Policy Optimization
Allen Z. Ren, Justin Lidard, Lars L. Ankile, Anthony Simeonov, Pulkit Agrawal, Anirudha Majumdar, Benjamin Burchfiel, Hongkai Dai, Max Simchowitz
•
Sep 1, 2024
•
21
2
Red de Voz con Atención Adaptativa Densa: Mejorando la Comprensión de Características para Trastornos de Salud Mental
Density Adaptive Attention-based Speech Network: Enhancing Feature Understanding for Mental Health Disorders
Georgios Ioannides, Adrian Kieback, Aman Chadha, Aaron Elkins
•
Aug 31, 2024
•
4
3
PrivacyLens: Evaluando la Conciencia de Normas de Privacidad de Modelos de Lenguaje en Acción
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action
Yijia Shao, Tianshi Li, Weiyan Shi, Yanchen Liu, Diyi Yang
•
Aug 29, 2024
•
1
2
ContextoCita: Atribuir la Generación del Modelo al Contexto
ContextCite: Attributing Model Generation to Context
Benjamin Cohen-Wang, Harshay Shah, Kristian Georgiev, Aleksander Madry
•
Sep 1, 2024
•
14
3
GenAgent: Construcción de Sistemas de IA Colaborativos con Flujo de Trabajo Automatizado - Generación de Casos de Estudio sobre ComfyUI
GenAgent: Build Collaborative AI Systems with Automated Workflow Generation -- Case Studies on ComfyUI
Xiangyuan Xue, Zeyu Lu, Di Huang, Wanli Ouyang, Lei Bai
•
Sep 2, 2024
•
9
3
Saber cuándo fusionar: Investigando la recuperación híbrida en idiomas no ingleses en el ámbito legal.
Know When to Fuse: Investigating Non-English Hybrid Retrieval in the Legal Domain
Antoine Louis, Gijs van Dijck, Gerasimos Spanakis
•
Sep 2, 2024
•
3
2
Teoría general de OCR: Hacia OCR-2.0 a través de un Modelo Unificado de Extremo a Extremo
General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model
Haoran Wei, Chenglong Liu, Jinyue Chen, Jia Wang, Lingyu Kong, Yanming Xu, Zheng Ge, Liang Zhao, Jianjian Sun, Yuang Peng, Chunrui Han, Xiangyu Zhang
•
Sep 3, 2024
•
85
9
FLUX que Reproduce Música
FLUX that Plays Music
Zhengcong Fei, Mingyuan Fan, Changqian Yu, Junshi Huang
•
Sep 1, 2024
•
34
2
El conjunto de datos MERIT: Modelado y Renderizado Eficiente de Transcripciones Interpretables
The MERIT Dataset: Modelling and Efficiently Rendering Interpretable Transcripts
I. de Rodrigo, A. Sanchez-Cuadrado, J. Boal, A. J. Lopez-Lopez
•
Aug 31, 2024
•
2
2