ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
December 10th, 2024
Desentrañando la Complejidad de la Memoria en Agentes de RL: un Enfoque para Clasificación y Evaluación
Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation
Egor Cherepanov, Nikita Kachaev, Artem Zholus, Alexey K. Kovalev, Aleksandr I. Panov
•
Dec 9, 2024
•
73
2
OmniDocBench: Evaluación de Análisis de Documentos PDF Diversos con Anotaciones Exhaustivas
OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations
Linke Ouyang, Yuan Qu, Hongbin Zhou, Jiawei Zhu, Rui Zhang, Qunshu Lin, Bin Wang, Zhiyuan Zhao, Man Jiang, Xiaomeng Zhao, Jin Shi, Fan Wu, Pei Chu, Minghao Liu, Zhenxiang Li, Chao Xu, Bo Zhang, Botian Shi, Zhongying Tu, Conghui He
•
Dec 10, 2024
•
11
1
Divot: Difusión potencia el tokenizador de video para comprensión y generación
Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation
Yuying Ge, Yizhuo Li, Yixiao Ge, Ying Shan
•
Dec 5, 2024
•
16
2
MAtCha Gaussians: Atlas de Gráficos para Geometría de Alta Calidad y Fotorealismo a partir de Vistas Escasas
MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views
Antoine Guédon, Tomoki Ichikawa, Kohei Yamashita, Ko Nishino
•
Dec 9, 2024
•
7
2
ProcessBench: Identificación de Errores en el Proceso en el Razonamiento Matemático
ProcessBench: Identifying Process Errors in Mathematical Reasoning
Chujie Zheng, Zhenru Zhang, Beichen Zhang, Runji Lin, Keming Lu, Bowen Yu, Dayiheng Liu, Jingren Zhou, Junyang Lin
•
Dec 9, 2024
•
83
6
Lo ves, lo obtienes: Aprendizaje de Creación 3D en Videos sin Poses a Escala
You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale
Baorui Ma, Huachen Gao, Haoge Deng, Zhengxiong Luo, Tiejun Huang, Lulu Tang, Xinlong Wang
•
Dec 9, 2024
•
13
3
Entrenamiento de Modelos de Lenguaje Grandes para Razonar en un Espacio Latente Continuo
Training Large Language Models to Reason in a Continuous Latent Space
Shibo Hao, Sainbayar Sukhbaatar, DiJia Su, Xian Li, Zhiting Hu, Jason Weston, Yuandong Tian
•
Dec 9, 2024
•
85
7
Incrustaciones Globales y Densas de la Tierra: Major TOM Flotando en el Espacio Latente
Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space
Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
•
Dec 7, 2024
•
8
2
Alrededor del Mundo en 80 Pasos de Tiempo: Un Enfoque Generativo para la Geolocalización Visual Global
Around the World in 80 Timesteps: A Generative Approach to Global Visual Geolocation
Nicolas Dufour, David Picard, Vicky Kalogeiton, Loic Landrieu
•
Dec 9, 2024
•
21
2
Marca de agua de texto robusta de varios bits con parafraseadores basados en LLM.
Robust Multi-bit Text Watermark with LLM-based Paraphrasers
Xiaojun Xu, Jinghan Jia, Yuanshun Yao, Yang Liu, Hang Li
•
Dec 4, 2024
•
6
2
Si no puedes usarlos, recíclalos: Optimización de la fusión a escala para mitigar compensaciones de rendimiento
If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs
Muhammad Khalifa, Yi-Chern Tan, Arash Ahmadian, Tom Hosking, Honglak Lee, Lu Wang, Ahmet Üstün, Tom Sherborne, Matthias Gallé
•
Dec 5, 2024
•
5
2
Explorando Anotaciones de Conceptos Multiescalares para Modelos de Lenguaje Multimodales Grandes
Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models
Xiao Xu, Tianhao Niu, Yuxi Xie, Libo Qin, Wanxiang Che, Min-Yen Kan
•
Dec 8, 2024
•
16
2
CARP: Aprendizaje de Políticas Visuomotoras a través de Predicción Autoregresiva de Grueso a Fino
CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction
Zhefei Gong, Pengxiang Ding, Shangke Lyu, Siteng Huang, Mingyang Sun, Wei Zhao, Zhaoxin Fan, Donglin Wang
•
Dec 9, 2024
•
7
2
Maya: Un Modelo Multilingüe Multimodal Ajustado mediante Instrucciones
Maya: An Instruction Finetuned Multilingual Multimodal Model
Nahid Alam, Karthik Reddy Kanjula, Surya Guthikonda, Timothy Chung, Bala Krishna S Vegesna, Abhipsha Das, Anthony Susevski, Ryan Sze-Yin Chan, S M Iftekhar Uddin, Shayekh Bin Islam, Roshan Santhosh, Snegha A, Drishti Sharma, Chen Liu, Isha Chaturvedi, Genta Indra Winata, Ashvanth. S, Snehanshu Mukherjee, Alham Fikri Aji
•
Dec 10, 2024
•
29
2
MotionShop: Transferencia de Movimiento sin Entrenamiento en Modelos de Difusión de Video con Mezcla de Guía de Puntuación
MotionShop: Zero-Shot Motion Transfer in Video Diffusion Models with Mixture of Score Guidance
Hidir Yesiltepe, Tuna Han Salih Meral, Connor Dunlop, Pinar Yanardag
•
Dec 6, 2024
•
9
2
Turbo3D: Generación ultrarrápida de texto a 3D
Turbo3D: Ultra-fast Text-to-3D Generation
Hanzhe Hu, Tianwei Yin, Fujun Luan, Yiwei Hu, Hao Tan, Zexiang Xu, Sai Bi, Shubham Tulsiani, Kai Zhang
•
Dec 5, 2024
•
4
2
Redes Delta con compuertas: Mejorando Mamba2 con la Regla Delta
Gated Delta Networks: Improving Mamba2 with Delta Rule
Songlin Yang, Jan Kautz, Ali Hatamizadeh
•
Dec 9, 2024
•
11
3