ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
July 12th, 2024
Skywork-Math: Leyes de Escala de Datos para el Razonamiento Matemático en Modelos de Lenguaje Grandes -- La Historia Continúa
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On
Liang Zeng, Liangjun Zhong, Liang Zhao, Tianwen Wei, Liu Yang, Jujie He, Cheng Cheng, Rui Hu, Yang Liu, Shuicheng Yan, Han Fang, Yahui Zhou
•
Jul 11, 2024
•
53
5
Alineación de Difusión de Video a través de Gradientes de Recompensa
Video Diffusion Alignment via Reward Gradients
Mihir Prabhudesai, Russell Mendonca, Zheyang Qin, Katerina Fragkiadaki, Deepak Pathak
•
Jul 11, 2024
•
51
2
Autoinstrucción Multimodal: Imagen Abstracta Sintética y Razonamiento Visual a través de Modelos de Lenguaje
Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model
Wenqi Zhang, Zhenglin Cheng, Yuanyu He, Mengna Wang, Yongliang Shen, Zeqi Tan, Guiyang Hou, Mingqian He, Yanna Ma, Weiming Lu, Yueting Zhuang
•
Jul 9, 2024
•
47
3
MAVIS: Ajuste de Instrucción Visual Matemática.
MAVIS: Mathematical Visual Instruction Tuning
Renrui Zhang, Xinyu Wei, Dongzhi Jiang, Yichi Zhang, Ziyu Guo, Chengzhuo Tong, Jiaming Liu, Aojun Zhou, Bin Wei, Shanghang Zhang, Peng Gao, Hongsheng Li
•
Jul 11, 2024
•
34
3
Q-GaLore: GaLore cuantizado con proyección INT4 y gradientes de bajo rango adaptativos por capa.
Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients
Zhenyu Zhang, Ajay Jaiswal, Lu Yin, Shiwei Liu, Jiawei Zhao, Yuandong Tian, Zhangyang Wang
•
Jul 11, 2024
•
34
3
MambaVision: Una Espina Dorsal de Visión Híbrida Mamba-Transformer
MambaVision: A Hybrid Mamba-Transformer Vision Backbone
Ali Hatamizadeh, Jan Kautz
•
Jul 10, 2024
•
33
5
Reconocimiento propio en modelos de lenguaje
Self-Recognition in Language Models
Tim R. Davidson, Viacheslav Surkov, Veniamin Veselovsky, Giuseppe Russo, Robert West, Caglar Gulcehre
•
Jul 9, 2024
•
27
2
SEED-Story: Generación de Historias Largas Multimodales con un Gran Modelo de Lenguaje
SEED-Story: Multimodal Long Story Generation with Large Language Model
Shuai Yang, Yuying Ge, Yang Li, Yukang Chen, Yixiao Ge, Ying Shan, Yingcong Chen
•
Jul 11, 2024
•
26
5
¿Tu modelo es realmente un buen razonador matemático? Evaluación del razonamiento matemático con lista de verificación
Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist
Zihao Zhou, Shudong Liu, Maizhen Ning, Wei Liu, Jindong Wang, Derek F. Wong, Xiaowei Huang, Qiufeng Wang, Kaizhu Huang
•
Jul 11, 2024
•
23
4
DenseFusion-1M: Fusion Densa de Expertos en Visión para una Percepción Multimodal Integral
DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception
Xiaotong Li, Fan Zhang, Haiwen Diao, Yueze Wang, Xinlong Wang, Ling-Yu Duan
•
Jul 11, 2024
•
19
2
GTA: Un Referente para Agentes de Herramientas Generales
GTA: A Benchmark for General Tool Agents
Jize Wang, Zerun Ma, Yining Li, Songyang Zhang, Cailian Chen, Kai Chen, Xinyi Le
•
Jul 11, 2024
•
17
3
Síntesis de voz autoregresiva sin cuantización de vectores.
Autoregressive Speech Synthesis without Vector Quantization
Lingwei Meng, Long Zhou, Shujie Liu, Sanyuan Chen, Bing Han, Shujie Hu, Yanqing Liu, Jinyu Li, Sheng Zhao, Xixin Wu, Helen Meng, Furu Wei
•
Jul 11, 2024
•
17
4
La sinergia entre los datos y los modelos de lenguaje grandes multimodales: Un estudio desde la perspectiva de co-desarrollo
The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective
Zhen Qin, Daoyuan Chen, Wenhao Zhang, Liuyi Yao, Yilun Huang, Bolin Ding, Yaliang Li, Shuiguang Deng
•
Jul 11, 2024
•
13
4
Aprendizaje por Refuerzo con Reforzamiento de Gradiente
Gradient Boosting Reinforcement Learning
Benjamin Fuhrer, Chen Tessler, Gal Dalal
•
Jul 11, 2024
•
13
2
Live2Diff: Traducción en tiempo real de transmisiones en vivo a través de Atención Uni-direccional en Modelos de Difusión de Video
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models
Zhening Xing, Gereon Fox, Yanhong Zeng, Xingang Pan, Mohamed Elgharib, Christian Theobalt, Kai Chen
•
Jul 11, 2024
•
12
2
Modelado Implícito Generalizable para la Interpolación de Fotogramas de Video
Generalizable Implicit Motion Modeling for Video Frame Interpolation
Zujin Guo, Wei Li, Chen Change Loy
•
Jul 11, 2024
•
12
2
Mapeo en cualquier lugar (MIA): Potenciando el mapeo de vista aérea utilizando Datos Públicos a Gran Escala
Map It Anywhere (MIA): Empowering Bird's Eye View Mapping using Large-scale Public Data
Cherie Ho, Jiaye Zou, Omar Alama, Sai Mitheran Jagadesh Kumar, Benjamin Chiang, Taneesh Gupta, Chen Wang, Nikhil Keetha, Katia Sycara, Sebastian Scherer
•
Jul 11, 2024
•
11
4
Hacia la construcción de una IA generalista especializada con la fusión de Sistema 1 y Sistema 2.
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion
Kaiyan Zhang, Biqing Qi, Bowen Zhou
•
Jul 11, 2024
•
11
2
Gaussianes Salvajes: Splatting Gaussiano en 3D en la Naturaleza
WildGaussians: 3D Gaussian Splatting in the Wild
Jonas Kulhanek, Songyou Peng, Zuzana Kukelova, Marc Pollefeys, Torsten Sattler
•
Jul 11, 2024
•
10
2
OmniNOCS: Un conjunto de datos y modelo NOCS unificado para la elevación tridimensional de objetos en 2D
OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects
Akshay Krishnan, Abhijit Kundu, Kevis-Kokitsi Maninis, James Hays, Matthew Brown
•
Jul 11, 2024
•
9
2
Escalando la Evaluación Estética Personalizada a través de la Personalización del Vector de Tareas
Scaling Up Personalized Aesthetic Assessment via Task Vector Customization
Jooyeol Yun, Jaegul Choo
•
Jul 9, 2024
•
6
3