ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 17th, 2025
Informe Técnico de BitNet b1.58 2B4T
BitNet b1.58 2B4T Technical Report
Shuming Ma, Hongyu Wang, Shaohan Huang, Xingxing Zhang, Ying Hu, Ting Song, Yan Xia, Furu Wei
•
Apr 16, 2025
•
68
2
ReTool: Aprendizaje por Refuerzo para el Uso Estratégico de Herramientas en Modelos de Lenguaje de Gran Escala
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs
Jiazhan Feng, Shijue Huang, Xingwei Qu, Ge Zhang, Yujia Qin, Baoquan Zhong, Chengquan Jiang, Jinxin Chi, Wanjun Zhong
•
Apr 15, 2025
•
60
4
ColorBench: ¿Pueden los modelos de lenguaje visual ver y comprender el mundo colorido? Un punto de referencia integral para la percepción del color, el razonamiento y la robustez.
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness
Yijun Liang, Ming Li, Chenrui Fan, Ziyue Li, Dang Nguyen, Kwesi Cobbina, Shweta Bhardwaj, Jiuhai Chen, Fuxiao Liu, Tianyi Zhou
•
Apr 10, 2025
•
45
4
¿SFT o RL? Una investigación temprana sobre el entrenamiento de modelos grandes de lenguaje y visión con razonamiento similar a R1
SFT or RL? An Early Investigation into Training R1-Like Reasoning Large Vision-Language Models
Hardy Chen, Haoqin Tu, Fali Wang, Hui Liu, Xianfeng Tang, Xinya Du, Yuyin Zhou, Cihang Xie
•
Apr 10, 2025
•
28
2
Cobra: Colorización Eficiente de Arte Lineal con Referencias Más Amplias
Cobra: Efficient Line Art COlorization with BRoAder References
Junhao Zhuang, Lingen Li, Xuan Ju, Zhaoyang Zhang, Chun Yuan, Ying Shan
•
Apr 16, 2025
•
27
2
AlayaDB: La base de datos para una inferencia eficiente y efectiva en LLM de contexto largo
AlayaDB: The Data Foundation for Efficient and Effective Long-context LLM Inference
Yangshen Deng, Zhengxin You, Long Xiang, Qilong Li, Peiqi Yuan, Zhaoyang Hong, Yitao Zheng, Wanting Li, Runzhong Li, Haotian Liu, Kyriakos Mouratidis, Man Lung Yiu, Huan Li, Qiaomu Shen, Rui Mao, Bo Tang
•
Apr 14, 2025
•
25
3
REPA-E: Desbloqueando VAE para ajuste de extremo a extremo con difusión latente en Transformers
REPA-E: Unlocking VAE for End-to-End Tuning with Latent Diffusion Transformers
Xingjian Leng, Jaskirat Singh, Yunzhong Hou, Zhenchang Xing, Saining Xie, Liang Zheng
•
Apr 14, 2025
•
20
2
MLRC-Bench: ¿Pueden los agentes de lenguaje resolver los desafíos de investigación en aprendizaje automático?
MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges?
Yunxiang Zhang, Muhammad Khalifa, Shitanshu Bhushan, Grant D Murphy, Lajanugen Logeswaran, Jaekyeom Kim, Moontae Lee, Honglak Lee, Lu Wang
•
Apr 13, 2025
•
17
2
SIFT-50M: Un conjunto de datos multilingüe a gran escala para el ajuste fino de instrucciones de voz
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
Prabhat Pandey, Rupak Vignesh Swaminathan, K V Vijay Girish, Arunasish Sen, Jian Xie, Grant P. Strimel, Andreas Schwarz
•
Apr 12, 2025
•
17
2
Detección robusta y de grano fino de textos generados por IA
Robust and Fine-Grained Detection of AI Generated Texts
Ram Mohan Rao Kadiyala, Siddartha Pullakhandam, Kanwal Mehreen, Drishti Sharma, Siddhant Gupta, Jebish Purbey, Ashay Srivastava, Subhasya TippaReddy, Arvind Reddy Bobbili, Suraj Telugara Chandrashekhar, Modabbir Adeeb, Srinadh Vura, Hamza Farooq
•
Apr 16, 2025
•
11
2
Hacia el Aprendizaje para Completar Cualquier Cosa en LiDAR
Towards Learning to Complete Anything in Lidar
Ayca Takmaz, Cristiano Saltori, Neehar Peri, Tim Meinhardt, Riccardo de Lutio, Laura Leal-Taixé, Aljoša Ošep
•
Apr 16, 2025
•
10
2
Vivid4D: Mejora de la reconstrucción 4D a partir de vídeo monocular mediante la restauración de vídeo
Vivid4D: Improving 4D Reconstruction from Monocular Video by Video Inpainting
Jiaxin Huang, Sheng Miao, BangBnag Yang, Yuewen Ma, Yiyi Liao
•
Apr 15, 2025
•
10
2
Sizigia de Pensamientos: Mejorando el CoT de LLM con la Resolución Libre Mínima
Syzygy of Thoughts: Improving LLM CoT with the Minimal Free Resolution
Chenghao Li, Chaoning Zhang, Yi Lu, Jiaquan Zhang, Qigan Sun, Xudong Wang, Jiwei Wei, Guoqing Wang, Yang Yang, Heng Tao Shen
•
Apr 13, 2025
•
10
2
BlockGaussian: Síntesis Eficiente de Nuevas Vistas a Gran Escala en Escenas mediante Proyección Gaussiana Adaptativa Basada en Bloques
BlockGaussian: Efficient Large-Scale Scene Novel View Synthesis via Adaptive Block-Based Gaussian Splatting
Yongchang Wu, Zipeng Qi, Zhenwei Shi, Zhengxia Zou
•
Apr 12, 2025
•
7
2
FreshStack: Construcción de Puntos de Referencia Realistas para Evaluar la Recuperación en Documentos Técnicos
FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents
Nandan Thakur, Jimmy Lin, Sam Havens, Michael Carbin, Omar Khattab, Andrew Drozdov
•
Apr 17, 2025
•
5
3
"No es una representación de mí": Examinando el sesgo de acento y la exclusión digital en los servicios de voz sintética con IA
"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services
Shira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit Ghosh
•
Apr 12, 2025
•
4
2