ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
March 13th, 2025
RewardSDS: Alinhamento da Distilação de Pontuação por meio de Amostragem Ponderada por Recompensa
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling
Itay Chachy, Guy Yariv, Sagie Benaim
•
Mar 12, 2025
•
15
2
GTR: Reforço de Pensamento Guiado Previne o Colapso de Pensamento no Treinamento de Agentes VLM Baseados em RL
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye
•
Mar 11, 2025
•
17
2
Quantização de Modelos de Linguagem de Grande Escala para Geração de Código: Uma Replicação Diferenciada
Quantizing Large Language Models for Code Generation: A Differentiated Replication
Alessandro Giagnorio, Antonio Mastropaolo, Saima Afrin, Massimiliano Di Penta, Gabriele Bavota
•
Mar 10, 2025
•
8
2
MoC: Misturas de Aprendizes de Segmentação de Texto para Sistemas de Geração Aumentada por Recuperação
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Mar 12, 2025
•
4
3
PhysicsGen: Modelos Generativos Podem Aprender com Imagens para Prever Relações Físicas Complexas?
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations?
Martin Spitznagel, Jan Vaillant, Janis Keuper
•
Mar 7, 2025
•
8
2
Mais Documentos, Mesmo Comprimento: Isolando o Desafio de Múltiplos Documentos no RAG
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG
Shahar Levy, Nir Mazor, Lihi Shalmon, Michael Hassid, Gabriel Stanovsky
•
Mar 6, 2025
•
16
3
Motion Anything: Geração de Movimento a Partir de Qualquer Entrada
Motion Anything: Any to Motion Generation
Zeyu Zhang, Yiran Wang, Wei Mao, Danning Li, Rui Zhao, Biao Wu, Zirui Song, Bohan Zhuang, Ian Reid, Richard Hartley
•
Mar 10, 2025
•
32
6
VLog: Modelos de Vídeo-Linguagem por Recuperação Generativa de Narração Vocabulário
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
Kevin Qinghong Lin, Mike Zheng Shou
•
Mar 12, 2025
•
7
2
Atenção de Consultas Agrupadas com Custo Ótimo para LLMs de Contexto Longo
Cost-Optimal Grouped-Query Attention for Long-Context LLMs
Yingfa Chen, Yutong Wu, Xu Han, Zhiyuan Liu, Maosong Sun
•
Mar 12, 2025
•
5
2
Monte Carlo de Difusão para RANSAC Baseado em Aprendizado Generalizável
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC
Jiale Wang, Chen Zhao, Wei Ke, Tong Zhang
•
Mar 12, 2025
•
1
2
Block Diffusion: Interpolando entre Modelos de Linguagem Autoregressivos e de Difusão
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models
Marianne Arriola, Aaron Gokaslan, Justin T Chiu, Zhihan Yang, Zhixuan Qi, Jiaqi Han, Subham Sekhar Sahoo, Volodymyr Kuleshov
•
Mar 12, 2025
•
71
3
WildIFEval: Seguimento de Instruções em Ambientes Diversos
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
•
Mar 9, 2025
•
13
4
BIMBA: Compressão de Varredura Seletiva para Resposta a Perguntas em Vídeos de Longo Alcance
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani
•
Mar 12, 2025
•
3
2
Compreendendo e Mitigando Deslocamentos de Distribuição para Aprendizado de Máquina Campos de Força
Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields
Tobias Kreiman, Aditi S. Krishnapriyan
•
Mar 11, 2025
•
0
3
Assistente Médico Baseado em Multiagentes para Dispositivos de Borda
Multi Agent based Medical Assistant for Edge Devices
Sakharam Gawade, Shivam Akhouri, Chinmay Kulkarni, Jagdish Samant, Pragya Sahu, Aastik, Jai Pahal, Saswat Meher
•
Mar 7, 2025
•
7
2
Modelos de Difusão Latente Livres de Aliasing: Melhorando a Equivariância de Deslocamento Fracionário no Espaço Latente de Difusão
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space
Yifan Zhou, Zeqi Xiao, Shuai Yang, Xingang Pan
•
Mar 12, 2025
•
6
2
Search-R1: Treinando LLMs para Raciocinar e Utilizar Mecanismos de Busca com Aprendizado por Reforço
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han
•
Mar 12, 2025
•
28
2
Quando Grandes Modelos de Visão e Linguagem Encontram Grandes Imagens de Sensoriamento Remoto: Poda de Tokens Guiada por Texto do Grosso ao Fino
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning
Junwei Luo, Yingying Zhang, Xue Yang, Kang Wu, Qi Zhu, Lei Liang, Jingdong Chen, Yansheng Li
•
Mar 10, 2025
•
7
3
Modelagem de Linguagem Multimodal para Análise e Geração de Transcriptômica de Célula Única de Alta Precisão
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation
Yaorui Shi, Jiaqi Yang, Sihang Li, Junfeng Fang, Xiang Wang, Zhiyuan Liu, Yang Zhang
•
Mar 12, 2025
•
4
2
Autoaprendizagem de Autocorreção para Modelos de Linguagem Pequenos
Self-Taught Self-Correction for Small Language Models
Viktor Moskvoretskii, Chris Biemann, Irina Nikishina
•
Mar 11, 2025
•
15
2
TPDiff: Modelo de Difusão de Vídeo com Pirâmide Temporal
TPDiff: Temporal Pyramid Video Diffusion Model
Lingmin Ran, Mike Zheng Shou
•
Mar 12, 2025
•
45
3
Reangle-A-Video: Geração de Vídeo 4D como Tradução de Vídeo para Vídeo
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation
Hyeonho Jeong, Suhyeon Lee, Jong Chul Ye
•
Mar 12, 2025
•
32
2