ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
March 4th, 2025
CodeArena: Uma Plataforma de Avaliação Coletiva para Geração de Código por LLMs
CodeArena: A Collective Evaluation Platform for LLM Code Generation
Mingzhe Du, Anh Tuan Luu, Bin Ji, Xiaobao Wu, Dong Huang, Terry Yue Zhuo, Qian Liu, See-Kiong Ng
•
Mar 3, 2025
•
8
2
Comportamentos Cognitivos que Habilitam Raciocinadores de Autoaperfeiçoamento, ou, Quatro Hábitos de STaRs Altamente Eficazes
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs
Kanishk Gandhi, Ayush Chakravarthy, Anikait Singh, Nathan Lile, Noah D. Goodman
•
Mar 3, 2025
•
38
3
OneRec: Unificando Recuperação e Classificação com Recomendador Generativo e Alinhamento Iterativo de Preferências
OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment
Jiaxin Deng, Shiyao Wang, Kuo Cai, Lejian Ren, Qigen Hu, Weifeng Ding, Qiang Luo, Guorui Zhou
•
Feb 26, 2025
•
25
2
VideoUFO: Um Conjunto de Dados em Escala de Milhões Focado no Usuário para Geração de Texto para Vídeo
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation
Wenhao Wang, Yi Yang
•
Mar 3, 2025
•
8
2
Linguagens Tonais Inventadas por IA: Evitando uma Língua Franca Máquina Além da Compreensão Humana
AI-Invented Tonal Languages: Preventing a Machine Lingua Franca Beyond Human Understanding
David Noever
•
Mar 2, 2025
•
5
2
Qilin: Um Conjunto de Dados de Recuperação de Informação Multimodal com Sessões de Usuário em Nível de Aplicativo
Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions
Jia Chen, Qian Dong, Haitao Li, Xiaohui He, Yan Gao, Shaosheng Cao, Yi Wu, Ping Yang, Chen Xu, Yao Hu, Qingyao Ai, Yiqun Liu
•
Mar 1, 2025
•
12
2
Reconstrução de Layout de Sala com Visões Esparsas Não Posadas na Era dos Modelos Pré-treinados
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model
Yaxuan Huang, Xili Dai, Jianan Wang, Xianbiao Qi, Yixing Yuan, Xiangyu Yue
•
Feb 24, 2025
•
3
2
Seleção de Dados em Grande Escala para Ajuste de Instruções
Large-Scale Data Selection for Instruction Tuning
Hamish Ivison, Muru Zhang, Faeze Brahman, Pang Wei Koh, Pradeep Dasigi
•
Mar 3, 2025
•
12
2
DiffRhythm: Geração de Músicas Completas Extremamente Rápida e Surpreendentemente Simples com Difusão Latente de Ponta a Ponta
DiffRhythm: Blazingly Fast and Embarrassingly Simple End-to-End Full-Length Song Generation with Latent Diffusion
Ziqian Ning, Huakang Chen, Yuepeng Jiang, Chunbo Hao, Guobin Ma, Shuai Wang, Jixun Yao, Lei Xie
•
Mar 3, 2025
•
27
2
DuoDecoding: Decodificação Especulativa Heterogênea Consciente de Hardware com Rascunho Dinâmico de Múltiplas Sequências
DuoDecoding: Hardware-aware Heterogeneous Speculative Decoding with Dynamic Multi-Sequence Drafting
Kai Lv, Honglin Guo, Qipeng Guo, Xipeng Qiu
•
Mar 2, 2025
•
13
2
A Forma das Palavras Importa: Reconstrução Semântica de LLMs sob Tipoglicemia
Word Form Matters: LLMs' Semantic Reconstruction under Typoglycemia
Chenxi Wang, Tianle Gu, Zhongyu Wei, Lang Gao, Zirui Song, Xiuying Chen
•
Mar 3, 2025
•
5
2
Ensinando Distância Métrica a Modelos Fundacionais Multimodais Autoregressivos
Teaching Metric Distance to Autoregressive Multimodal Foundational Models
Jiwan Chung, Saejin Kim, Yongrae Jo, Jaewoo Park, Dongjun Min, Youngjae Yu
•
Mar 4, 2025
•
4
2
Relatório Técnico do Phi-4-Mini: Modelos de Linguagem Multimodais Compactos, mas Poderosos, via Mistura de LoRAs
Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs
Abdelrahman Abouelenin, Atabak Ashfaq, Adam Atkinson, Hany Awadalla, Nguyen Bach, Jianmin Bao, Alon Benhaim, Martin Cai, Vishrav Chaudhary, Congcong Chen, Dong Chen, Dongdong Chen, Junkun Chen, Weizhu Chen, Yen-Chun Chen, Yi-ling Chen, Qi Dai, Xiyang Dai, Ruchao Fan, Mei Gao, Min Gao, Amit Garg, Abhishek Goswami, Junheng Hao, Amr Hendy, Yuxuan Hu, Xin Jin, Mahmoud Khademi, Dongwoo Kim, Young Jin Kim, Gina Lee, Jinyu Li, Yunsheng Li, Chen Liang, Xihui Lin, Zeqi Lin, Mengchen Liu, Yang Liu, Gilsinia Lopez, Chong Luo, Piyush Madan, Vadim Mazalov, Ali Mousavi, Anh Nguyen, Jing Pan, Daniel Perez-Becker, Jacob Platin, Thomas Portet, Kai Qiu, Bo Ren, Liliang Ren, Sambuddha Roy, Ning Shang, Yelong Shen, Saksham Singhal, Subhojit Som, Xia Song, Tetyana Sych, Praneetha Vaddamanu, Shuohang Wang, Yiming Wang, Zhenghao Wang, Haibin Wu, Haoran Xu, Weijian Xu, Yifan Yang, Ziyi Yang, Donghan Yu, Ishmam Zabir, Jianwen Zhang, Li Lyna Zhang, Yunan Zhang, Xiren Zhou
•
Mar 3, 2025
•
86
6
Por que os Agentes de IA na Web São Mais Vulneráveis do que os LLMs Independentes? Uma Análise de Segurança
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis
Jeffrey Yang Fan Chiang, Seungjae Lee, Jia-Bin Huang, Furong Huang, Yizheng Chen
•
Feb 27, 2025
•
3
2
Visual-RFT: Ajuste Fino por Reforço Visual
Visual-RFT: Visual Reinforcement Fine-Tuning
Ziyu Liu, Zeyi Sun, Yuhang Zang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi Wang
•
Mar 3, 2025
•
78
2
Escalonamento Eficiente em Tempo de Teste via Autocalibração
Efficient Test-Time Scaling via Self-Calibration
Chengsong Huang, Langlin Huang, Jixuan Leng, Jiacheng Liu, Jiaxin Huang
•
Feb 25, 2025
•
15
2
Kiss3DGen: Reaproveitando Modelos de Difusão de Imagens para Geração de Ativos 3D
Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation
Jiantao Lin, Xin Yang, Meixi Chen, Yingjie Xu, Dongyu Yan, Leyi Wu, Xinli Xu, Lie XU, Shunsi Zhang, Ying-Cong Chen
•
Mar 3, 2025
•
15
2
SampleMix: Uma Estratégia de Mistura de Dados de Pré-treinamento Amostral por Coordenação de Qualidade e Diversidade de Dados
SampleMix: A Sample-wise Pre-training Data Mixing Strategey by Coordinating Data Quality and Diversity
Xiangyu Xi, Deyang Kong, Jian Yang, Jiawei Yang, Zhengyu Chen, Wei Wang, Jingang Wang, Xunliang Cai, Shikun Zhang, Wei Ye
•
Mar 3, 2025
•
9
2
Consulta Ad-hoc Especulativa
Speculative Ad-hoc Querying
Haoyu Li, Srikanth Kandula, Maria Angels de Luis Balaguer, Aditya Akella, Venkat Arun
•
Mar 2, 2025
•
13
2
O Raciocínio Geral Requer Aprender a Raciocinar desde o Início
General Reasoning Requires Learning to Reason from the Get-go
Seungwook Han, Jyothish Pari, Samuel J. Gershman, Pulkit Agrawal
•
Feb 26, 2025
•
5
2
CLEA: Agente Corporificado em Circuito Fechado para Melhoria da Execução de Tarefas em Ambientes Dinâmicos
CLEA: Closed-Loop Embodied Agent for Enhancing Task Execution in Dynamic Environments
Mingcong Lei, Ge Wang, Yiming Zhao, Zhixin Mai, Qing Zhao, Yao Guo, Zhen Li, Shuguang Cui, Yatong Han, Jinke Ren
•
Mar 2, 2025
•
3
2
De Horas para Minutos: Aceleração sem Perdas na Geração de Sequências Ultra Longas de até 100 Mil Tokens
From Hours to Minutes: Lossless Acceleration of Ultra Long Sequence Generation up to 100K Tokens
Tong Wu, Junzhe Shen, Zixia Jia, Yuxuan Wang, Zilong Zheng
•
Feb 26, 2025
•
30
2
Quando um LLM está apreensivo sobre suas respostas — e quando sua incerteza é justificada
When an LLM is apprehensive about its answers -- and when its uncertainty is justified
Petr Sychev, Andrey Goncharov, Daniil Vyazhev, Edvard Khalafyan, Alexey Zaytsev
•
Mar 3, 2025
•
21
2
Liger: Linearização de Modelos de Linguagem de Grande Escala em Estruturas Recorrentes com Portas
Liger: Linearizing Large Language Models to Gated Recurrent Structures
Disen Lan, Weigao Sun, Jiaxi Hu, Jusen Du, Yu Cheng
•
Mar 3, 2025
•
18
2
Difix3D+: Melhorando Reconstruções 3D com Modelos de Difusão em Única Etapa
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models
Jay Zhangjie Wu, Yuxuan Zhang, Haithem Turki, Xuanchi Ren, Jun Gao, Mike Zheng Shou, Sanja Fidler, Zan Gojcic, Huan Ling
•
Mar 3, 2025
•
44
2
RSQ: Aprender com Tokens Importantes Leva a LLMs Quantizados Melhores
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs
Yi-Lin Sung, Prateek Yadav, Jialu Li, Jaehong Yoon, Mohit Bansal
•
Mar 3, 2025
•
2
3
Otimização Discriminativa Direta: Seu Modelo Generativo Visual Baseado em Verossimilhança é Secretamente um Discriminador de GAN
Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator
Kaiwen Zheng, Yongxin Chen, Huayu Chen, Guande He, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang
•
Mar 3, 2025
•
3
2
PodAgent: Um Framework Abrangente para Geração de Podcasts
PodAgent: A Comprehensive Framework for Podcast Generation
Yujia Xiao, Lei He, Haohan Guo, Fenglong Xie, Tan Lee
•
Mar 1, 2025
•
6
2