ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
April 16th, 2025
ReZero: Aprimorando a capacidade de busca de LLMs ao tentar mais uma vez
ReZero: Enhancing LLM search ability by trying one-more-time
Alan Dao, Thinh Le
•
Apr 15, 2025
•
14
2
VisualPuzzles: Desacoplando a Avaliação de Raciocínio Multimodal do Conhecimento de Domínio
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge
Yueqi Song, Tianyue Ou, Yibo Kong, Zecheng Li, Graham Neubig, Xiang Yue
•
Apr 14, 2025
•
11
2
NormalCrafter: Aprendendo Normais Temporalmente Consistentes a partir de Vídeo com Priors de Difusão
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors
Yanrui Bin, Wenbo Hu, Haoyuan Wang, Xinya Chen, Bing Wang
•
Apr 15, 2025
•
17
2
Treinamento Eficiente de Modelos de Recompensa de Processo por meio de Aprendizado Ativo
Efficient Process Reward Model Training via Active Learning
Keyu Duan, Zichen Liu, Xin Mao, Tianyu Pang, Changyu Chen, Qiguang Chen, Michael Qizhe Shieh, Longxu Dou
•
Apr 14, 2025
•
13
2
Heimdall: dimensionamento em tempo de teste na verificação generativa
Heimdall: test-time scaling on the generative verification
Wenlei Shi, Xing Jin
•
Apr 14, 2025
•
32
2
Como os Dados de Instrução e Raciocínio Moldam o Pós-Treinamento: Qualidade dos Dados sob a Perspectiva dos Gradientes Camada a Camada
How Instruction and Reasoning Data shape Post-Training: Data Quality through the Lens of Layer-wise Gradients
Ming Li, Yanhong Li, Ziyue Li, Tianyi Zhou
•
Apr 14, 2025
•
40
2
RealHarm: Uma Coleção de Falhas Reais na Aplicação de Modelos de Linguagem
RealHarm: A Collection of Real-World Language Model Application Failures
Pierre Le Jeune, Jiaen Liu, Luca Rossi, Matteo Dora
•
Apr 14, 2025
•
11
3
Compressão Eficiente de Modelos de Linguagem Híbridos por meio de Poda SSM com Consciência de Grupo
Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning
Ali Taghibakhshi, Sharath Turuvekere Sreenivas, Saurav Muralidharan, Marcin Chochowski, Yashaswi Karnati, Raviraj Joshi, Ameya Sunil Mahabaleshwarkar, Zijia Chen, Yoshi Suhara, Oluwatobi Olabiyi, Daniel Korzekwa, Mostofa Patwary, Mohammad Shoeybi, Jan Kautz, Bryan Catanzaro, Ashwath Aithal, Nima Tajbakhsh, Pavlo Molchanov
•
Apr 15, 2025
•
10
2
Modelos de Raciocínio Eficientes: Uma Revisão
Efficient Reasoning Models: A Survey
Sicheng Feng, Gongfan Fang, Xinyin Ma, Xinchao Wang
•
Apr 15, 2025
•
18
4
xVerify: Verificador de Respostas Eficiente para Avaliações de Modelos de Raciocínio
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations
Ding Chen, Qingchen Yu, Pengyuan Wang, Wentao Zhang, Bo Tang, Feiyu Xiong, Xinchi Li, Minchuan Yang, Zhiyu Li
•
Apr 14, 2025
•
84
2
Poda Computacional Adaptativa para o Transformer com Esquecimento
Adaptive Computation Pruning for the Forgetting Transformer
Zhixuan Lin, Johan Obando-Ceron, Xu Owen He, Aaron Courville
•
Apr 9, 2025
•
3
2
AI-University: Uma plataforma baseada em LLM para alinhamento instrucional em salas de aula científicas
AI-University: An LLM-based platform for instructional alignment to scientific classrooms
Mostafa Faghih Shojaei, Rahul Gulati, Benjamin A. Jasperson, Shangshang Wang, Simone Cimolato, Dangli Cao, Willie Neiswanger, Krishna Garikipati
•
Apr 11, 2025
•
9
2
DeepMath-103K: Um Conjunto de Dados Matemáticos de Grande Escala, Desafiador, Descontaminado e Verificável para Avançar o Raciocínio
DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning
Zhiwei He, Tian Liang, Jiahao Xu, Qiuzhi Liu, Xingyu Chen, Yue Wang, Linfeng Song, Dian Yu, Zhenwen Liang, Wenxuan Wang, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu
•
Apr 15, 2025
•
12
6
D^2iT: Transformador de Difusão Dinâmica para Geração Precisa de Imagens
D^2iT: Dynamic Diffusion Transformer for Accurate Image Generation
Weinan Jia, Mengqi Huang, Nan Chen, Lei Zhang, Zhendong Mao
•
Apr 13, 2025
•
12
2
DataDecide: Como Prever os Melhores Dados de Pré-treinamento com Pequenos Experimentos
DataDecide: How to Predict Best Pretraining Data with Small Experiments
Ian Magnusson, Nguyen Tai, Ben Bogin, David Heineman, Jena D. Hwang, Luca Soldaini, Akshita Bhagia, Jiacheng Liu, Dirk Groeneveld, Oyvind Tafjord, Noah A. Smith, Pang Wei Koh, Jesse Dodge
•
Apr 15, 2025
•
17
2
A Escalabilidade da Simplicidade: Análise Empírica de Aprendizado Visão-Linguagem com um Único Transformer
The Scalability of Simplicity: Empirical Analysis of Vision-Language Learning with a Single Transformer
Weixian Lei, Jiacong Wang, Haochen Wang, Xiangtai Li, Jun Hao Liew, Jiashi Feng, Zilong Huang
•
Apr 14, 2025
•
15
3
Relatório Técnico do Seedream 3.0
Seedream 3.0 Technical Report
Yu Gao, Lixue Gong, Qiushan Guo, Xiaoxia Hou, Zhichao Lai, Fanshi Li, Liang Li, Xiaochen Lian, Chao Liao, Liyang Liu, Wei Liu, Yichun Shi, Shiqi Sun, Yu Tian, Zhi Tian, Peng Wang, Rui Wang, Xuanda Wang, Xun Wang, Ye Wang, Guofeng Wu, Jie Wu, Xin Xia, Xuefeng Xiao, Zhonghua Zhai, Xinyu Zhang, Qi Zhang, Yuwei Zhang, Shijia Zhao, Jianchao Yang, Weilin Huang
•
Apr 15, 2025
•
52
6
Treinamento Eficiente de Modelos Generativos via Aquecimento de Representações Incorporadas
Efficient Generative Model Training via Embedded Representation Warmup
Deyuan Liu, Peng Sun, Xufeng Li, Tao Lin
•
Apr 14, 2025
•
12
2
Relatório do Desafio PVUW 2025: Avanços na Compreensão em Nível de Pixel de Vídeos Complexos em Ambientes Reais
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild
Henghui Ding, Chang Liu, Nikhila Ravi, Shuting He, Yunchao Wei, Song Bai, Philip Torr, Kehuan Song, Xinglin Xie, Kexin Zhang, Licheng Jiao, Lingling Li, Shuyuan Yang, Xuqiang Cao, Linnan Zhao, Jiaxuan Zhao, Fang Liu, Mengjiao Wang, Junpei Zhang, Xu Liu, Yuting Yang, Mengru Ma, Hao Fang, Runmin Cong, Xiankai Lu, Zhiyang Che, Wei Zhan, Tianming Liang, Haichao Jiang, Wei-Shi Zheng, Jian-Fang Hu, Haobo Yuan, Xiangtai Li, Tao Zhang, Lu Qi, Ming-Hsuan Yang
•
Apr 15, 2025
•
6
2
LazyReview: Um Conjunto de Dados para Identificar Pensamento Preguiçoso em Revisões por Pares de NLP
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews
Sukannya Purkayastha, Zhuang Li, Anne Lauscher, Lizhen Qu, Iryna Gurevych
•
Apr 15, 2025
•
4
2
Modelos de Espaço de Estados para Detecção de Mudanças em Sensoriamento Remoto
Change State Space Models for Remote Sensing Change Detection
Elman Ghazaei, Erchan Aptoula
•
Apr 15, 2025
•
1
2
Pixel-SAIL: Um Único Transformer para Compreensão Baseada em Pixels
Pixel-SAIL: Single Transformer For Pixel-Grounded Understanding
Tao Zhang, Xiangtai Li, Zilong Huang, Yanwei Li, Weixian Lei, Xueqing Deng, Shihao Chen, Shunping Ji, Jiashi Feng
•
Apr 14, 2025
•
28
3
Difusão e Distilação com Otimização Direta de Preferências para Conclusão Eficiente de Cenas em LiDAR 3D
Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion
An Zhaol, Shengyuan Zhang, Ling Yang, Zejian Li, Jiale Wu, Haoran Xu, AnYang Wei, Perry Pengyun GU Lingyun Sun
•
Apr 15, 2025
•
5
2
Uma Abordagem Minimalista para o Raciocínio em LLM: da Amostragem por Rejeição ao Reforço
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce
Wei Xiong, Jiarui Yao, Yuhui Xu, Bo Pang, Lei Wang, Doyen Sahoo, Junnan Li, Nan Jiang, Tong Zhang, Caiming Xiong, Hanze Dong
•
Apr 15, 2025
•
14
6
Resumo de Apresentações Multimodais com Modelos de Visão e Linguagem: Estudo do Efeito das Modalidades e da Estrutura
Summarization of Multimodal Presentations with Vision-Language Models: Study of the Effect of Modalities and Structure
Théo Gigant, Camille Guinaudeau, Frédéric Dufaux
•
Apr 14, 2025
•
3
2
TextArena
TextArena
Leon Guertler, Bobby Cheng, Simon Yu, Bo Liu, Leshem Choshen, Cheston Tan
•
Apr 15, 2025
•
27
3
Alinhar a Eliminação de Ruído Generativa com Objetivos Discriminativos Liberta a Difusão para a Percepção Visual
Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual Perception
Ziqi Pang, Xin Xu, Yu-Xiong Wang
•
Apr 15, 2025
•
2
2
Genius: Um Framework Generalizável e Puramente Não Supervisionado de Autoaprendizagem para Raciocínio Avançado
Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning
Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Qiushi Sun, Kanzhi Cheng, Junxian He, Jun Liu, Zhiyong Wu
•
Apr 11, 2025
•
54
2
Modelagem de Vídeos Longos Multimodais Baseada em Contexto Dinâmico Temporal
Multimodal Long Video Modeling Based on Temporal Dynamic Context
Haoran Hao, Jiaming Han, Yiyuan Zhang, Xiangyu Yue
•
Apr 14, 2025
•
4
2
SimpleAR: Expandindo as Fronteiras da Geração Visual Autoregressiva por meio de Pré-treinamento, Ajuste Fino Supervisionado e Aprendizado por Reforço
SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL
Junke Wang, Zhi Tian, Xun Wang, Xinyu Zhang, Weilin Huang, Zuxuan Wu, Yu-Gang Jiang
•
Apr 15, 2025
•
12
1