ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
April 1st, 2025
MoCha: Rumo à Síntese de Personagens Falantes com Qualidade Cinematográfica
MoCha: Towards Movie-Grade Talking Character Synthesis
Cong Wei, Bo Sun, Haoyu Ma, Ji Hou, Felix Juefei-Xu, Zecheng He, Xiaoliang Dai, Luxin Zhang, Kunpeng Li, Tingbo Hou, Animesh Sinha, Peter Vajda, Wenhu Chen
•
Mar 30, 2025
•
131
11
TextCrafter: Renderização Precisa de Múltiplos Textos em Cenas Visuais Complexas
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes
Nikai Du, Zhennan Chen, Zhizhou Chen, Shan Gao, Xi Chen, Zhengkai Jiang, Jian Yang, Ying Tai
•
Mar 30, 2025
•
95
3
Open-Reasoner-Zero: Uma Abordagem de Código Aberto para Escalonar o Aprendizado por Reforço no Modelo Base
Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model
Jingcheng Hu, Yinmin Zhang, Qi Han, Daxin Jiang, Xiangyu Zhang, Heung-Yeung Shum
•
Mar 31, 2025
•
63
3
O quê, Como, Onde e Quão Bem? Uma Pesquisa sobre Escalonamento em Tempo de Teste em Modelos de Linguagem de Grande Escala
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models
Qiyuan Zhang, Fuyuan Lyu, Zexu Sun, Lei Wang, Weixu Zhang, Zhihan Guo, Yufei Wang, Irwin King, Xue Liu, Chen Ma
•
Mar 31, 2025
•
53
2
Inferência Eficiente para Modelos de Raciocínio em Grande Escala: Uma Revisão
Efficient Inference for Large Reasoning Models: A Survey
Yue Liu, Jiaying Wu, Yufei He, Hongcheng Gao, Hongyu Chen, Baolong Bi, Jiaheng Zhang, Zhiqi Huang, Bryan Hooi
•
Mar 29, 2025
•
46
3
TokenHSI: Síntese Unificada de Interações Físicas Humano-Cena através de Tokenização de Tarefas
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
Liang Pan, Zeshi Yang, Zhiyang Dou, Wenjia Wang, Buzhen Huang, Bo Dai, Taku Komura, Jingbo Wang
•
Mar 25, 2025
•
39
3
Unicorn: Síntese de Dados Apenas Textuais para Treinamento de Modelos de Linguagem Visual
Unicorn: Text-Only Data Synthesis for Vision Language Model Training
Xiaomin Yu, Pengxiang Ding, Wenjie Zhang, Siteng Huang, Songyang Gao, Chengwei Qin, Kejian Wu, Zhaoxin Fan, Ziyue Qiao, Donglin Wang
•
Mar 28, 2025
•
38
2
RIG: Sinergizando Raciocínio e Imaginação em Políticas Generalistas de Ponta a Ponta
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy
Zhonghan Zhao, Wenwei Zhang, Haian Huang, Kuikun Liu, Jianfei Gao, Gaoang Wang, Kai Chen
•
Mar 31, 2025
•
30
2
SketchVideo: Geração e Edição de Vídeos Baseada em Esboços
SketchVideo: Sketch-based Video Generation and Editing
Feng-Lin Liu, Hongbo Fu, Xintao Wang, Weicai Ye, Pengfei Wan, Di Zhang, Lin Gao
•
Mar 30, 2025
•
23
3
Controlando Eficazmente Modelos de Raciocínio por meio de Intervenção no Pensamento
Effectively Controlling Reasoning Models through Thinking Intervention
Tong Wu, Chong Xiang, Jiachen T. Wang, Prateek Mittal
•
Mar 31, 2025
•
19
4
Expandindo o Aprendizado por Reforço com Recompensas Verificáveis em Diferentes Domínios
Expanding RL with Verifiable Rewards Across Diverse Domains
Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong Yu
•
Mar 31, 2025
•
19
2
Consulta e Conquista: Geração de SQL Orientada por Execução
Query and Conquer: Execution-Guided SQL Generation
Łukasz Borchmann, Marek Wydmuch
•
Mar 31, 2025
•
18
2
Distilação Progressiva de Renderização: Adaptando o Stable Diffusion para Geração Instantânea de Texto para Malha sem Dados 3D
Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data
Zhiyuan Ma, Xinyue Liang, Rongyuan Wu, Xiangyu Zhu, Zhen Lei, Lei Zhang
•
Mar 27, 2025
•
16
2
TeleAntiFraud-28k: Um Conjunto de Dados de Pensamento Lento Áudio-Texto para Detecção de Fraudes em Telecomunicações
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection
Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen Kang
•
Mar 31, 2025
•
12
2
ActionStudio: Um Framework Leve para Dados e Treinamento de Modelos de Ação em Grande Escala
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models
Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
•
Mar 28, 2025
•
12
2
Planejamento Clássico com Heurísticas Geradas por LLM: Desafiando o Estado da Arte com Código Python
Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code
Augusto B. Corrêa, André G. Pereira, Jendrik Seipp
•
Mar 24, 2025
•
10
1
AvatarArtist: Avatarização 4D de Domínio Aberto
AvatarArtist: Open-Domain 4D Avatarization
Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen
•
Mar 25, 2025
•
9
2
Easi3R: Estimando Movimento Desenredado a partir do DUSt3R Sem Treinamento
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training
Xingyu Chen, Yue Chen, Yuliang Xiu, Andreas Geiger, Anpei Chen
•
Mar 31, 2025
•
7
2
MeshCraft: Explorando a Geração Eficiente e Controlável de Malhas com DiTs Baseados em Fluxo
MeshCraft: Exploring Efficient and Controllable Mesh Generation with Flow-based DiTs
Xianglong He, Junyi Chen, Di Huang, Zexiang Liu, Xiaoshui Huang, Wanli Ouyang, Chun Yuan, Yangguang Li
•
Mar 29, 2025
•
7
2
DSO: Alinhando Geradores 3D com Feedback de Simulação para Solidez Física
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
Ruining Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi
•
Mar 28, 2025
•
6
2
UPME: Uma Estrutura de Revisão por Pares Não Supervisionada para Avaliação de Modelos de Linguagem Multimodais de Grande Escala
UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation
Qihui Zhang, Munan Ning, Zheyuan Liu, Yanbo Wang, Jiayi Ye, Yue Huang, Shuo Yang, Xiao Chen, Yibing Song, Li Yuan
•
Mar 19, 2025
•
6
2
Ponderação Adaptativa Baseada em Entropia para Auto-Treinamento
Entropy-Based Adaptive Weighting for Self-Training
Xiaoxuan Wang, Yihe Deng, Mingyu Derek Ma, Wei Wang
•
Mar 31, 2025
•
4
2
KOFFVQA: Um Benchmark de VQA de Formato Livre Avaliado Objetivamente para Grandes Modelos de Visão e Linguagem na Língua Coreana
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language
Yoonshik Kim, Jaeyoon Jung
•
Mar 31, 2025
•
4
2
Conectando a Otimização Evolutiva Multiobjetivo e a Aceleração por GPU via Tensorização
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration via Tensorization
Zhenyu Liang, Hao Li, Naiwei Yu, Kebin Sun, Ran Cheng
•
Mar 26, 2025
•
4
3
PAVE: Aplicação de Patches e Adaptação de Modelos de Linguagem de Grande Escala para Vídeo
PAVE: Patching and Adapting Video Large Language Models
Zhuoming Liu, Yiquan Li, Khoi Duc Nguyen, Yiwu Zhong, Yin Li
•
Mar 25, 2025
•
4
2
Desacoplamento de Ângulos e Força na Adaptação de Baixo Rank
Decoupling Angles and Strength in Low-rank Adaptation
Massimo Bini, Leander Girrbach, Zeynep Akata
•
Mar 23, 2025
•
4
2
Compreendendo Gestos Co-Verbais em Contextos Reais
Understanding Co-speech Gestures in-the-wild
Sindhu B Hegde, K R Prajwal, Taein Kwon, Andrew Zisserman
•
Mar 28, 2025
•
1
2