ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
April 3rd, 2025
AnimeGamer: Simulação Infinita de Vida Anime com Previsão do Próximo Estado do Jogo
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
Junhao Cheng, Yuying Ge, Yixiao Ge, Jing Liao, Ying Shan
•
Apr 1, 2025
•
66
2
LSNet: Veja Grande, Foque Pequeno
LSNet: See Large, Focus Small
Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding
•
Mar 29, 2025
•
9
3
VerifiAgent: um Agente de Verificação Unificado no Raciocínio de Modelos de Linguagem
VerifiAgent: a Unified Verification Agent in Language Model Reasoning
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
•
Apr 1, 2025
•
6
2
Modelos de Difusão de Vídeo Conscientes do Alvo
Target-Aware Video Diffusion Models
Taeksoo Kim, Hanbyul Joo
•
Mar 24, 2025
•
5
2
MegaTTS 3: Transformador de Difusão Latente com Alinhamento Esparsificado Aprimorado para Síntese de Fala Zero-Shot
MegaTTS 3: Sparse Alignment Enhanced Latent Diffusion Transformer for Zero-Shot Speech Synthesis
Ziyue Jiang, Yi Ren, Ruiqi Li, Shengpeng Ji, Boyang Zhang, Zhenhui Ye, Chen Zhang, Bai Jionghao, Xiaoda Yang, Jialong Zuo, Yu Zhang, Rui Liu, Xiang Yin, Zhou Zhao
•
Feb 26, 2025
•
12
2
Melhoria do Raciocínio Visuoespacial por meio de Treinamento Semelhante ao R1-Zero
Improved Visual-Spatial Reasoning via R1-Zero-Like Training
Zhenyi Liao, Qingsong Xie, Yanhao Zhang, Zijian Kong, Haonan Lu, Zhenyu Yang, Zhijie Deng
•
Apr 1, 2025
•
62
3
MergeVQ: Um Framework Unificado para Geração e Representação Visual com Fusão e Quantização de Tokens Desacoplados
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization
Siyuan Li, Luyuan Zhang, Zedong Wang, Juanxi Tian, Cheng Tan, Zicheng Liu, Chang Yu, Qingsong Xie, Haonan Lu, Haoqian Wang, Zhen Lei
•
Apr 1, 2025
•
87
7
Pulo Adaptativo de Camadas em LLMs Pré-treinados
Adaptive Layer-skipping in Pre-trained LLMs
Xuan Luo, Weizhi Wang, Xifeng Yan
•
Mar 31, 2025
•
6
2
Compreendendo o Treinamento do Tipo R1-Zero: Uma Perspectiva Crítica
Understanding R1-Zero-Like Training: A Critical Perspective
Zichen Liu, Changyu Chen, Wenjun Li, Penghui Qi, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin
•
Mar 26, 2025
•
47
3
ILLUME+: Iluminando MLLM Unificado com Tokenização Visual Dupla e Refinamento por Difusão
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement
Runhui Huang, Chunwei Wang, Junwei Yang, Guansong Lu, Yunlong Yuan, Jianhua Han, Lu Hou, Wei Zhang, Lanqing Hong, Hengshuang Zhao, Hang Xu
•
Apr 2, 2025
•
23
4
Modelos de linguagem de grande escala na área médica são facilmente distraídos.
Medical large language models are easily distracted
Krithik Vishwanath, Anton Alyakin, Daniel Alexander Alber, Jin Vivian Lee, Douglas Kondziolka, Eric Karl Oermann
•
Apr 1, 2025
•
3
2
ScholarCopilot: Treinando Modelos de Linguagem de Grande Escala para Redação Acadêmica com Citações Precisas
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations
Yubo Wang, Xueguang Ma, Ping Nie, Huaye Zeng, Zhiheng Lyu, Yuxuan Zhang, Benjamin Schneider, Yi Lu, Xiang Yue, Wenhu Chen
•
Apr 1, 2025
•
40
2
VideoScene: Destilando Modelos de Difusão de Vídeo para Gerar Cenas 3D em Um Único Passo
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step
Hanyang Wang, Fangfu Liu, Jiawei Chi, Yueqi Duan
•
Apr 2, 2025
•
40
2
DASH: Detecção e Avaliação de Alucinações Sistemáticas em Modelos de Linguagem Visual
DASH: Detection and Assessment of Systematic Hallucinations of VLMs
Maximilian Augustin, Yannic Neuhaus, Matthias Hein
•
Mar 30, 2025
•
12
2
Quamba2: Um Framework Robusto e Escalável de Quantização Pós-Treinamento para Modelos de Espaço de Estados Seletivos
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models
Hung-Yueh Chiang, Chi-Chih Chang, Natalia Frumkin, Kai-Chiang Wu, Mohamed S. Abdelfattah, Diana Marculescu
•
Mar 28, 2025
•
10
2
Protegendo Modelos Visão-Linguagem: Mitigando Vulnerabilidades ao Ruído Gaussiano em Ataques Baseados em Perturbação
Safeguarding Vision-Language Models: Mitigating Vulnerabilities to Gaussian Noise in Perturbation-based Attacks
Jiawei Wang, Yushen Zuo, Yuanjun Chai, Zhendong Liu, Yichen Fu, Yichun Feng, Kin-man Lam
•
Apr 2, 2025
•
13
2
PaperBench: Avaliando a Capacidade da IA de Replicar Pesquisas em IA
PaperBench: Evaluating AI's Ability to Replicate AI Research
Giulio Starace, Oliver Jaffe, Dane Sherburn, James Aung, Jun Shern Chan, Leon Maksin, Rachel Dias, Evan Mays, Benjamin Kinsella, Wyatt Thompson, Johannes Heidecke, Amelia Glaese, Tejal Patwardhan
•
Apr 2, 2025
•
36
2
Detecção Aprimorada de OoD através do Alinhamento Intermodal de Representações Multimodais
Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations
Jeonghyeon Kim, Sangheum Hwang
•
Mar 24, 2025
•
4
1
Melhore Seu Próprio Modelo de Geração de Imagens Humanas via Otimização de Preferência Direta com Feedback de IA
Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback
Sanghyeon Na, Yonggyu Kim, Hyunjoon Lee
•
May 30, 2024
•
22
3
Em Direção à Geração de Vídeos Fisicamente Plausíveis via Planejamento com VLM
Towards Physically Plausible Video Generation via VLM Planning
Xindi Yang, Baolu Li, Yiming Zhang, Zhenfei Yin, Lei Bai, Liqian Ma, Zhiyong Wang, Jianfei Cai, Tien-Tsin Wong, Huchuan Lu, Xu Jia
•
Mar 30, 2025
•
39
3
DreamActor-M1: Animação Holística, Expressiva e Robusta de Imagens Humanas com Orientação Híbrida
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
Yuxuan Luo, Zhengkun Rong, Lizhen Wang, Longhao Zhang, Tianshu Hu, Yongming Zhu
•
Apr 2, 2025
•
65
7
Distilação de Cinemática Articulada a partir de Modelos de Difusão de Vídeo
Articulated Kinematics Distillation from Video Diffusion Models
Xuan Li, Qianli Ma, Tsung-Yi Lin, Yongxin Chen, Chenfanfu Jiang, Ming-Yu Liu, Donglai Xiang
•
Apr 1, 2025
•
24
3