ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
March 24th, 2025
Habilitando Controles Versáteis para Modelos de Difusão de Vídeo
Enabling Versatile Controls for Video Diffusion Models
Xu Zhang, Hao Zhou, Haoming Qin, Xiaobin Lu, Jiaxing Yan, Guanzhong Wang, Zeyu Chen, Yi Liu
•
Mar 21, 2025
•
15
2
TaoAvatar: Avatares Corporais Completos Realistas em Tempo Real para Realidade Aumentada via Splatting Gaussiano 3D
TaoAvatar: Real-Time Lifelike Full-Body Talking Avatars for Augmented Reality via 3D Gaussian Splatting
Jianchuan Chen, Jingchuan Hu, Gaige Wang, Zhonghua Jiang, Tiansong Zhou, Zhiwen Chen, Chengfei Lv
•
Mar 21, 2025
•
26
3
MARS: Um Framework Multiagente Incorporando Orientação Socrática para Otimização Automatizada de Prompts
MARS: A Multi-Agent Framework Incorporating Socratic Guidance for Automated Prompt Optimization
Jian Zhang, Zhangqi Wang, Haiping Zhu, Jun Liu, Qika Lin, Erik Cambria
•
Mar 21, 2025
•
45
2
Quando Menos é Suficiente: Redução Adaptativa de Tokens para Representação Eficiente de Imagens
When Less is Enough: Adaptive Token Reduction for Efficient Image Representation
Eduard Allakhverdov, Elizaveta Goncharova, Andrey Kuznetsov
•
Mar 20, 2025
•
73
2
FFaceNeRF: Edição de Rostos com Poucos Exemplos em Campos de Radiação Neural
FFaceNeRF: Few-shot Face Editing in Neural Radiance Fields
Kwan Yun, Chaelin Kim, Hangyeul Shin, Junyong Noh
•
Mar 21, 2025
•
5
2
Geração e Edição Iterativa Orientada por Assunto a partir de uma Única Imagem
Single Image Iterative Subject-driven Generation and Editing
Yair Shpitzer, Gal Chechik, Idan Schwartz
•
Mar 20, 2025
•
14
2
Um Estudo Abrangente sobre Modelagem de Linguagem com Contexto Longo
A Comprehensive Survey on Long Context Language Modeling
Jiaheng Liu, Dawei Zhu, Zhiqi Bai, Yancheng He, Huanxuan Liao, Haoran Que, Zekun Wang, Chenchen Zhang, Ge Zhang, Jiebin Zhang, Yuanxing Zhang, Zhuo Chen, Hangyu Guo, Shilong Li, Ziqiang Liu, Yong Shan, Yifan Song, Jiayi Tian, Wenhao Wu, Zhejian Zhou, Ruijie Zhu, Junlan Feng, Yang Gao, Shizhu He, Zhoujun Li, Tianyu Liu, Fanyu Meng, Wenbo Su, Yingshui Tan, Zili Wang, Jian Yang, Wei Ye, Bo Zheng, Wangchunshu Zhou, Wenhao Huang, Sujian Li, Zhaoxiang Zhang
•
Mar 20, 2025
•
49
2
Conectando Tokens Contínuos e Discretos para Geração Visual Autoregressiva
Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation
Yuqing Wang, Zhijie Lin, Yao Teng, Yuanzhi Zhu, Shuhuai Ren, Jiashi Feng, Xihui Liu
•
Mar 20, 2025
•
35
4
Segmentação Generalizada de Nuvens de Pontos 3D com Poucos Exemplos Usando Modelos Visão-Linguagem
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model
Zhaochong An, Guolei Sun, Yun Liu, Runjia Li, Junlin Han, Ender Konukoglu, Serge Belongie
•
Mar 20, 2025
•
5
2
MathFlow: Aprimorando o Fluxo Perceptivo de MLLMs para Problemas Matemáticos Visuais
MathFlow: Enhancing the Perceptual Flow of MLLMs for Visual Mathematical Problems
Felix Chen, Hangjie Yuan, Yunqiu Xu, Tao Feng, Jun Cen, Pengwei Liu, Zeying Huang, Yi Yang
•
Mar 19, 2025
•
14
3
OpenVLThinker: Uma Exploração Inicial do Raciocínio Complexo em Visão e Linguagem por meio de Autoaprimoramento Iterativo
OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement
Yihe Deng, Hritik Bansal, Fan Yin, Nanyun Peng, Wei Wang, Kai-Wei Chang
•
Mar 21, 2025
•
23
2
GAEA: Um Modelo de Conversação com Consciência Geográfica
GAEA: A Geolocation Aware Conversational Model
Ron Campos, Ashmal Vayani, Parth Parag Kulkarni, Rohit Gupta, Aritra Dutta, Mubarak Shah
•
Mar 20, 2025
•
6
2
ETVA: Avaliação do Alinhamento Texto-Vídeo por meio de Geração e Resposta de Perguntas de Alto Nível de Detalhe
ETVA: Evaluation of Text-to-Video Alignment via Fine-grained Question Generation and Answering
Kaisi Guan, Zhengfeng Lai, Yuchong Sun, Peng Zhang, Wei Liu, Kieran Liu, Meng Cao, Ruihua Song
•
Mar 21, 2025
•
11
2
Modificando Modelos de Linguagem de Grande Escala Pós-Treinamento para Escrita Criativa Diversificada
Modifying Large Language Model Post-Training for Diverse Creative Writing
John Joon Young Chung, Vishakh Padmakumar, Melissa Roemmele, Yuqian Sun, Max Kreminski
•
Mar 21, 2025
•
36
2
FastCuRL: Aprendizado por Reforço com Currículo e Extensão Progressiva de Contexto para Treinamento Eficiente de Modelos de Raciocínio do Tipo R1
FastCuRL: Curriculum Reinforcement Learning with Progressive Context Extension for Efficient Training R1-like Reasoning Models
Mingyang Song, Mao Zheng, Zheng Li, Wenjie Yang, Xuan Luo, Yue Pan, Feng Zhang
•
Mar 21, 2025
•
10
3
RoboFactory: Explorando a Colaboração de Agentes Embarcados com Restrições Composicionais
RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints
Yiran Qin, Li Kang, Xiufeng Song, Zhenfei Yin, Xiaohong Liu, Xihui Liu, Ruimao Zhang, Lei Bai
•
Mar 20, 2025
•
40
2
Quando as Preferências Divergem: Alinhando Modelos de Difusão com DPO Adaptativo Consciente das Minorias
When Preferences Diverge: Aligning Diffusion Models with Minority-Aware Adaptive DPO
Lingfan Zhang, Chen Liu, Chengming Xu, Kai Hu, Donghao Luo, Chengjie Wang, Yanwei Fu, Yuan Yao
•
Mar 21, 2025
•
6
2
Grandes Modelos de Visão e Linguagem Podem Ler Mapas Como um Ser Humano?
Can Large Vision Language Models Read Maps Like a Human?
Shuo Xing, Zezhou Sun, Shuangyu Xie, Kaiyuan Chen, Yanjia Huang, Yuping Wang, Jiachen Li, Dezhen Song, Zhengzhong Tu
•
Mar 18, 2025
•
9
2
MAPS: Um Framework Multiagente Baseado na Personalidade Big Seven e Orientação Socrática para Resolução de Problemas Científicos Multimodais
MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientific Problem Solving
Jian Zhang, Zhiyuan Wang, Zhangqi Wang, Xinyu Zhang, Fangzhi Xu, Qika Lin, Rui Mao, Erik Cambria, Jun Liu
•
Mar 21, 2025
•
54
2
Da Cabeça à Cauda: Rumo à Representação Equilibrada em Grandes Modelos de Visão e Linguagem por meio de Calibração Adaptativa de Dados
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration
Mingyang Song, Xiaoye Qu, Jiawei Zhou, Yu Cheng
•
Mar 17, 2025
•
9
2
PVChat: Chat de Vídeo Personalizado com Aprendizado de Um Único Exemplo
PVChat: Personalized Video Chat with One-Shot Learning
Yufei Shi, Weilong Yan, Gang Xu, Yumeng Li, Yuchen Li, Zhenxi Li, Fei Richard Yu, Ming Li, Si Yong Yeo
•
Mar 21, 2025
•
7
2
Padrões Semelhantes a Vieses Implícitos em Modelos de Raciocínio
Implicit Bias-Like Patterns in Reasoning Models
Messi H. J. Lee, Calvin K. Lai
•
Mar 14, 2025
•
7
2