ChatPaper.aiChatPaper.ai
Início

arXiv

HuggingFace

PreçosContaÁrea de trabalho

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Artigos de Pesquisa em IA Diários

Artigos de pesquisa em IA selecionados diariamente com traduções

SaulLM-54B e SaulLM-141B: Ampliando a Adaptação de Domínio para o Domínio Legal
SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain

Pierre Colombo, Telmo Pires, Malik Boudiaf, Rui Melo, Dominic Culver, Sofia Morgado, Etienne Malaboeuf, Gabriel Hautreux, Johanne Charpentier, Michael Desa•Jul 28, 2024•662

Integrando Modelos de Linguagem Grandes em uma Arquitetura Tri-Modal para Classificação Automatizada de Depressão
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification

Santosh V. Patapati•Jul 27, 2024•599

SeaLLMs 3: Fundação Aberta e Modelos de Linguagem de Grande Escala Multilíngues de Bate-Papo para Línguas do Sudeste Asiático
SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages

Wenxuan Zhang, Hou Pong Chan, Yiran Zhao, Mahani Aljunied, Jianyu Wang, Chaoqun Liu, Yue Deng, Zhiqiang Hu, Weiwen Xu, Yew Ken Chia, Xin Li, Lidong Bing•Jul 29, 2024•586

FreeLong: Geração de Vídeo Longo sem Treinamento com Atenção Temporal SpectralBlend
FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention

Yu Lu, Yuanzhi Liang, Linchao Zhu, Yi Yang•Jul 29, 2024•522

Theia: Destilando Modelos Fundamentais de Visão Diversos para Aprendizado de Robôs
Theia: Distilling Diverse Vision Foundation Models for Robot Learning

Jinghuan Shang, Karl Schmeckpeper, Brandon B. May, Maria Vittoria Minniti, Tarik Kelestemur, David Watkins, Laura Herlant•Jul 29, 2024•483

MindSearch: Imitar Mentes Humanas Provoca Profunda Busca de IA
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher

Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao•Jul 29, 2024•444

MMAU: Um Benchmark Holístico das Capacidades de Agentes em Diversos Domínios
MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains

Guoli Yin, Haoping Bai, Shuang Ma, Feng Nan, Yanchao Sun, Zhaoyang Xu, Shen Ma, Jiarui Lu, Xiang Kong, Aonan Zhang, Dian Ang Yap, Yizhe zhang, Karsten Ahnert, Vik Kamath, Mathias Berglund, Dominic Walsh, Tobias Gindele, Juergen Wiest, Zhengfeng Lai, Xiaoming Wang, Jiulong Shan, Meng Cao, Ruoming Pang, Zirui Wang•Jul 18, 2024•414

O Feedback de Difusão Ajuda o CLIP a Enxergar Melhor
Diffusion Feedback Helps CLIP See Better

Wenxuan Wang, Quan Sun, Fan Zhang, Yepeng Tang, Jing Liu, Xinlong Wang•Jul 29, 2024•372

Mistura de Especialistas Aninhados: Processamento Adaptativo de Tokens Visuais
Mixture of Nested Experts: Adaptive Processing of Visual Tokens

Gagan Jain, Nidhi Hegde, Aditya Kusupati, Arsha Nagrani, Shyamal Buch, Prateek Jain, Anurag Arnab, Sujoy Paul•Jul 29, 2024•374

O Auto-treinamento com Otimização Direta de Preferências Melhora o Raciocínio em Cadeia de Pensamento.
Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning

Tianduo Wang, Shichen Li, Wei Lu•Jul 25, 2024•344

Cycle3D: Geração de Imagens em 3D de Alta Qualidade e Consistência por meio do Ciclo de Geração-Reconstrução
Cycle3D: High-quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle

Zhenyu Tang, Junwu Zhang, Xinhua Cheng, Wangbo Yu, Chaoran Feng, Yatian Pang, Bin Lin, Li Yuan•Jul 28, 2024•282

Enigmas Visuais: um Desafio de Senso Comum e Conhecimento do Mundo para Modelos de Visão e Linguagem em Grande Escala
Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models

Nitzan Bitton-Guetta, Aviv Slobodkin, Aviya Maimon, Eliya Habba, Royi Rassin, Yonatan Bitton, Idan Szpektor, Amir Globerson, Yuval Elovici•Jul 28, 2024•232

Question Answering 3D para Compreensão de Cenas Urbanas
3D Question Answering for City Scene Understanding

Penglei Sun, Yaoxian Song, Xiang Liu, Xiaofei Yang, Qiang Wang, Tiefeng Li, Yang Yang, Xiaowen Chu•Jul 24, 2024•225

ATHAR: Um Conjunto de Dados de Alta Qualidade e Diversificado para Tradução do Árabe Clássico para Inglês
ATHAR: A High-Quality and Diverse Dataset for Classical Arabic to English Translation

Mohammed Khalil, Mohammed Sabry•Jul 29, 2024•211

Modelos de Linguagem Meta-Recompensa: Alinhamento com Autoaperfeiçoamento usando LLM como Meta-Juíz
Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge

Tianhao Wu, Weizhe Yuan, Olga Golovneva, Jing Xu, Yuandong Tian, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar•Jul 28, 2024•212

ImagiNet: Um Conjunto de Dados Multi-Conteúdo para Detecção de Imagens Sintéticas Generalizáveis via Aprendizado Contrastivo
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning

Delyan Boychev, Radostin Cholakov•Jul 29, 2024•202

Análise de Sentimento de Avaliações Online em Lituano Utilizando Modelos de Linguagem Grandes
Sentiment Analysis of Lithuanian Online Reviews Using Large Language Models

Brigita Vileikytė, Mantas Lukoševičius, Lukas Stankevičius•Jul 29, 2024•121

Reduzindo a Lacuna: Criação de Avatar semelhante a Estúdio a partir de uma Captura de Telefone Monocular
Bridging the Gap: Studio-like Avatar Creation from a Monocular Phone Capture

ShahRukh Athar, Shunsuke Saito, Zhengyu Yang, Stanislav Pidhorsky, Chen Cao•Jul 28, 2024•121

WalkTheDog: Alinhamento de Movimento Cruzado por Morfologia via Manifolds de Fase
WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds

Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung•Jul 11, 2024•122

VolDoGer: Conjuntos de Dados Assistidos por LLM para Generalização de Domínio em Tarefas de Visão e Linguagem
VolDoGer: LLM-assisted Datasets for Domain Generalization in Vision-Language Tasks

Juhwan Choi, Junehyoung Kwon, JungMin Yun, Seunguk Yu, YoungBin Kim•Jul 29, 2024•113

TAPTRv2: Atualização de Posição Baseada em Atenção Melhora o Rastreamento de Qualquer Ponto
TAPTRv2: Attention-based Position Update Improves Tracking Any Point

Hongyang Li, Hao Zhang, Shilong Liu, Zhaoyang Zeng, Feng Li, Tianhe Ren, Bohan Li, Lei Zhang•Jul 23, 2024•114