ChatPaper.aiChatPaper.ai
Início

arXiv

HuggingFace

PreçosContaÁrea de trabalho

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Artigos de Pesquisa em IA Diários

Artigos de pesquisa em IA selecionados diariamente com traduções

VITA: Rumo a um LLM Multimodal Ômnico Interativo de Código Aberto
VITA: Towards Open-Source Interactive Omni Multimodal LLM

Chaoyou Fu, Haojia Lin, Zuwei Long, Yunhang Shen, Meng Zhao, Yifan Zhang, Xiong Wang, Di Yin, Long Ma, Xiawu Zheng, Ran He, Rongrong Ji, Yunsheng Wu, Caifeng Shan, Xing Sun•Aug 9, 2024•493

Escopo Gemma: Autoencoders Esparsos Abertos em Todos os Lugares de Uma Só Vez na Gemma 2
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2

Tom Lieberum, Senthooran Rajamanoharan, Arthur Conmy, Lewis Smith, Nicolas Sonnerat, Vikrant Varma, János Kramár, Anca Dragan, Rohin Shah, Neel Nanda•Aug 9, 2024•402

mPLUG-Owl3: Rumo à Compreensão de Sequências Longas de Imagens em Modelos de Linguagem Multimodais de Grande Escala
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models

Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou•Aug 9, 2024•352

UniBench: Raciocínio Visual Requer Repensar a Interação Visão-Linguagem Além da Escala
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling

Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim•Aug 9, 2024•252

ToolSandbox: Um Benchmark Interativo, Conversacional e Baseado em Estado para Avaliação das Capacidades de Uso de Ferramentas de LLM
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities

Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang•Aug 8, 2024•184

Propagação de Características Inspirada em Kalman para Super-Resolução Facial em Vídeos
Kalman-Inspired Feature Propagation for Video Face Super-Resolution

Ruicheng Feng, Chongyi Li, Chen Change Loy•Aug 9, 2024•103

BRAT: Bônus de Token Ortogonal para Inversão Textual Agnóstica de Arquitetura
BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion

James Baker•Aug 8, 2024•92

MooER: Modelos de Reconhecimento e Tradução de Fala baseados em LLM de Moore Threads
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads

Junhao Xu, Zhenlin Liang, Yi Liu, Yichao Hu, Jian Li, Yajun Zheng, Meng Cai, Hua Wang•Aug 9, 2024•82

MulliVC: Conversão de Voz Multilíngue com Consistência de Ciclo
MulliVC: Multi-lingual Voice Conversion With Cycle Consistency

Jiawei Huang, Chen Zhang, Yi Ren, Ziyue Jiang, Zhenhui Ye, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao•Aug 8, 2024•82

Gerando novas hipóteses experimentais a partir de modelos de linguagem: Um estudo de caso sobre generalização cruzada de dativos.
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization

Kanishka Misra, Najoung Kim•Aug 9, 2024•61