ChatPaper.aiChatPaper.ai
Início

arXiv

HuggingFace

PreçosContaÁrea de trabalho

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Artigos de Pesquisa em IA Diários

Artigos de pesquisa em IA selecionados diariamente com traduções

Dimensionar de forma otimizada o cálculo do tempo de teste do LLM pode ser mais eficaz do que dimensionar os parâmetros do modelo.
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters

Charlie Snell, Jaehoon Lee, Kelvin Xu, Aviral Kumar•Aug 6, 2024•633

MMIU: Compreensão Multimodal Multi-imagem para Avaliar Modelos de Visão-Linguagem de Grande Escala
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models

Fanqing Meng, Jin Wang, Chuanhao Li, Quanfeng Lu, Hao Tian, Jiaqi Liao, Xizhou Zhu, Jifeng Dai, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao•Aug 5, 2024•623

LLaVA-OneVision: Transferência Fácil de Tarefas Visuais
LLaVA-OneVision: Easy Visual Task Transfer

Bo Li, Yuanhan Zhang, Dong Guo, Renrui Zhang, Feng Li, Hao Zhang, Kaichen Zhang, Yanwei Li, Ziwei Liu, Chunyuan Li•Aug 6, 2024•612

Um Objeto Vale 64x64 Pixels: Gerando Objeto 3D via Difusão de Imagem
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion

Xingguang Yan, Han-Hung Lee, Ziyu Wan, Angel X. Chang•Aug 6, 2024•413

MedTrinity-25M: Um conjunto de dados multimodal em larga escala com anotações multigranulares para a área da Medicina.
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine

Yunfei Xie, Ce Zhou, Lang Gao, Juncheng Wu, Xianhang Li, Hong-Yu Zhou, Sheng Liu, Lei Xing, James Zou, Cihang Xie, Yuyin Zhou•Aug 6, 2024•302

IPAdapter-Instruct: Resolvendo Ambiguidade na Condicionamento Baseado em Imagens usando Instruções Instruct
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts

Ciara Rowles, Shimon Vainer, Dante De Nigris, Slava Elizarov, Konstantin Kutsy, Simon Donné•Aug 6, 2024•232

CoverBench: Um Desafiador Benchmark para Verificação de Alegações Complexas
CoverBench: A Challenging Benchmark for Complex Claim Verification

Alon Jacovi, Moran Ambar, Eyal Ben-David, Uri Shaham, Amir Feder, Mor Geva, Dror Marcus, Avi Caciularu•Aug 6, 2024•152

Modelos de Difusão como Ferramentas de Mineração de Dados
Diffusion Models as Data Mining Tools

Ioannis Siglidis, Aleksander Holynski, Alexei A. Efros, Mathieu Aubry, Shiry Ginosar•Jul 20, 2024•142

ReSyncer: Refatoração do Gerador Baseado em Estilo para Integração de Áudio-Visualmente Sincronizado com Atuação Facial
ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer

Jiazhi Guan, Zhiliang Xu, Hang Zhou, Kaisiyuan Wang, Shengyi He, Zhanwang Zhang, Borong Liang, Haocheng Feng, Errui Ding, Jingtuo Liu, Jingdong Wang, Youjian Zhao, Ziwei Liu•Aug 6, 2024•112

Síntese de Dados Texto-para-SQL de LLMs Fracos e Fortes
Synthesizing Text-to-SQL Data from Weak and Strong LLMs

Jiaxi Yang, Binyuan Hui, Min Yang, Jian Yang, Junyang Lin, Chang Zhou•Aug 6, 2024•112

StructEval: Aprofundando e Ampliando a Avaliação de Modelos de Linguagem Grandes por Meio de Avaliação Estruturada
StructEval: Deepen and Broaden Large Language Model Assessment via Structured Evaluation

Boxi Cao, Mengjie Ren, Hongyu Lin, Xianpei Han, Feng Zhang, Junfeng Zhan, Le Sun•Aug 6, 2024•102

AVESFormer: Design eficiente de Transformer para Segmentação Audiovisual em Tempo Real
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation

Zili Wang, Qi Yang, Linsu Shi, Jiazhong Yu, Qinghua Liang, Fei Li, Shiming Xiang•Aug 3, 2024•42