ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
October 14th, 2024
Relatório Técnico Baichuan-Omni
Baichuan-Omni Technical Report
Yadong Li, Haoze Sun, Mingan Lin, Tianpeng Li, Guosheng Dong, Tao Zhang, Bowen Ding, Wei Song, Zhenglin Cheng, Yuqi Huo, Song Chen, Xu Li, Da Pan, Shusen Zhang, Xin Wu, Zheng Liang, Jun Liu, Tao Zhang, Keer Lu, Yaqi Zhao, Yanjun Shen, Fan Yang, Kaicheng Yu, Tao Lin, Jianhua Xu, Zenan Zhou, Weipeng Chen
•
Oct 11, 2024
•
88
8
Meissonic: Revitalizando Transformadores Generativos Mascaramentados para uma Síntese Eficiente de Texto para Imagem em Alta Resolução
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis
Jinbin Bai, Tian Ye, Wei Chow, Enxin Song, Qing-Guo Chen, Xiangtai Li, Zhen Dong, Lei Zhu, Shuicheng Yan
•
Oct 10, 2024
•
52
2
StructRAG: Impulsionando o Raciocínio Intensivo em Conhecimento de LLMs por meio da Estruturação Híbrida de Informações no Momento da Inferência
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization
Zhuoqun Li, Xuanang Chen, Haiyang Yu, Hongyu Lin, Yaojie Lu, Qiaoyu Tang, Fei Huang, Xianpei Han, Le Sun, Yongbin Li
•
Oct 11, 2024
•
50
2
De Generalista a Especialista: Adaptando Modelos de Linguagem Visual por meio de Ajuste de Instrução Visual Específica da Tarefa
From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning
Yang Bai, Yang Zhou, Jun Zhou, Rick Siow Mong Goh, Daniel Shu Wei Ting, Yong Liu
•
Oct 9, 2024
•
38
2
Seleção Colaborativa de Dados entre Múltiplos Agentes para Pré-treinamento Eficiente de LLM
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining
Tianyi Bai, Ling Yang, Zhen Hao Wong, Jiahui Peng, Xinlin Zhuang, Chi Zhang, Lijun Wu, Qiu Jiantao, Wentao Zhang, Binhang Yuan, Conghui He
•
Oct 10, 2024
•
20
2
Permutabilidade Mecânica: Corresponder Características Entre Camadas
Mechanistic Permutability: Match Features Across Layers
Nikita Balagansky, Ian Maksimov, Daniil Gavrilov
•
Oct 10, 2024
•
19
2
EvolveDirector: Abordando a Geração Avançada de Texto para Imagem com Modelos de Visão-Linguagem de Grande Escala
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models
Rui Zhao, Hangjie Yuan, Yujie Wei, Shiwei Zhang, Yuchao Gu, Lingmin Ran, Xiang Wang, Zhangjie Wu, Junhao Zhang, Yingya Zhang, Mike Zheng Shou
•
Oct 9, 2024
•
19
2
SuperCorrigir: Supervisionar e Corrigir Modelos de Linguagem com Insights Orientados por Erros
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights
Ling Yang, Zhaochen Yu, Tianjun Zhang, Minkai Xu, Joseph E. Gonzalez, Bin Cui, Shuicheng Yan
•
Oct 11, 2024
•
17
3
PositionID: LLMs podem Controlar Comprimentos, Copiar e Colar com Consciência Posicional Explícita
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness
Zekun Wang, Feiyu Duan, Yibo Zhang, Wangchunshu Zhou, Ke Xu, Wenhao Huang, Jie Fu
•
Oct 9, 2024
•
17
2
Amostragem de Destilação de Pontuação Semântica para Geração Texto-para-3D Composicional
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation
Ling Yang, Zixiang Zhang, Junlin Han, Bohan Zeng, Runjia Li, Philip Torr, Wentao Zhang
•
Oct 11, 2024
•
14
2
Previsão de KV para Melhoria do Tempo até o Primeiro Token
KV Prediction for Improved Time to First Token
Maxwell Horton, Qingqing Cao, Chenfan Sun, Yanzi Jin, Sachin Mehta, Mohammad Rastegari, Moin Nabi
•
Oct 10, 2024
•
12
2
Pense Enquanto Gera: Difusão Discreta com Desnublamento Planejado
Think While You Generate: Discrete Diffusion with Planned Denoising
Sulin Liu, Juno Nam, Andrew Campbell, Hannes Stärk, Yilun Xu, Tommi Jaakkola, Rafael Gómez-Bombarelli
•
Oct 8, 2024
•
11
3
ZeroComp: Composição de Objetos sem Necessidade de Anotações a partir de Intrínsecos da Imagem via Difusão
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion
Zitian Zhang, Frédéric Fortier-Chouinard, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Oct 10, 2024
•
9
3
I-Max: Maximizar o Potencial de Resolução dos Transformadores de Fluxo Retificado Pré-treinados com Fluxo Projetado
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
Ruoyi Du, Dongyang Liu, Le Zhuo, Qin Qi, Hongsheng Li, Zhanyu Ma, Peng Gao
•
Oct 10, 2024
•
5
2
DA-Code: Benchmark de Geração de Código de Ciência de Dados de Agentes para Modelos de Linguagem Grandes
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models
Yiming Huang, Jianwen Luo, Yan Yu, Yitong Zhang, Fangyu Lei, Yifan Wei, Shizhu He, Lifu Huang, Xiao Liu, Jun Zhao, Kang Liu
•
Oct 9, 2024
•
5
3
MiRAGeNews: Detecção de Notícias Geradas por IA Multimodal Realistas
MiRAGeNews: Multimodal Realistic AI-Generated News Detection
Runsheng Huang, Liam Dugan, Yue Yang, Chris Callison-Burch
•
Oct 11, 2024
•
4
2
SimpleStrat: Diversificando a Geração de Modelos de Linguagem com Estratificação
SimpleStrat: Diversifying Language Model Generation with Stratification
Justin Wong, Yury Orlovskiy, Michael Luo, Sanjit A. Seshia, Joseph E. Gonzalez
•
Oct 11, 2024
•
4
2
Mentor-KD: Tornando Modelos de Linguagem Pequenos em Melhores Raciocinadores Multietapa
Mentor-KD: Making Small Language Models Better Multi-step Reasoners
Hojae Lee, Junho Kim, SangKeun Lee
•
Oct 11, 2024
•
4
2
GenARM: Geração Guiada por Recompensa com Modelo de Recompensa Autoregressivo para Alinhamento em Tempo de Teste
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment
Yuancheng Xu, Udari Madhushani Sehwag, Alec Koppel, Sicheng Zhu, Bang An, Furong Huang, Sumitra Ganesh
•
Oct 10, 2024
•
4
2
Synth-SONAR: Síntese de Imagens Sonar com Diversidade e Realismo Aprimorados através de Modelos de Difusão Dupla e Estímulo do GPT
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting
Purushothaman Natarajan, Kamal Basha, Athira Nambiar
•
Oct 11, 2024
•
1
2