ChatPaper.aiChatPaper.ai
Inicio

arXiv

HuggingFace

PreciosCuentaEspacio de trabajo

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Artículos de Investigación en IA Diarios

Artículos de investigación en IA seleccionados diariamente con traducciones

Ferret-UI: Comprensión Fundamentada de Interfaces de Usuario Móviles con LLMs Multimodales
Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs

Keen You, Haotian Zhang, Eldon Schoop, Floris Weers, Amanda Swearngin, Jeffrey Nichols, Yinfei Yang, Zhe Gan•Apr 8, 2024•833

MagicTime: Modelos de generación de vídeos time-lapse como simuladores metamórficos
MagicTime: Time-lapse Video Generation Models as Metamorphic Simulators

Shenghai Yuan, Jinfa Huang, Yujun Shi, Yongqi Xu, Ruijie Zhu, Bin Lin, Xinhua Cheng, Li Yuan, Jiebo Luo•Apr 7, 2024•352

SwapAnything: Habilitando el Intercambio Arbitrario de Objetos en la Edición Visual Personalizada
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing

Jing Gu, Yilin Wang, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang•Apr 8, 2024•270

ByteEdit: Potenciar, Cumplir y Acelerar la Edición Generativa de Imágenes
ByteEdit: Boost, Comply and Accelerate Generative Image Editing

Yuxi Ren, Jie Wu, Yanzuo Lu, Huafeng Kuang, Xin Xia, Xionghui Wang, Qianqian Wang, Yixing Zhu, Pan Xie, Shiyin Wang, Xuefeng Xiao, Yitong Wang, Min Zheng, Lean Fu•Apr 7, 2024•271

UniFL: Mejora de Stable Diffusion mediante Aprendizaje Unificado por Retroalimentación
UniFL: Improve Stable Diffusion via Unified Feedback Learning

Jiacheng Zhang, Jie Wu, Yuxi Ren, Xin Xia, Huafeng Kuang, Pan Xie, Jiashi Li, Xuefeng Xiao, Weilin Huang, Min Zheng, Lean Fu, Guanbin Li•Apr 8, 2024•261

SpatialTracker: Seguimiento de cualquier píxel 2D en el espacio 3D
SpatialTracker: Tracking Any 2D Pixels in 3D Space

Yuxi Xiao, Qianqian Wang, Shangzhan Zhang, Nan Xue, Sida Peng, Yujun Shen, Xiaowei Zhou•Apr 5, 2024•261

BeyondScene: Generación de Escenas Centradas en Humanos de Mayor Resolución con Difusión Preentrenada
BeyondScene: Higher-Resolution Human-Centric Scene Generation With Pretrained Diffusion

Gwanghyun Kim, Hayeon Kim, Hoigi Seo, Dong Un Kang, Se Young Chun•Apr 6, 2024•240

MA-LMM: Modelo Multimodal Grande Aumentado con Memoria para la Comprensión de Videos a Largo Plazo
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding

Bo He, Hengduo Li, Young Kyun Jang, Menglin Jia, Xuefei Cao, Ashish Shah, Abhinav Shrivastava, Ser-Nam Lim•Apr 8, 2024•230

PhysAvatar: Aprendiendo la Física de Avatares 3D Vestidos a partir de Observaciones Visuales
PhysAvatar: Learning the Physics of Dressed 3D Avatars from Visual Observations

Yang Zheng, Qingqing Zhao, Guandao Yang, Wang Yifan, Donglai Xiang, Florian Dubost, Dmitry Lagun, Thabo Beeler, Federico Tombari, Leonidas Guibas, Gordon Wetzstein•Apr 5, 2024•180

YaART: Otra Tecnología Más de Renderizado ART
YaART: Yet Another ART Rendering Technology

Sergey Kastryulin, Artem Konev, Alexander Shishenya, Eugene Lyapustin, Artem Khurshudov, Alexander Tselousov, Nikita Vinokurov, Denis Kuznedelev, Alexander Markovich, Grigoriy Livshits, Alexey Kirillov, Anastasiia Tabisheva, Liubov Chubarova, Marina Kaminskaia, Alexander Ustyuzhanin, Artemii Shvetsov, Daniil Shlenskii, Valerii Startsev, Dmitrii Kornilov, Mikhail Romanov, Artem Babenko, Sergei Ovcharenko, Valentin Khrulkov•Apr 8, 2024•170

MoMA: Adaptador Multimodal de LLM para Generación Rápida de Imágenes Personalizadas
MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation

Kunpeng Song, Yizhe Zhu, Bingchen Liu, Qing Yan, Ahmed Elgammal, Xiao Yang•Apr 8, 2024•152

Alineación de Modelos de Difusión mediante la Optimización de la Utilidad Humana
Aligning Diffusion Models by Optimizing Human Utility

Shufan Li, Konstantinos Kallidromitis, Akash Gokul, Yusuke Kato, Kazuki Kozuka•Apr 6, 2024•151

Diffusion-RWKV: Escalando Arquitecturas Similares a RWKV para Modelos de Difusión
Diffusion-RWKV: Scaling RWKV-Like Architectures for Diffusion Models

Zhengcong Fei, Mingyuan Fan, Changqian Yu, Debang Li, Junshi Huang•Apr 6, 2024•130

DATENeRF: Edición Basada en Texto con Conciencia de Profundidad en NeRFs
DATENeRF: Depth-Aware Text-based Editing of NeRFs

Sara Rojas, Julien Philip, Kai Zhang, Sai Bi, Fujun Luan, Bernard Ghanem, Kalyan Sunkavall•Apr 6, 2024•110

Koala: Modelo de lenguaje de video largo condicionado por fotogramas clave
Koala: Key frame-conditioned long video-LLM

Reuben Tan, Ximeng Sun, Ping Hu, Jui-hsien Wang, Hanieh Deilamsalehy, Bryan A. Plummer, Bryan Russell, Kate Saenko•Apr 5, 2024•72