ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
February 7th, 2025
MotionLab : Génération et Édition Unifiées des Mouvements Humains via le Paradigme Mouvement-Condition-Mouvement
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm
Ziyan Guo, Zeyu Hu, Na Zhao, De Wen Soh
•
Feb 4, 2025
•
18
3
Apprentissage des dynamiques vidéo d'actions réelles avec une autorégression masquée hétérogène
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression
Lirui Wang, Kevin Zhao, Chaoqi Liu, Xinlei Chen
•
Feb 6, 2025
•
6
3
Vers une compréhension physique dans la génération de vidéos : Une approche de régularisation de points 3D
Towards Physical Understanding in Video Generation: A 3D Point Regularization Approach
Yunuo Chen, Junli Cao, Anil Kag, Vidit Goel, Sergei Korolev, Chenfanfu Jiang, Sergey Tulyakov, Jian Ren
•
Feb 5, 2025
•
9
3
PlotGen : Visualisation de données scientifiques basée sur le modèle de langage multimodal multi-agent via un retour multimodal
PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
6
2
Diffusion de faible à forte intensité avec réflexion
Weak-to-Strong Diffusion with Reflection
Lichen Bai, Masashi Sugiyama, Zeke Xie
•
Feb 1, 2025
•
23
2
Ola : Repousser les frontières du modèle de langue omni-modal avec l'alignement progressif de la modalité
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
Zuyan Liu, Yuhao Dong, Jiahui Wang, Ziwei Liu, Winston Hu, Jiwen Lu, Yongming Rao
•
Feb 6, 2025
•
30
2
MotionCanvas : Conception de plans cinématographiques avec génération d'images vers vidéos contrôlable
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation
Jinbo Xing, Long Mai, Cusuh Ham, Jiahui Huang, Aniruddha Mahapatra, Chi-Wing Fu, Tien-Tsin Wong, Feng Liu
•
Feb 6, 2025
•
18
3
MAGA : Réformulation massive de genre-audience pour l'expansion du corpus de pré-entraînement
MAGA: MAssive Genre-Audience Reformulation to Pretraining Corpus Expansion
Xintong Hao, Ke Shen, Chenggang Li
•
Feb 6, 2025
•
22
2
Analyser le Flux de Caractéristiques pour Améliorer l'Interprétation et le Pilotage dans les Modèles de Langue
Analyze Feature Flow to Enhance Interpretation and Steering in Language Models
Daniil Laptev, Nikita Balagansky, Yaroslav Aksenov, Daniil Gavrilov
•
Feb 5, 2025
•
60
2
Améliorer la génération de code pour les langues à faibles ressources : Pas de solution miracle
Enhancing Code Generation for Low-Resource Languages: No Silver Bullet
Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
•
Jan 31, 2025
•
5
2
ScoreFlow : Maîtrise des flux de travail des agents LLM via l'optimisation des préférences basée sur les scores
ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization
Yinjie Wang, Ling Yang, Guohao Li, Mengdi Wang, Bryon Aragam
•
Feb 6, 2025
•
19
2
ChartCitor : Cadre Multi-Agent pour l'Attribution Visuelle Fine des Graphiques
ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
7
2
UltraIF : Faire progresser le suivi des instructions depuis le terrain
UltraIF: Advancing Instruction Following from the Wild
Kaikai An, Li Sheng, Ganqu Cui, Shuzheng Si, Ning Ding, Yu Cheng, Baobao Chang
•
Feb 6, 2025
•
23
2
DynVFX : Augmentation de vidéos réelles avec du contenu dynamique
DynVFX: Augmenting Real Videos with Dynamic Content
Danah Yatim, Rafail Fridman, Omer Bar-Tal, Tali Dekel
•
Feb 5, 2025
•
30
3
Llasa : Mise à l'échelle du calcul du temps d'entraînement et du temps d'inférence pour la synthèse vocale basée sur Llama
Llasa: Scaling Train-Time and Inference-Time Compute for Llama-based Speech Synthesis
Zhen Ye, Xinfa Zhu, Chi-Min Chan, Xinsheng Wang, Xu Tan, Jiahe Lei, Yi Peng, Haohe Liu, Yizhu Jin, Zheqi DAI, Hongzhan Lin, Jianyi Chen, Xingjian Du, Liumeng Xue, Yunlin Chen, Zhifei Li, Lei Xie, Qiuqiang Kong, Yike Guo, Wei Xue
•
Feb 6, 2025
•
25
4
Les grands modèles pensent de la même manière, ce qui compromet la surveillance de l'IA.
Great Models Think Alike and this Undermines AI Oversight
Shashwat Goel, Joschka Struber, Ilze Amanda Auzina, Karuna K Chandra, Ponnurangam Kumaraguru, Douwe Kiela, Ameya Prabhu, Matthias Bethge, Jonas Geiping
•
Feb 6, 2025
•
34
2
ConceptAttention : Les transformateurs de diffusion apprennent des caractéristiques hautement interprétables
ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features
Alec Helbling, Tuna Han Salih Meral, Ben Hoover, Pinar Yanardag, Duen Horng Chau
•
Feb 6, 2025
•
38
3
Performance médaillée d'or dans la résolution de la géométrie olympique avec AlphaGeometry2
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
•
Feb 5, 2025
•
44
5
Au-delà du contenu de l'invite : Amélioration des performances de LLM via l'optimisation intégrée de l'invite de format de contenu
Beyond Prompt Content: Enhancing LLM Performance via Content-Format Integrated Prompt Optimization
Yuanye Liu, Jiahang Xu, Li Lyna Zhang, Qi Chen, Xuan Feng, Yang Chen, Zhongxin Guo, Yuqing Yang, Cheng Peng
•
Feb 6, 2025
•
13
2
Parler facilement : Susciter des jailbreaks nuisibles des LLMs avec des interactions simples
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions
Yik Siu Chan, Narutatsu Ri, Yuxin Xiao, Marzyeh Ghassemi
•
Feb 6, 2025
•
3
2
PILAF : Échantillonnage optimal des préférences humaines pour la modélisation des récompenses
PILAF: Optimal Human Preference Sampling for Reward Modeling
Yunzhen Feng, Ariel Kwiatkowski, Kunhao Zheng, Julia Kempe, Yaqi Duan
•
Feb 6, 2025
•
11
2
BOLT : Bootstrap Long Chain-of-Thought dans les Modèles de Langage sans Distillation
BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation
Bo Pang, Hanze Dong, Jiacheng Xu, Silvio Savarese, Yingbo Zhou, Caiming Xiong
•
Feb 6, 2025
•
24
2