ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
April 22nd, 2025
EasyEdit2 : Un cadre de pilotage facile à utiliser pour la modification des grands modèles de langage
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models
Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
•
Apr 21, 2025
•
21
2
LeetCodeDataset : Un ensemble de données temporel pour l'évaluation robuste et l'entraînement efficace des LLM de code
LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs
Yunhui Xia, Wei Shen, Yan Wang, Jason Klein Liu, Huifeng Sun, Siyue Wu, Jian Hu, Xiaolong Xu
•
Apr 20, 2025
•
19
2
Voir sous un autre angle : Évaluer la compréhension multi-vues dans les MLLMs
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs
Chun-Hsiao Yeh, Chenyu Wang, Shengbang Tong, Ta-Ying Cheng, Rouyu Wang, Tianzhe Chu, Yuexiang Zhai, Yubei Chen, Shenghua Gao, Yi Ma
•
Apr 21, 2025
•
22
2
InfiGUI-R1 : Faire évoluer les agents d'interface graphique multimodaux d'acteurs réactifs vers des raisonneurs délibératifs
InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners
Yuhang Liu, Pengxiang Li, Congkai Xie, Xavier Hu, Xiaotian Han, Shengyu Zhang, Hongxia Yang, Fei Wu
•
Apr 19, 2025
•
13
2
LoftUp : Apprentissage d'un suréchantillonneur de caractéristiques basé sur les coordonnées pour les modèles de fondation en vision
LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models
Haiwen Huang, Anpei Chen, Volodymyr Havrylov, Andreas Geiger, Dan Zhang
•
Apr 18, 2025
•
4
2
RF-DETR Détection d'Objets vs YOLOv12 : Une Étude des Architectures Basées sur les Transformers et les CNN pour la Détection de Fruits Verts en Classe Unique et Multi-Classes dans des Environnements Complexes de Vergers sous Ambiguïté d'Étiquetage
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity
Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, Manoj Karkee
•
Apr 17, 2025
•
4
2
FlowReasoner : Renforcement des méta-agents au niveau des requêtes
FlowReasoner: Reinforcing Query-Level Meta-Agents
Hongcheng Gao, Yue Liu, Yufei He, Longxu Dou, Chao Du, Zhijie Deng, Bryan Hooi, Min Lin, Tianyu Pang
•
Apr 21, 2025
•
46
2
SilVar-Med : Un modèle de langage visuel piloté par la parole pour la détection explicable d'anomalies dans l'imagerie médicale
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging
Tan-Hanh Pham, Chris Ngo, Trong-Duong Bui, Minh Luu Quang, Tan-Huong Pham, Truong-Son Hy
•
Apr 14, 2025
•
2
2
NEMOTRON-CROSSTHINK : Élargir l'auto-apprentissage au-delà du raisonnement mathématique
NEMOTRON-CROSSTHINK: Scaling Self-Learning beyond Math Reasoning
Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov, Seungju Han, Ying Lin, Evelina Bakhturi, Eric Nyberg, Yejin Choi, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro
•
Apr 15, 2025
•
6
4
Eagle 2.5 : Renforcement de l'optimisation post-entraînement pour les modèles vision-langage de pointe avec contexte étendu
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models
Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Tuomas Rintamaki, Tyler Poon, Max Ehrlich, Tuomas Rintamaki, Tyler Poon, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu
•
Apr 21, 2025
•
65
5
ToolRL : La récompense est tout ce dont l'apprentissage des outils a besoin
ToolRL: Reward is All Tool Learning Needs
Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji
•
Apr 16, 2025
•
41
2
DRAGON : Les récompenses distributionnelles optimisent les modèles génératifs de diffusion
DRAGON: Distributional Rewards Optimize Diffusion Generative Models
Yatong Bai, Jonah Casebeer, Somayeh Sojoudi, Nicholas J. Bryan
•
Apr 21, 2025
•
10
2
THOUGHTTERMINATOR : Évaluation, Calibration et Atténuation de la Surréflexion dans les Modèles de Raisonnement
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models
Xiao Pu, Michael Saxon, Wenyue Hua, William Yang Wang
•
Apr 17, 2025
•
24
2
Jetez les dés et regardez avant de sauter : Dépasser les limites créatives de la prédiction de token suivant
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction
Vaishnavh Nagarajan, Chen Henry Wu, Charles Ding, Aditi Raghunathan
•
Apr 21, 2025
•
2
2
Apprentissage du raisonnement sous guidance hors politique
Learning to Reason under Off-Policy Guidance
Jianhao Yan, Yafu Li, Zican Hu, Zhi Wang, Ganqu Cui, Xiaoye Qu, Yu Cheng, Yue Zhang
•
Apr 21, 2025
•
77
4
RainbowPlus : Amélioration de la génération de prompts adverses via une recherche évolutive de qualité et de diversité
RainbowPlus: Enhancing Adversarial Prompt Generation via Evolutionary Quality-Diversity Search
Quy-Anh Dang, Chris Ngo, Truong-Son Hy
•
Apr 21, 2025
•
6
8
Un LMM pour une compréhension vidéo efficace via la compression renforcée de cubes vidéo
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
Ji Qi, Yuan Yao, Yushi Bai, Bin Xu, Juanzi Li, Zhiyuan Liu, Tat-Seng Chua
•
Apr 21, 2025
•
10
3
LookingGlass : Anamorphoses génératives via déformation par pyramide laplacienne
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
•
Apr 11, 2025
•
8
6
X-Teaming : Contournements multi-tours et défenses avec des agents multi-adaptatifs
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents
Salman Rahman, Liwei Jiang, James Shiffer, Genglin Liu, Sheriff Issaka, Md Rizwan Parvez, Hamid Palangi, Kai-Wei Chang, Yejin Choi, Saadia Gabriel
•
Apr 15, 2025
•
30
2
OTC : Appels d'outils optimaux via apprentissage par renforcement
OTC: Optimal Tool Calls via Reinforcement Learning
Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji
•
Apr 21, 2025
•
33
2
SphereDiff : Génération d'images et de vidéos panoramiques omnidirectionnelles sans réglage via une représentation latente sphérique
SphereDiff: Tuning-free Omnidirectional Panoramic Image and Video Generation via Spherical Latent Representation
Minho Park, Taewoong Kang, Jooyeol Yun, Sungwon Hwang, Jaegul Choo
•
Apr 19, 2025
•
28
2
CoMotion : Mouvement 3D simultané pour plusieurs personnes
CoMotion: Concurrent Multi-person 3D Motion
Alejandro Newell, Peiyun Hu, Lahav Lipson, Stephan R. Richter, Vladlen Koltun
•
Apr 16, 2025
•
3
2
UFO2 : L'AgentOS de bureau
UFO2: The Desktop AgentOS
Chaoyun Zhang, He Huang, Chiming Ni, Jian Mu, Si Qin, Shilin He, Lu Wang, Fangkai Yang, Pu Zhao, Chao Du, Liqun Li, Yu Kang, Zhao Jiang, Suzhen Zheng, Rujia Wang, Jiaxu Qian, Minghua Ma, Jian-Guang Lou, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
•
Apr 20, 2025
•
27
3
Uni3C : Unification des contrôles précis de caméra améliorée en 3D et de mouvement humain pour la génération de vidéos
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation
Chenjie Cao, Jingkai Zhou, Shikai Li, Jingyun Liang, Chaohui Yu, Fan Wang, Xiangyang Xue, Yanwei Fu
•
Apr 21, 2025
•
18
2
TAPIP3D : Suivi de tout point dans une géométrie 3D persistante
TAPIP3D: Tracking Any Point in Persistent 3D Geometry
Bowei Zhang, Lei Ke, Adam W. Harley, Katerina Fragkiadaki
•
Apr 20, 2025
•
7
2
LearnAct : Agent mobile d'interface graphique en apprentissage par quelques exemples avec un benchmark unifié de démonstration
LearnAct: Few-Shot Mobile GUI Agent with a Unified Demonstration Benchmark
Guangyi Liu, Pengxiang Zhao, Liang Liu, Zhiming Chen, Yuxiang Chai, Shuai Ren, Hao Wang, Shibo He, Wenchao Meng
•
Apr 18, 2025
•
11
2
StyleMe3D : Stylisation avec des priors désentrelacés par des encodeurs multiples sur des Gaussiennes 3D
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians
Cailin Zhuang, Yaoqi Hu, Xuanyang Zhang, Wei Cheng, Jiacheng Bao, Shengqi Liu, Yiying Yang, Xianfang Zeng, Gang Yu, Ming Li
•
Apr 21, 2025
•
23
2
PROMPTEVALS : Un ensemble de données d'assertions et de garde-fous pour des pipelines personnalisés de grands modèles de langage en production
PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines
Reya Vir, Shreya Shankar, Harrison Chase, Will Fu-Hinthorn, Aditya Parameswaran
•
Apr 20, 2025
•
4
2