ChatPaper.aiChatPaper.ai
Home

arXiv

HuggingFace

PrijzenAccountWerkruimte

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

AI Onderzoekspapers Dagelijks

Dagelijks geselecteerde AI onderzoekspapers met vertalingen

Opkomende eigenschappen in geünificeerde multimodale voorafgaande training
Emerging Properties in Unified Multimodal Pretraining

Chaorui Deng, Deyao Zhu, Kunchang Li, Chenhui Gou, Feng Li, Zeyu Wang, Shu Zhong, Weihao Yu, Xiaonan Nie, Ziang Song, Guang Shi, Haoqi Fan•May 20, 2025•1043

SageAttention3: Microscaling FP4 Attention voor Inferentie en een Verkenning van 8-Bits Training
SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

Jintao Zhang, Jia Wei, Pengle Zhang, Xiaoming Xu, Haofeng Huang, Haoxu Wang, Kai Jiang, Jun Zhu, Jianfei Chen•May 16, 2025•522

Optimaliseren van Anytime Redeneren via Budget Relatief Beleidsoptimalisatie
Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Penghui Qi, Zichen Liu, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin•May 19, 2025•312

VisualQuality-R1: Redenering-Gestuurde Beoordeling van Beeldkwaliteit via Reinforcement Learning voor Rangschikking
VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank

Tianhe Wu, Jian Zou, Jie Liang, Lei Zhang, Kede Ma•May 20, 2025•283

Neurosymbolische Diffusiemodellen
Neurosymbolic Diffusion Models

Emile van Krieken, Pasquale Minervini, Edoardo Ponti, Antonio Vergari•May 19, 2025•282

Beloningsredeneermodel
Reward Reasoning Model

Jiaxin Guo, Zewen Chi, Li Dong, Qingxiu Dong, Xun Wu, Shaohan Huang, Furu Wei•May 20, 2025•262

Visuele Agentische Versterkingsfine-tuning
Visual Agentic Reinforcement Fine-Tuning

Ziyu Liu, Yuhang Zang, Yushan Zou, Zijian Liang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi Wang•May 20, 2025•262

Latente Stroom Transformer
Latent Flow Transformer

Yen-Chen Wu, Feng-Ting Liao, Meng-Hsi Chen, Pei-Chen Ho, Farhang Nabiei, Da-shan Shiu•May 20, 2025•222

Het Aloe Family Recept voor Open en Gespecialiseerde Gezondheidszorg-LLM's
The Aloe Family Recipe for Open and Specialized Healthcare LLMs

Dario Garcia-Gasulla, Jordi Bayarri-Planas, Ashwin Kumar Gururajan, Enrique Lopez-Cuena, Adrian Tormos, Daniel Hinjos, Pablo Bernabeu-Perez, Anna Arias-Duart, Pablo Agustin Martin-Torres, Marta Gonzalez-Mallo, Sergio Alvarez-Napagao, Eduard Ayguadé-Parra, Ulises Cortés•May 7, 2025•202

Denk alleen wanneer het nodig is met grote hybride-redeneermodellen
Think Only When You Need with Large Hybrid-Reasoning Models

Lingjie Jiang, Xun Wu, Shaohan Huang, Qingxiu Dong, Zewen Chi, Li Dong, Xingxing Zhang, Tengchao Lv, Lei Cui, Furu Wei•May 20, 2025•162

Redeneermodellen kunnen hun vertrouwen beter uitdrukken
Reasoning Models Better Express Their Confidence

Dongkeun Yoon, Seungone Kim, Sohee Yang, Sunkyoung Kim, Soyeon Kim, Yongil Kim, Eunbi Choi, Yireun Kim, Minjoon Seo•May 20, 2025•162

General-Reasoner: Verbetering van LLM-redenering in alle domeinen
General-Reasoner: Advancing LLM Reasoning Across All Domains

Xueguang Ma, Qian Liu, Dongfu Jiang, Ge Zhang, Zejun Ma, Wenhu Chen•May 20, 2025•155

Redeneringspadcompressie: Het comprimeren van generatietrajecten voor efficiënt redeneren met grote taalmodellen
Reasoning Path Compression: Compressing Generation Trajectories for Efficient LLM Reasoning

Jiwon Song, Dongwon Jo, Yulhwa Kim, Jae-Joon Kim•May 20, 2025•142

Visionary-R1: Het beperken van shortcuts in visueel redeneren met reinforcement learning
Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning

Jiaer Xia, Yuhang Zang, Peng Gao, Yixuan Li, Kaiyang Zhou•May 20, 2025•132

Het verkennen van gefedereerd snoeien voor grote taalmodellen
Exploring Federated Pruning for Large Language Models

Pengxin Guo, Yinong Wang, Wei Li, Mengting Liu, Ming Li, Jinkai Zheng, Liangqiong Qu•May 19, 2025•132

Trainingsvrije watermerken voor autoregressieve beeldgeneratie
Training-Free Watermarking for Autoregressive Image Generation

Yu Tong, Zihao Pan, Shuai Yang, Kaiyang Zhou•May 20, 2025•122

VideoEval-Pro: Robuuste en Realistische Evaluatie van Langdurige Videobegrip
VideoEval-Pro: Robust and Realistic Long Video Understanding Evaluation

Wentao Ma, Weiming Ren, Yiming Jia, Zhuofeng Li, Ping Nie, Ge Zhang, Wenhu Chen•May 20, 2025•112

Hunyuan-Game: Industrieel Intelligent Spelcreatiemodel
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model

Ruihuang Li, Caijin Zhou, Shoujian Zheng, Jianxiang Lu, Jiabin Huang, Comi Chen, Junshu Tang, Guangzheng Xu, Jiale Tao, Hongmei Wang, Donghao Li, Wenqing Yu, Senbo Wang, Zhimin Li, Yetshuan Shi, Haoyu Yang, Yukun Wang, Wenxun Dai, Jiaqi Li, Linqing Wang, Qixun Wang, Zhiyong Xu, Yingfang Zhang, Jiangfeng Xiong, Weijie Kong, Chao Zhang, Hongxin Zhang, Qiaoling Zheng, Weiting Guo, Xinchi Deng, Yixuan Li, Renjia Wei, Yulin Jian, Duojun Huang, Xuhua Ren, Sihuan Lin, Yifu Sun, Yuan Zhou, Joey Wang, Qin Lin, Jingmiao Yu, Jihong Zhang, Caesar Zhong, Di Wang, Yuhong Liu, Linus, Jie Jiang, Longhuang Wu, Shuai Shao, Qinglin Lu•May 20, 2025•102

Fine-tuning van gekwantiseerde neurale netwerken met zeroth-order optimalisatie
Fine-tuning Quantized Neural Networks with Zeroth-order Optimization

Sifeng Shang, Jiayi Zhou, Chenyu Lin, Minxian Li, Kaiyang Zhou•May 19, 2025•102

CS-Sum: Een Benchmark voor Code-Switching Dialoogsamenvatting en de Grenzen van Grote Taalmodellen
CS-Sum: A Benchmark for Code-Switching Dialogue Summarization and the Limits of Large Language Models

Sathya Krishnan Suresh, Tanmay Surana, Lim Zhi Hao, Eng Siong Chng•May 19, 2025•103

SSR: Verbetering van dieptewaarneming in visueel-taalkundige modellen via beredeneeringsgestuurd ruimtelijk redeneren
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning

Yang Liu, Ming Ma, Xiaomin Yu, Pengxiang Ding, Han Zhao, Mingyang Sun, Siteng Huang, Donglin Wang•May 18, 2025•102

Twee Experts Zijn Genoeg om Denkprocessen te Sturen: Het Versterken van Cognitieve Inspanning in MoE-Redeneermodellen Zonder Extra Training
Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training

Mengru Wang, Xingyu Chen, Yue Wang, Zhiwei He, Jiahao Xu, Tian Liang, Qiuzhi Liu, Yunzhi Yao, Wenxuan Wang, Ruotian Ma, Haitao Mi, Ningyu Zhang, Zhaopeng Tu, Xiaolong Li, Dong Yu•May 20, 2025•92

NExT-Search: Het herontwerpen van het gebruikersfeedback-ecosysteem voor generatieve AI-zoekopdrachten
NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search

Sunhao Dai, Wenjie Wang, Liang Pang, Jun Xu, See-Kiong Ng, Ji-Rong Wen, Tat-Seng Chua•May 20, 2025•92

Visuele Instructie Bottleneck Afstemming
Visual Instruction Bottleneck Tuning

Changdae Oh, Jiatong Li, Shawn Im, Yixuan Li•May 20, 2025•92

Lessons uit de verdediging van Gemini tegen indirecte promptinjecties
Lessons from Defending Gemini Against Indirect Prompt Injections

Chongyang Shi, Sharon Lin, Shuang Song, Jamie Hayes, Ilia Shumailov, Itay Yona, Juliette Pluto, Aneesh Pappu, Christopher A. Choquette-Choo, Milad Nasr, Chawin Sitawarin, Gena Gibson, Andreas Terzis, John "Four" Flynn•May 20, 2025•82

Niet Alle Juiste Antwoorden Zijn Gelijk: Waarom Je Distillatiebron Belangrijk Is
Not All Correct Answers Are Equal: Why Your Distillation Source Matters

Xiaoyu Tian, Yunjie Ji, Haotian Wang, Shuaiting Chen, Sitong Zhao, Yiping Peng, Han Zhao, Xiangang Li•May 20, 2025•82

Naar het ontlokken van latente kennis uit LLM's met mechanistische interpreteerbaarheid
Towards eliciting latent knowledge from LLMs with mechanistic interpretability

Bartosz Cywiński, Emil Ryd, Senthooran Rajamanoharan, Neel Nanda•May 20, 2025•82

De Hallucinatiebelasting van Reinforcement Finetuning
The Hallucination Tax of Reinforcement Finetuning

Linxin Song, Taiwei Shi, Jieyu Zhao•May 20, 2025•72

Vox-Profile: Een Benchmark voor Spraakfundamentmodellen voor het Karakteriseren van Diverse Spreker- en Spraakkenmerken
Vox-Profile: A Speech Foundation Model Benchmark for Characterizing Diverse Speaker and Speech Traits

Tiantian Feng, Jihwan Lee, Anfeng Xu, Yoonjeong Lee, Thanathai Lertpetchpun, Xuan Shi, Helin Wang, Thomas Thebaud, Laureano Moro-Velazquez, Dani Byrd, Najim Dehak, Shrikanth Narayanan•May 20, 2025•62

Warm Up Voordat Je Traint: Algemene Redeneervaardigheden Ontgrendelen in Omgevingen met Beperkte Middelen
Warm Up Before You Train: Unlocking General Reasoning in Resource-Constrained Settings

Safal Shrestha, Minwu Kim, Aadim Nepal, Anubhav Shrestha, Keith Ross•May 19, 2025•62

7.400 Bugs Repareren voor 1$: Goedkope Crash-Site Programmaherstel
Fixing 7,400 Bugs for 1$: Cheap Crash-Site Program Repair

Han Zheng, Ilia Shumailov, Tianqi Fan, Aiden Hall, Mathias Payer•May 19, 2025•62

Waarheidsneuronen
Truth Neurons

Haohang Li, Yupeng Cao, Yangyang Yu, Jordan W. Suchow, Zining Zhu•May 18, 2025•62

Phare: Een Veiligheidsonderzoek voor Grote Taalmodellen
Phare: A Safety Probe for Large Language Models

Pierre Le Jeune, Benoît Malézieux, Weixuan Xiao, Matteo Dora•May 16, 2025•62

MIGRATION-BENCH: Repository-Level Code Migratie Benchmark van Java 8
MIGRATION-BENCH: Repository-Level Code Migration Benchmark from Java 8

Linbo Liu, Xinle Liu, Qiang Zhou, Lin Chen, Yihan Liu, Hoan Nguyen, Behrooz Omidvar-Tehrani, Xi Shen, Jun Huan, Omer Tripp, Anoop Deoras•May 14, 2025•62

CompeteSMoE -- Statisch Gegarandeerde Training van Mixture of Experts via Competitie
CompeteSMoE -- Statistically Guaranteed Mixture of Experts Training via Competition

Nam V. Nguyen, Huy Nguyen, Quang Pham, Van Nguyen, Savitha Ramasamy, Nhat Ho•May 19, 2025•52

Solve-Detect-Verify: Schaalbaarheid tijdens Inferentie met Flexibele Generatieve Verificatie
Solve-Detect-Verify: Inference-Time Scaling with Flexible Generative Verifier

Jianyuan Zhong, Zeju Li, Zhijian Xu, Xiangyu Wen, Kezhi Li, Qiang Xu•May 17, 2025•52

Heroverweging van de optimale verificatiegranulariteit voor reken-efficiënte schaling tijdens testtijd
Rethinking Optimal Verification Granularity for Compute-Efficient Test-Time Scaling

Hao Mark Chen, Guanxi Lu, Yasuyuki Okoshi, Zhiwen Mo, Masato Motomura, Hongxiang Fan•May 16, 2025•52

Bidirectionele Taalmodellen zijn Betere Kennismemorisators? Een Benchmark voor Injectie van Real-world Kennis
Bidirectional LMs are Better Knowledge Memorizers? A Benchmark for Real-world Knowledge Injection

Yuwei Zhang, Wenhao Yu, Shangbin Feng, Yifan Zhu, Letian Peng, Jayanth Srinivasa, Gaowen Liu, Jingbo Shang•May 18, 2025•42

Zal AI liegen om zieke kinderen te redden? Een lakmoesproef voor AI-waardeprioritering met AIRiskDilemmas
Will AI Tell Lies to Save Sick Children? Litmus-Testing AI Values Prioritization with AIRiskDilemmas

Yu Ying Chiu, Zhilin Wang, Sharan Maiya, Yejin Choi, Kyle Fish, Sydney Levine, Evan Hubinger•May 20, 2025•32

CoIn: Het tellen van de onzichtbare redeneertokens in commerciële ondoorzichtige LLM-API's
CoIn: Counting the Invisible Reasoning Tokens in Commercial Opaque LLM APIs

Guoheng Sun, Ziyao Wang, Bowei Tian, Meng Liu, Zheyu Shen, Shwai He, Yexiao He, Wanghao Ye, Yiting Wang, Ang Li•May 19, 2025•32

Bias of geen Bias: Het detecteren van bias in nieuws met een bias-detector
To Bias or Not to Bias: Detecting bias in News with bias-detector

Himel Ghosh, Ahmed Mosharafa, Georg Groh•May 19, 2025•32

Het integreren van hersen-geïnspireerde mechanismen voor multimodale leren in kunstmatige intelligentie
Incorporating brain-inspired mechanisms for multimodal learning in artificial intelligence

Xiang He, Dongcheng Zhao, Yang Li, Qingqun Kong, Xin Yang, Yi Zeng•May 15, 2025•32

Tokenisatiebeperkingen in LLM's: Een onderzoek naar de grenzen van symbolisch en rekenkundig redeneren
Tokenization Constraints in LLMs: A Study of Symbolic and Arithmetic Reasoning Limits

Xiang Zhang, Juntai Cao, Jiaqi Wei, Yiwei Xu, Chenyu You•May 20, 2025•22

GeoRanker: Afstandsbewuste rangschikking voor wereldwijde beeldgeolokalisatie
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization

Pengyue Jia, Seongheon Park, Song Gao, Xiangyu Zhao, Yixuan Li•May 19, 2025•22

Leren om audio te benadrukken door films te bekijken
Learning to Highlight Audio by Watching Movies

Chao Huang, Ruohan Gao, J. M. F. Tsang, Jan Kurcius, Cagdas Bilen, Chenliang Xu, Anurag Kumar, Sanjeel Parekh•May 17, 2025•22

Maskeren in Multi-hop QA: Een analyse van hoe taalmodelen presteren bij contextpermutatie
Masking in Multi-hop QA: An Analysis of How Language Models Perform with Context Permutation

Wenyu Huang, Pavlos Vougiouklis, Mirella Lapata, Jeff Z. Pan•May 16, 2025•22

KERL: Gepersonaliseerde Receptaanbeveling met Kennisverrijking via Grote Taalmodellen
KERL: Knowledge-Enhanced Personalized Recipe Recommendation using Large Language Models

Fnu Mohbat, Mohammed J Zaki•May 20, 2025•12

Dynadiff: Enkelfasige decodering van afbeeldingen uit continu evoluerende fMRI
Dynadiff: Single-stage Decoding of Images from Continuously Evolving fMRI

Marlène Careil, Yohann Benchetrit, Jean-Rémi King•May 20, 2025•12

Het begrijpen van de digitale taal van Generatie Alpha: Evaluatie van LLM-veiligheidssystemen voor contentmoderatie
Understanding Gen Alpha Digital Language: Evaluation of LLM Safety Systems for Content Moderation

Manisha Mehta, Fausto Giunchiglia•May 14, 2025•12

Leegte in Taalmodellen
Void in Language Models

Mani Shemiranifar•May 20, 2025•02

Naar belichaamde cognitie in robots via ruimtelijk verankerde synthetische werelden
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds

Joel Currie, Gioele Migno, Enrico Piacenti, Maria Elena Giannaccini, Patric Bach, Davide De Tommaso, Agnieszka Wykowska•May 20, 2025•02

Object-gecentreerde representaties verbeteren beleidsgeneralizatie in robotmanipulatie.
Object-Centric Representations Improve Policy Generalization in Robot Manipulation

Alexandre Chapin, Bruno Machado, Emmanuel Dellandrea, Liming Chen•May 16, 2025•02

Het Afleidende Effect: Het Begrijpen van Irrelevante Passages in RAG
The Distracting Effect: Understanding Irrelevant Passages in RAG

Chen Amiraz, Florin Cuconasu, Simone Filice, Zohar Karnin•May 11, 2025•02