ChatPaper.ai
Menu openen
Home
Dagelijkse Papers
arXiv
HuggingFace
Prijzen
Account
Werkruimte
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
AI Onderzoekspapers Dagelijks
Dagelijks geselecteerde AI onderzoekspapers met vertalingen
May 20th, 2025
Keten-van-Model Leren voor Taalmodellen
Chain-of-Model Learning for Language Model
Kaitao Song, Xiaohua Wang, Xu Tan, Huiqiang Jiang, Chengruidong Zhang, Yongliang Shen, Cen LU, Zihao Li, Zifan Song, Caihua Shan, Yansen Wang, Kan Ren, Xiaoqing Zheng, Tao Qin, Yuqing Yang, Dongsheng Li, Lili Qiu
•
May 17, 2025
•
96
8
AdaptThink: Redeneermodellen kunnen leren wanneer ze moeten nadenken
AdaptThink: Reasoning Models Can Learn When to Think
Jiajie Zhang, Nianyi Lin, Lei Hou, Ling Feng, Juanzi Li
•
May 19, 2025
•
69
3
AdaCoT: Pareto-optimale adaptieve Chain-of-Thought-triggering via Reinforcement Learning
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning
Chenwei Lou, Zewei Sun, Xinnian Liang, Meng Qu, Wei Shen, Wenqi Wang, Yuntao Li, Qingping Yang, Shuangzhi Wu
•
May 17, 2025
•
52
3
Delta Attention: Snelle en Nauwkeurige Inferentie van Sparse Attention door Delta Correctie
Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction
Jeffrey Willette, Heejun Lee, Sung Ju Hwang
•
May 16, 2025
•
46
2
Thinkless: LLM Leert Wanneer te Denken
Thinkless: LLM Learns When to Think
Gongfan Fang, Xinyin Ma, Xinchao Wang
•
May 19, 2025
•
42
2
Schalen van Computergebruik-Gronding via Ontleding en Synthese van Gebruikersinterfaces
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis
Tianbao Xie, Jiaqi Deng, Xiaochuan Li, Junlin Yang, Haoyuan Wu, Jixuan Chen, Wenjing Hu, Xinyuan Wang, Yuhui Xu, Zekun Wang, Yiheng Xu, Junli Wang, Doyen Sahoo, Tao Yu, Caiming Xiong
•
May 19, 2025
•
40
2
Snellere Video Diffusie met Trainbare Sparse Attention
Faster Video Diffusion with Trainable Sparse Attention
Peiyuan Zhang, Haofeng Huang, Yongqi Chen, Will Lin, Zhengzhong Liu, Ion Stoica, Eric P. Xing, Hao Zhang
•
May 19, 2025
•
32
3
Model Merging in Pre-training van Grote Taalmodellen
Model Merging in Pre-training of Large Language Models
Yunshui Li, Yiyuan Ma, Shen Yan, Chaoyi Zhang, Jing Liu, Jianqiao Lu, Ziwen Xu, Mengzhao Chen, Minrui Wang, Shiyi Zhan, Jin Ma, Xunhao Lai, Yao Luo, Xingyan Bin, Hongbin Ren, Mingji Han, Wenhao Hao, Bairen Yi, LingJun Liu, Bole Ma, Xiaoying Jia, Zhou Xun, Liang Xiang, Yonghui Wu
•
May 17, 2025
•
31
5
Zoeken in het Donker: Redeneren via Test-Tijd Instantie-Niveau Beleidsgradiënt in Latente Ruimte
Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space
Hengli Li, Chenxi Li, Tong Wu, Xuekai Zhu, Yuxuan Wang, Zhaoxin Yu, Eric Hanchen Jiang, Song-Chun Zhu, Zixia Jia, Ying Nian Wu, Zilong Zheng
•
May 19, 2025
•
25
4
Door de Spiegel: Evaluatie van Gezond Verstand en Consistentie van Vreemde Afbeeldingen
Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images
Elisei Rykov, Kseniia Petrushina, Kseniia Titova, Anton Razzhigaev, Alexander Panchenko, Vasily Konovalov
•
May 12, 2025
•
24
2
Hybride 3D-4D Gaussische Splatting voor Snelle Dynamische Scène Representatie
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation
Seungjun Oh, Younggeun Lee, Hyejin Jeon, Eunbyung Park
•
May 19, 2025
•
23
1
MM-PRM: Verbetering van Multimodale Wiskundige Redenering met Schaalbaar Toezicht op Stapniveau
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision
Lingxiao Du, Fanqing Meng, Zongkai Liu, Zhixiang Zhou, Ping Luo, Qiaosheng Zhang, Wenqi Shao
•
May 19, 2025
•
22
2
CPGD: Naar stabiele regelgebaseerde reinforcement learning voor taalmodellen
CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models
Zongkai Liu, Fanqing Meng, Lingxiao Du, Zhixiang Zhou, Chao Yu, Wenqi Shao, Qiaosheng Zhang
•
May 18, 2025
•
22
2
FedSVD: Adaptieve Orthogonalisatie voor Privacybewuste Federated Learning met LoRA
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA
Seanie Lee, Sangwoo Park, Dong Bok Lee, Dominik Wagner, Haebin Seong, Tobias Bocklet, Juho Lee, Sung Ju Hwang
•
May 19, 2025
•
21
3
Gefragmenteerde Ketting-van-Gedachten Redenering
Fractured Chain-of-Thought Reasoning
Baohao Liao, Hanze Dong, Yuhui Xu, Doyen Sahoo, Christof Monz, Junnan Li, Caiming Xiong
•
May 19, 2025
•
20
2
EfficientLLM: Efficiëntie in Grote Taalmodellen
EfficientLLM: Efficiency in Large Language Models
Zhengqing Yuan, Weixiang Sun, Yixin Liu, Huichi Zhou, Rong Zhou, Yiyang Li, Zheyuan Zhang, Wei Song, Yue Huang, Haolong Jia, Keerthiram Murugesan, Yu Wang, Lifang He, Jianfeng Gao, Lichao Sun, Yanfang Ye
•
May 20, 2025
•
18
1
ChartMuseum: Het testen van visuele redeneervaardigheden van grote visueel-taalkundige modellen
ChartMuseum: Testing Visual Reasoning Capabilities of Large Vision-Language Models
Liyan Tang, Grace Kim, Xinyu Zhao, Thom Lake, Wenxuan Ding, Fangcong Yin, Prasann Singhal, Manya Wadhwa, Zeyu Leo Liu, Zayne Sprague, Ramya Namuduri, Bodun Hu, Juan Diego Rodriguez, Puyuan Peng, Greg Durrett
•
May 19, 2025
•
16
3
SEED-GRPO: Semantische Entropie Verbeterde GRPO voor Onzekerheidsbewust Beleidsoptimalisatie
SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization
Minghan Chen, Guikun Chen, Wenguan Wang, Yi Yang
•
May 18, 2025
•
15
3
VisionReasoner: Geïntegreerde Visuele Waarneming en Redeneren via Reinforcement Learning
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning
Yuqi Liu, Tianyuan Qu, Zhisheng Zhong, Bohao Peng, Shu Liu, Bei Yu, Jiaya Jia
•
May 17, 2025
•
14
2
Neuro-Symbolische Query Compiler
Neuro-Symbolic Query Compiler
Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
•
May 17, 2025
•
14
3
ViPlan: Een benchmark voor visuele planning met symbolische predicaten en vision-language modellen
ViPlan: A Benchmark for Visual Planning with Symbolic Predicates and Vision-Language Models
Matteo Merler, Nicola Dainese, Minttu Alakuijala, Giovanni Bonetta, Pietro Ferrazzi, Yu Tian, Bernardo Magnini, Pekka Marttinen
•
May 19, 2025
•
13
1
R3: Robuste Rubric-Onafhankelijke Beloningsmodellen
R3: Robust Rubric-Agnostic Reward Models
David Anugraha, Zilu Tang, Lester James V. Miranda, Hanyang Zhao, Mohammad Rifqi Farhansyah, Garry Kuwanto, Derry Wijaya, Genta Indra Winata
•
May 19, 2025
•
9
1
Wanneer AI-co-wetenschappers falen: SPOT - een benchmark voor geautomatiseerde verificatie van wetenschappelijk onderzoek
When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research
Guijin Son, Jiwoo Hong, Honglu Fan, Heejeong Nam, Hyunwoo Ko, Seungwon Lim, Jinyeop Song, Jinha Choi, Gonçalo Paulo, Youngjae Yu, Stella Biderman
•
May 17, 2025
•
9
2
Efficiënte Spraaktaalmodellering via Energieafstand in Continue Latente Ruimte
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space
Zhengrui Ma, Yang Feng, Chenze Shao, Fandong Meng, Jie Zhou, Min Zhang
•
May 19, 2025
•
8
2
Versnel TarFlow-steekproeven met GS-Jacobi-iteratie
Accelerate TarFlow Sampling with GS-Jacobi Iteration
Ben Liu, Zhen Qin
•
May 19, 2025
•
7
2
MTVCrafter: 4D Bewegingstokenisatie voor Open-Wereld Menselijke Beeldanimatie
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation
Yanbo Ding, Xirui Hu, Zhizhi Guo, Yali Wang
•
May 15, 2025
•
7
2
Tiny QA Benchmark++: Ultralichtgewicht, synthetische meertalige datasetgeneratie en rooktests voor continue evaluatie van LLM's
Tiny QA Benchmark++: Ultra-Lightweight, Synthetic Multilingual Dataset Generation & Smoke-Tests for Continuous LLM Evaluation
Vincent Koc
•
May 17, 2025
•
6
3
SoftCoT++: Test-Time Schaalbaarheid met Zachte Ketting-van-Gedachten Redenering
SoftCoT++: Test-Time Scaling with Soft Chain-of-Thought Reasoning
Yige Xu, Xu Guo, Zhiwei Zeng, Chunyan Miao
•
May 16, 2025
•
5
2
FinePhys: Fijnmazige menselijke actiegeneratie door expliciete integratie van fysische wetten voor effectieve skeletbegeleiding
FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance
Dian Shao, Mingfei Shi, Shengda Xu, Haodong Chen, Yongle Huang, Binglu Wang
•
May 19, 2025
•
4
1
QVGen: De Grens Verleggen van Gekwantiseerde Videogeneratieve Modellen
QVGen: Pushing the Limit of Quantized Video Generative Models
Yushi Huang, Ruihao Gong, Jing Liu, Yifu Ding, Chengtao Lv, Haotong Qin, Jun Zhang
•
May 16, 2025
•
4
2
ExTrans: Multitallige Diepgaande Redeneervertaling via Voorbeeld-Gestuurde Versterkend Leren
ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning
Jiaan Wang, Fandong Meng, Jie Zhou
•
May 19, 2025
•
3
2
HISTAI: Een Open-Source, Grootschalige Whole Slide Image Dataset voor Computationele Pathologie
HISTAI: An Open-Source, Large-Scale Whole Slide Image Dataset for Computational Pathology
Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova
•
May 17, 2025
•
3
2
MedCaseReasoning: Evaluatie en leren van diagnostisch redeneren uit klinische casusrapporten
MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports
Kevin Wu, Eric Wu, Rahul Thapa, Kevin Wei, Angela Zhang, Arvind Suresh, Jacqueline J. Tao, Min Woo Sun, Alejandro Lozano, James Zou
•
May 16, 2025
•
3
2
Algemene Gebruikersmodellen Creëren op Basis van Computergebruik
Creating General User Models from Computer Use
Omar Shaikh, Shardul Sapkota, Shan Rizvi, Eric Horvitz, Joon Sung Park, Diyi Yang, Michael S. Bernstein
•
May 16, 2025
•
3
2
Van Grommen naar Grammatica: Ontstaan van Taal uit Samenwerkend Foerageren
From Grunts to Grammar: Emergent Language from Cooperative Foraging
Maytus Piriyajitakonkij, Rujikorn Charakorn, Weicheng Tao, Wei Pan, Mingfei Sun, Cheston Tan, Mengmi Zhang
•
May 19, 2025
•
2
2
Een Token is Meer dan 1.000 Tokens Waard: Efficiënte Kennisdistillatie via Laag-Rang Kloon
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone
Jitai Hao, Qiang Huang, Hao Liu, Xinyan Xiao, Zhaochun Ren, Jun Yu
•
May 19, 2025
•
2
2
TechniqueRAG: Retrieval Augmented Generation voor Adversarial Technique Annotatie in Cyber Threat Intelligence-tekst
TechniqueRAG: Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text
Ahmed Lekssays, Utsav Shukla, Husrev Taha Sencar, Md Rizwan Parvez
•
May 17, 2025
•
2
2
HelpSteer3-Preference: Open Menselijk-Geannoteerde Voorkeursgegevens over Diverse Taken en Talen
HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages
Zhilin Wang, Jiaqi Zeng, Olivier Delalleau, Hoo-Chang Shin, Felipe Soares, Alexander Bukharin, Ellie Evans, Yi Dong, Oleksii Kuchaiev
•
May 16, 2025
•
2
2
Geleerde lichtgewicht smartphone ISP met ongepaarde gegevens
Learned Lightweight Smartphone ISP with Unpaired Data
Andrei Arhire, Radu Timofte
•
May 15, 2025
•
2
2
LLM Contextconditionering en PWP Prompting voor Multimodale Validatie van Chemische Formules
LLM Context Conditioning and PWP Prompting for Multimodal Validation of Chemical Formulas
Evgeny Markhasin
•
May 18, 2025
•
1
2
Kunnen AI-freelancers concurreren? Benchmarking van inkomsten, betrouwbaarheid en taaksucces op grote schaal
Can AI Freelancers Compete? Benchmarking Earnings, Reliability, and Task Success at Scale
David Noever, Forrest McKee
•
May 16, 2025
•
1
2
AI-gestuurde wetenschappelijke peer review via doorlopende workflow-prompting, meta-prompting en meta-redenering,
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning
Evgeny Markhasin
•
May 6, 2025
•
1
2
Snel, niet uitgebreid: Heroverweging van G2P met rijke data en op regels gebaseerde modellen
Fast, Not Fancy: Rethinking G2P with Rich Data and Rule-Based Models
Mahta Fetrat Qharabagh, Zahra Dehghanian, Hamid R. Rabiee
•
May 19, 2025
•
0
2