ChatPaper.aiChatPaper.ai
홈

arXiv

HuggingFace

요금제계정작업공간

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

AI 연구 논문 데일리

번역이 포함된 일일 선별된 AI 연구 논문

80/20 법칙을 넘어서: 고엔트로피 소수 토큰이 LLM 추론을 위한 효과적인 강화 학습을 주도한다
Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning

Shenzhi Wang, Le Yu, Chang Gao, Chujie Zheng, Shixuan Liu, Rui Lu, Kai Dang, Xionghui Chen, Jianxin Yang, Zhenru Zhang, Yuqiong Liu, An Yang, Andrew Zhao, Yang Yue, Shiji Song, Bowen Yu, Gao Huang, Junyang Lin•Jun 2, 2025•1293

SmolVLA: 경제적이고 효율적인 로봇공학을 위한 비전-언어-행동 모델
SmolVLA: A Vision-Language-Action Model for Affordable and Efficient Robotics

Mustafa Shukor, Dana Aubakirova, Francesco Capuano, Pepijn Kooijmans, Steven Palma, Adil Zouitine, Michel Aractingi, Caroline Pascal, Martino Russi, Andres Marafioti, Simon Alibert, Matthieu Cord, Thomas Wolf, Remi Cadene•Jun 2, 2025•7414

추론 체육관: 검증 가능한 보상을 통한 강화 학습을 위한 추론 환경
REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards

Zafir Stojanovski, Oliver Stanley, Joe Sharratt, Richard Jones, Abdulhakeem Adefioye, Jean Kaddour, Andreas Köpf•May 30, 2025•584

그래디언트 그룹화를 통해 학습률을 조정하여 LLMs(대형 언어 모델) 제어하기
Taming LLMs by Scaling Learning Rates with Gradient Grouping

Siyuan Li, Juanxi Tian, Zedong Wang, Xin Jin, Zicheng Liu, Wentao Zhang, Dan Xu•Jun 1, 2025•354

비디오 확산 모델의 다목적 제어를 위한 시간적 인-컨텍스트 미세 조정
Temporal In-Context Fine-Tuning for Versatile Control of Video Diffusion Models

Kinam Kim, Junha Hyung, Jaegul Choo•Jun 1, 2025•343

SRPO: 반영 인식 강화 학습을 통한 멀티모달 LLM 추론 향상
SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning

Zhongwei Wan, Zhihao Dou, Che Liu, Yu Zhang, Dongfei Cui, Qinjian Zhao, Hui Shen, Jing Xiong, Yi Xin, Yifan Jiang, Yangfan He, Mi Zhang, Shen Yan•Jun 2, 2025•302

ShapeLLM-Omni: 3D 생성 및 이해를 위한 네이티브 멀티모달 LLM
ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding

Junliang Ye, Zhengyi Wang, Ruowen Zhao, Shenghao Xie, Jun Zhu•Jun 2, 2025•272

ARIA: 의도 기반 보상 집계를 통한 언어 에이전트 훈련
ARIA: Training Language Agents with Intention-Driven Reward Aggregation

Ruihan Yang, Yikai Zhang, Aili Chen, Xintao Wang, Siyu Yuan, Jiangjie Chen, Deqing Yang, Yanghua Xiao•May 31, 2025•272

LoHoVLA: 장기간 임베디드 작업을 위한 통합 비전-언어-액션 모델
LoHoVLA: A Unified Vision-Language-Action Model for Long-Horizon Embodied Tasks

Yi Yang, Jiaxuan Sun, Siqi Kou, Yihan Wang, Zhijie Deng•May 31, 2025•272

Jigsaw-R1: 직소 퍼즐을 활용한 규칙 기반 시각 강화 학습 연구
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles

Zifu Wang, Junyi Zhu, Bo Tang, Zhiyu Li, Feiyu Xiong, Jiaqian Yu, Matthew B. Blaschko•May 29, 2025•242

로봇 조작을 위한 비디오 생성 학습 및 협력적 궤적 제어
Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control

Xiao Fu, Xintao Wang, Xian Liu, Jianhong Bai, Runsen Xu, Pengfei Wan, Di Zhang, Dahua Lin•Jun 2, 2025•232

EarthMind: 대규모 멀티모달 모델을 활용한 다중 세분화 및 다중 센서 지구 관측
EarthMind: Towards Multi-Granular and Multi-Sensor Earth Observation with Large Multimodal Models

Yan Shu, Bin Ren, Zhitong Xiong, Danda Pani Paudel, Luc Van Gool, Begum Demir, Nicu Sebe, Paolo Rota•Jun 2, 2025•202

AReaL: 언어 추론을 위한 대규모 비동기식 강화 학습 시스템
AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

Wei Fu, Jiaxuan Gao, Xujie Shen, Chen Zhu, Zhiyu Mei, Chuyi He, Shusheng Xu, Guo Wei, Jun Mei, Jiashu Wang, Tongkai Yang, Binhang Yuan, Yi Wu•May 30, 2025•202

압축된 표현에 대한 통합 스케일링 법칙
Unified Scaling Laws for Compressed Representations

Andrei Panferov, Alexandra Volkova, Ionut-Vlad Modoranu, Vage Egiazarian, Mher Safaryan, Dan Alistarh•Jun 2, 2025•172

MiCRo: 개인화된 선호도 학습을 위한 혼합 모델링 및 상황 인식 라우팅
MiCRo: Mixture Modeling and Context-aware Routing for Personalized Preference Learning

Jingyan Shen, Jiarui Yao, Rui Yang, Yifan Sun, Feng Luo, Rui Pan, Tong Zhang, Han Zhao•May 30, 2025•152

대규모 언어 모델의 고급 명령어 수행을 위한 추론 능력 강화
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models

Yulei Qin, Gang Li, Zongyi Li, Zihan Xu, Yuchen Shi, Zhekai Lin, Xiao Cui, Ke Li, Xing Sun•Jun 2, 2025•142

IVY-FAKE: 이미지 및 비디오 AIGC 탐지를 위한 통합 설명 가능 프레임워크 및 벤치마크
IVY-FAKE: A Unified Explainable Framework and Benchmark for Image and Video AIGC Detection

Wayne Zhang, Changjiang Jiang, Zhonghao Zhang, Chenyang Si, Fengchang Yu, Wei Peng•Jun 1, 2025•133

토큰에서 액션으로: 정보 검색에서 과도한 사고를 완화하기 위한 상태 머신 추론
From Token to Action: State Machine Reasoning to Mitigate Overthinking in Information Retrieval

Dohyeon Lee, Yeonseok Jeong, Seung-won Hwang•May 29, 2025•132

경제학자처럼 사고하기: 경제 문제에 대한 사후 훈련이 LLM의 전략적 일반화를 유도한다
Reasoning Like an Economist: Post-Training on Economic Problems Induces Strategic Generalization in LLMs

Yufa Zhou, Shaobo Wang, Xingyu Dong, Xiangqi Jin, Yifang Chen, Yue Min, Kexin Yang, Xingzhang Ren, Dayiheng Liu, Linfeng Zhang•May 31, 2025•112

Cora: 소수 단계 확산을 사용한 대응 관계 인식 이미지 편집
Cora: Correspondence-aware image editing using few step diffusion

Amirhossein Almohammadi, Aryan Mikaeili, Sauradip Nag, Negar Hassanpour, Andrea Tagliasacchi, Ali Mahdavi-Amiri•May 29, 2025•112

WebChoreArena: 현실적인 지루한 웹 작업에서 웹 브라우징 에이전트 평가
WebChoreArena: Evaluating Web Browsing Agents on Realistic Tedious Web Tasks

Atsuyuki Miyai, Zaiying Zhao, Kazuki Egashira, Atsuki Sato, Tatsumi Sunada, Shota Onohara, Hiromasa Yamanishi, Mashiro Toyooka, Kunato Nishina, Ryoma Maeda, Kiyoharu Aizawa, Toshihiko Yamasaki•Jun 2, 2025•103

VisualSphinx: 강화학습을 위한 대규모 합성 시각 논리 퍼즐
VisualSphinx: Large-Scale Synthetic Vision Logic Puzzles for RL

Yichen Feng, Zhangchen Xu, Fengqing Jiang, Yuetai Li, Bhaskar Ramasubramanian, Luyao Niu, Bill Yuchen Lin, Radha Poovendran•May 29, 2025•92

OWSM v4: 데이터 스케일링 및 정제를 통해 개방형 Whisper 스타일 음성 모델 개선
OWSM v4: Improving Open Whisper-Style Speech Models via Data Scaling and Cleaning

Yifan Peng, Shakeel Muhammad, Yui Sudo, William Chen, Jinchuan Tian, Chyi-Jiunn Lin, Shinji Watanabe•May 31, 2025•82

3D 세계를 위한 비디오 학습: 3D 시각 기하학적 사전 지식을 활용한 MLLM 강화
Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors

Duo Zheng, Shijia Huang, Yanyang Li, Liwei Wang•May 30, 2025•82

기계 생성 텍스트 탐지의 스트레스 테스트: 탐지기를 속이기 위한 언어 모델의 글쓰기 스타일 전환
Stress-testing Machine Generated Text Detection: Shifting Language Models Writing Style to Fool Detectors

Andrea Pedrotti, Michele Papucci, Cristiano Ciaccio, Alessio Miaschi, Giovanni Puccetti, Felice Dell'Orletta, Andrea Esuli•May 30, 2025•82

CodeV-R1: 추론 강화 Verilog 생성
CodeV-R1: Reasoning-Enhanced Verilog Generation

Yaoyu Zhu, Di Huang, Hanqi Lyu, Xiaoyun Zhang, Chongxiao Li, Wenxuan Shi, Yutong Wu, Jianan Mu, Jinghua Wang, Yang Zhao, Pengwei Jin, Shuyao Cheng, Shengwen Liang, Xishan Zhang, Rui Zhang, Zidong Du, Qi Guo, Xing Hu, Yunji Chen•May 30, 2025•82

DyePack: 백도어를 활용한 LLM 테스트 세트 오염의 검증 가능한 플래깅
DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors

Yize Cheng, Wenxiao Wang, Mazda Moayeri, Soheil Feizi•May 29, 2025•82

정규화된 주의 안내: 확산 모델을 위한 보편적 부정적 안내
Normalized Attention Guidance: Universal Negative Guidance for Diffusion Model

Dar-Yen Chen, Hmrishav Bandyopadhyay, Kai Zou, Yi-Zhe Song•May 27, 2025•83

에소테릭 언어 모델
Esoteric Language Models

Subham Sekhar Sahoo, Zhihan Yang, Yash Akhauri, Johnna Liu, Deepansha Singh, Zhoujun Cheng, Zhengzhong Liu, Eric Xing, John Thickstun, Arash Vahdat•Jun 2, 2025•72

zip2zip: 토큰 압축을 통한 언어 모델의 추론 시 적응형 어휘 사전
zip2zip: Inference-Time Adaptive Vocabularies for Language Models via Token Compression

Saibo Geng, Nathan Ranchin, Yunzhen yao, Maxime Peyrard, Chris Wendler, Michael Gastpar, Robert West•Jun 1, 2025•72

다윈 괴델 머신: 자기 개선 에이전트의 무한 진화
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents

Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune•May 29, 2025•72

언제 행동하고 언제 기다릴 것인가: 작업 지향 대화에서 의도 실행 가능성을 위한 구조적 궤적 모델링
WHEN TO ACT, WHEN TO WAIT: Modeling Structural Trajectories for Intent Triggerability in Task-Oriented Dialogue

Yaoyao Qian, Jindan Huang, Yuanli Wang, Simon Yu, Kyrie Zhixuan Zhou, Jiayuan Mao, Mingfu Liang, Hanhan Zhou•Jun 2, 2025•62

언어 모델에서 주입(Injection)부터 증류(Distillation)에 이르는 연쇄적 적대적 편향
Cascading Adversarial Bias from Injection to Distillation in Language Models

Harsh Chaudhari, Jamie Hayes, Matthew Jagielski, Ilia Shumailov, Milad Nasr, Alina Oprea•May 30, 2025•62

VAU-R1: 강화 학습 기반 미세 조정을 통한 비디오 이상 탐지 기술의 발전
VAU-R1: Advancing Video Anomaly Understanding via Reinforcement Fine-Tuning

Liyun Zhu, Qixiang Chen, Xi Shen, Xiaodong Cun•May 29, 2025•62

SATA-BENCH: 다중 선택 질문을 위한 '모두 해당' 벤치마크
SATA-BENCH: Select All That Apply Benchmark for Multiple Choice Questions

Weijie Xu, Shixian Cui, Xi Fang, Chi Xue, Stephanie Eckman, Chandan Reddy•May 31, 2025•52

Pro3D-Editor: 일관적이고 정밀한 3D 편집을 위한 점진적 뷰 관점
Pro3D-Editor : A Progressive-Views Perspective for Consistent and Precise 3D Editing

Yang Zheng, Mengqi Huang, Nan Chen, Zhendong Mao•May 31, 2025•52

스텝사이즈 애니띵: 예산 제한 반복 학습을 위한 통합 학습률 스케줄
Stepsize anything: A unified learning rate schedule for budgeted-iteration training

Anda Tang, Yiming Dong, Yutao Zeng, zhou Xun, Zhouchen Lin•May 30, 2025•52

가이드라인에서 실천으로: 아랍어 언어 모델 평가를 위한 새로운 패러다임
From Guidelines to Practice: A New Paradigm for Arabic Language Model Evaluation

Serry Sibaee, Omer Nacar, Adel Ammar, Yasser Al-Habashi, Abdulrahman Al-Batati, Wadii Boulila•Jun 2, 2025•43

가이드라인에서 실천으로: 아랍어 언어 모델 평가를 위한 새로운 패러다임
From Guidelines to Practice: A New Paradigm for Arabic Language Model Evaluation

Serry Sibaee, Omer Nacar, Adel Ammar, Yasser Al-Habashi, Abdulrahman Al-Batati, Wadii Boulila•Jun 2, 2025•43

LLM 루프 활용: 혐오 발언 해독을 위한 PARADEHATE 데이터셋 구축
LLM in the Loop: Creating the PARADEHATE Dataset for Hate Speech Detoxification

Shuzhou Yuan, Ercong Nie, Lukas Kouba, Ashish Yashwanth Kangen, Helmut Schmid, Hinrich Schutze, Michael Farber•Jun 2, 2025•43

RARE: 검색 증강 생성 시스템을 위한 검색 인식 강건성 평가
RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems

Yixiao Zeng, Tianyu Cao, Danqing Wang, Xinran Zhao, Zimeng Qiu, Morteza Ziyadi, Tongshuang Wu, Lei Li•Jun 1, 2025•42

ComposeAnything: 텍스트-이미지 생성을 위한 복합 객체 사전 정보
ComposeAnything: Composite Object Priors for Text-to-Image Generation

Zeeshan Khan, Shizhe Chen, Cordelia Schmid•May 30, 2025•43

OmniResponse: 이인간 상호작용에서의 온라인 다중모드 대화 응답 생성
OmniResponse: Online Multimodal Conversational Response Generation in Dyadic Interactions

Cheng Luo, Jianghui Wang, Bing Li, Siyang Song, Bernard Ghanem•May 27, 2025•42

코드 언어 모델에서 프로그래밍 개념과 뉴런이 공유되는 방식
How Programming Concepts and Neurons Are Shared in Code Language Models

Amir Hossein Kargaran, Yihong Liu, François Yvon, Hinrich Schütze•Jun 1, 2025•32

SealQA: 검색-보강 언어 모델의 추론 능력 향상을 위한 새로운 기준 제시
SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare, Weiyuan Chen, Yu-Min Tseng, Tu Vu•Jun 1, 2025•32

언어 모델 예측 평가의 함정
Pitfalls in Evaluating Language Model Forecasters

Daniel Paleka, Shashwat Goel, Jonas Geiping, Florian Tramèr•May 31, 2025•32

SenseFlow: 플로우 기반 텍스트-이미지 증류를 위한 분포 매칭 확장
SenseFlow: Scaling Distribution Matching for Flow-based Text-to-Image Distillation

Xingtong Ge, Xin Zhang, Tongda Xu, Yi Zhang, Xinjie Zhang, Yan Wang, Jun Zhang•May 31, 2025•32

MaskSearch: 에이전트 탐색 능력 강화를 위한 범용 사전 학습 프레임워크
MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability

Weiqi Wu, Xin Guan, Shen Huang, Yong Jiang, Pengjun Xie, Fei Huang, Jiuxin Cao, Hai Zhao, Jingren Zhou•May 26, 2025•32

다시 생각해보자! 테스트 시점 계산이 대형 언어 모델의 선호도, 의견 및 신념에 미치는 영향
Think Again! The Effect of Test-Time Compute on Preferences, Opinions, and Beliefs of Large Language Models

George Kour, Itay Nakash, Ateret Anaby-Tavor, Michal Shmueli-Scheuer•May 26, 2025•32

개인화된 상황 인지와 VLM 어시스턴트의 정렬
Aligning VLM Assistants with Personalized Situated Cognition

Yongqi Li, Shen Zhou, Xiaohu Li, Xin Miao, Jintao Wen, Mayi Xu, Jianhao Chen, Birong Pan, Hankun Kang, Yuanyuan Zhu, Ming Zhong, Tieyun Qian•Jun 1, 2025•22

진실을 위한 베일을 벗기다: 추론 중심 지도 미세조정에서 순위 축소 후 주요 가중치가 부각되다
LIFT the Veil for the Truth: Principal Weights Emerge after Rank Reduction for Reasoning-Focused Supervised Fine-Tuning

Zihang Liu, Tianyu Pang, Oleg Balabanov, Chaoqun Yang, Tianjin Huang, Lu Yin, Yaoqing Yang, Shiwei Liu•Jun 1, 2025•22

CityLens: 도시 사회경제적 감지를 위한 대규모 언어-비전 모델 벤치마킹
CityLens: Benchmarking Large Language-Vision Models for Urban Socioeconomic Sensing

Tianhui Liu, Jie Feng, Hetian Pang, Xin Zhang, Tianjian Ouyang, Zhiyuan Zhang, Yong Li•May 31, 2025•22

대규모 다국어 적응을 위한 이중언어 번역 데이터를 활용한 대형 언어 모델의 적용
Massively Multilingual Adaptation of Large Language Models Using Bilingual Translation Data

Shaoxiong Ji, Zihao Li, Jaakko Paavola, Indraneil Paul, Hengyu Luo, Jörg Tiedemann•May 31, 2025•22

MagiCodec: 고품질 재구성 및 생성을 위한 단순 마스크 가우시안 주입 코덱
MagiCodec: Simple Masked Gaussian-Injected Codec for High-Fidelity Reconstruction and Generation

Yakun Song, Jiawei Chen, Xiaobin Zhuang, Chenpeng Du, Ziyang Ma, Jian Wu, Jian Cong, Dongya Jia, Zhuo Chen, Yuping Wang, Yuxuan Wang, Xie Chen•May 31, 2025•22

Neuro2Semantic: 인간 두개 내 뇌파(EEG)로부터 연속 언어의 의미론적 재구성을 위한 전이 학습 프레임워크
Neuro2Semantic: A Transfer Learning Framework for Semantic Reconstruction of Continuous Language from Human Intracranial EEG

Siavash Shams, Richard Antonello, Gavin Mischler, Stephan Bickel, Ashesh Mehta, Nima Mesgarani•May 31, 2025•22

BinauralFlow: 플로우 매칭 모델을 활용한 고품질 이중 청각 음성 합성을 위한 인과적 및 스트리밍 가능 접근법
BinauralFlow: A Causal and Streamable Approach for High-Quality Binaural Speech Synthesis with Flow Matching Models

Susan Liang, Dejan Markovic, Israel D. Gebru, Steven Krenn, Todd Keebler, Jacob Sandakly, Frank Yu, Samuel Hassel, Chenliang Xu, Alexander Richard•May 28, 2025•22

R1-Code-Interpreter: 지도 학습 및 강화 학습을 통해 코드로 추론하는 LLM 훈련
R1-Code-Interpreter: Training LLMs to Reason with Code via Supervised and Reinforcement Learning

Yongchao Chen, Yueying Liu, Junwei Zhou, Yilun Hao, Jingquan Wang, Yang Zhang, Chuchu Fan•May 27, 2025•22

프랑켄텍스트: 무작위 텍스트 조각을 장편 서사로 엮기
Frankentext: Stitching random text fragments into long-form narratives

Chau Minh Pham, Jenna Russell, Dzung Pham, Mohit Iyyer•May 23, 2025•22

계획 및 예산: 대규모 언어 모델 추론에서 효과적이고 효율적인 테스트 시간 스케일링
Plan and Budget: Effective and Efficient Test-Time Scaling on Large Language Model Reasoning

Junhong Lin, Xinyue Zeng, Jie Zhu, Song Wang, Julian Shun, Jun Wu, Dawei Zhou•May 22, 2025•22

픽셀 대 프라이어: 시각적 반사실을 통한 시각-언어 모델의 지식 프라이어 제어
Pixels Versus Priors: Controlling Knowledge Priors in Vision-Language Models through Visual Counterfacts

Michal Golovanevsky, William Rudman, Michael Lepori, Amir Bar, Ritambhara Singh, Carsten Eickhoff•May 21, 2025•22

MIKU-PAL: 음성의 부언어적 특성 및 감정 레이블링을 위한 자동화된 표준화 다중 모드 방법론
MIKU-PAL: An Automated and Standardized Multi-Modal Method for Speech Paralinguistic and Affect Labeling

Yifan Cheng, Ruoyi Zhang, Jiatong Shi•May 21, 2025•22

신뢰도-마진 가중치 의사 레이블을 활용한 셔플 패치믹스 증강 기법을 통한 향상된 소스 프리 도메인 적응
Shuffle PatchMix Augmentation with Confidence-Margin Weighted Pseudo-Labels for Enhanced Source-Free Domain Adaptation

Prasanna Reddy Pulakurthi, Majid Rabbani, Jamison Heard, Sohail Dianat, Celso M. de Melo, Raghuveer Rao•May 30, 2025•12

다중모드 확산 모델을 활용한 이산-연속 양자 회로 합성
Synthesis of discrete-continuous quantum circuits with multimodal diffusion models

Florian Fürrutter, Zohim Chandani, Ikko Hamamura, Hans J. Briegel, Gorka Muñoz-Gil•Jun 2, 2025•02