ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
May 20th, 2025
언어 모델을 위한 체인-오브-모델 학습
Chain-of-Model Learning for Language Model
Kaitao Song, Xiaohua Wang, Xu Tan, Huiqiang Jiang, Chengruidong Zhang, Yongliang Shen, Cen LU, Zihao Li, Zifan Song, Caihua Shan, Yansen Wang, Kan Ren, Xiaoqing Zheng, Tao Qin, Yuqing Yang, Dongsheng Li, Lili Qiu
•
May 17, 2025
•
67
2
AdaptThink: 추론 모델은 언제 사고해야 하는지 학습할 수 있다
AdaptThink: Reasoning Models Can Learn When to Think
Jiajie Zhang, Nianyi Lin, Lei Hou, Ling Feng, Juanzi Li
•
May 19, 2025
•
56
1
AdaCoT: 강화 학습을 통한 파레토 최적 적응형 사고 연쇄 트리거링
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning
Chenwei Lou, Zewei Sun, Xinnian Liang, Meng Qu, Wei Shen, Wenqi Wang, Yuntao Li, Qingping Yang, Shuangzhi Wu
•
May 17, 2025
•
43
1
델타 어텐션: 델타 보정을 통한 빠르고 정확한 희소 어텐션 추론
Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction
Jeffrey Willette, Heejun Lee, Sung Ju Hwang
•
May 16, 2025
•
35
1
컴퓨터 사용 기반 학습을 위한 사용자 인터페이스 분해 및 합성 기반 확장
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis
Tianbao Xie, Jiaqi Deng, Xiaochuan Li, Junlin Yang, Haoyuan Wu, Jixuan Chen, Wenjing Hu, Xinyuan Wang, Yuhui Xu, Zekun Wang, Yiheng Xu, Junli Wang, Doyen Sahoo, Tao Yu, Caiming Xiong
•
May 19, 2025
•
34
2
Thinkless: LLM은 언제 사고할지 학습한다
Thinkless: LLM Learns When to Think
Gongfan Fang, Xinyin Ma, Xinchao Wang
•
May 19, 2025
•
25
1
훈련 가능한 희소 주의력을 통한 더 빠른 비디오 확산
Faster Video Diffusion with Trainable Sparse Attention
Peiyuan Zhang, Haofeng Huang, Yongqi Chen, Will Lin, Zhengzhong Liu, Ion Stoica, Eric P. Xing, Hao Zhang
•
May 19, 2025
•
24
1
어둠 속에서 탐색하기: 잠재 공간에서의 테스트 시점 인스턴스 수준 정책 경사 기반 추론
Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space
Hengli Li, Chenxi Li, Tong Wu, Xuekai Zhu, Yuxuan Wang, Zhaoxin Yu, Eric Hanchen Jiang, Song-Chun Zhu, Zixia Jia, Ying Nian Wu, Zilong Zheng
•
May 19, 2025
•
23
3
대규모 언어 모델 사전 학습에서의 모델 병합
Model Merging in Pre-training of Large Language Models
Yunshui Li, Yiyuan Ma, Shen Yan, Chaoyi Zhang, Jing Liu, Jianqiao Lu, Ziwen Xu, Mengzhao Chen, Minrui Wang, Shiyi Zhan, Jin Ma, Xunhao Lai, Yao Luo, Xingyan Bin, Hongbin Ren, Mingji Han, Wenhao Hao, Bairen Yi, LingJun Liu, Bole Ma, Xiaoying Jia, Zhou Xun, Liang Xiang, Yonghui Wu
•
May 17, 2025
•
23
4
MM-PRM: 확장 가능한 단계별 지도를 통한 다중모달 수학적 추론 향상
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision
Lingxiao Du, Fanqing Meng, Zongkai Liu, Zhixiang Zhou, Ping Luo, Qiaosheng Zhang, Wenqi Shao
•
May 19, 2025
•
20
1
빠른 동적 장면 표현을 위한 하이브리드 3D-4D 가우시안 스플래팅
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation
Seungjun Oh, Younggeun Lee, Hyejin Jeon, Eunbyung Park
•
May 19, 2025
•
20
1
FedSVD: LoRA를 활용한 개인 정보 보호 연합 학습을 위한 적응형 직교화
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA
Seanie Lee, Sangwoo Park, Dong Bok Lee, Dominik Wagner, Haebin Seong, Tobias Bocklet, Juho Lee, Sung Ju Hwang
•
May 19, 2025
•
20
2
CPGD: 언어 모델을 위한 안정적인 규칙 기반 강화 학습 방향
CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models
Zongkai Liu, Fanqing Meng, Lingxiao Du, Zhixiang Zhou, Chao Yu, Wenqi Shao, Qiaosheng Zhang
•
May 18, 2025
•
20
1
파편화된 사고 연쇄 추론
Fractured Chain-of-Thought Reasoning
Baohao Liao, Hanze Dong, Yuhui Xu, Doyen Sahoo, Christof Monz, Junnan Li, Caiming Xiong
•
May 19, 2025
•
16
1
ChartMuseum: 대규모 시각-언어 모델의 시각적 추론 능력 평가
ChartMuseum: Testing Visual Reasoning Capabilities of Large Vision-Language Models
Liyan Tang, Grace Kim, Xinyu Zhao, Thom Lake, Wenxuan Ding, Fangcong Yin, Prasann Singhal, Manya Wadhwa, Zeyu Leo Liu, Zayne Sprague, Ramya Namuduri, Bodun Hu, Juan Diego Rodriguez, Puyuan Peng, Greg Durrett
•
May 19, 2025
•
15
2
신경-기호 쿼리 컴파일러
Neuro-Symbolic Query Compiler
Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
•
May 17, 2025
•
14
2
SEED-GRPO: 불확실성 인식 정책 최적화를 위한 의미론적 엔트로피 강화 GRPO
SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization
Minghan Chen, Guikun Chen, Wenguan Wang, Yi Yang
•
May 18, 2025
•
13
2
VisionReasoner: 강화 학습을 통한 통합 시각 인지 및 추론
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning
Yuqi Liu, Tianyuan Qu, Zhisheng Zhong, Bohao Peng, Shu Liu, Bei Yu, Jiaya Jia
•
May 17, 2025
•
13
1
거울 속을 들여다보기: 이상한 이미지에 대한 상식적 일관성 평가
Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images
Elisei Rykov, Kseniia Petrushina, Kseniia Titova, Anton Razzhigaev, Alexander Panchenko, Vasily Konovalov
•
May 12, 2025
•
13
2
ViPlan: 기호 술어와 비전-언어 모델을 활용한 시각적 계획을 위한 벤치마크
ViPlan: A Benchmark for Visual Planning with Symbolic Predicates and Vision-Language Models
Matteo Merler, Nicola Dainese, Minttu Alakuijala, Giovanni Bonetta, Pietro Ferrazzi, Yu Tian, Bernardo Magnini, Pekka Marttinen
•
May 19, 2025
•
11
1
AI 공동 연구자 실패 시: 과학 연구 자동 검증을 위한 SPOT 벤치마크
When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research
Guijin Son, Jiwoo Hong, Honglu Fan, Heejeong Nam, Hyunwoo Ko, Seungwon Lim, Jinyeop Song, Jinha Choi, Gonçalo Paulo, Youngjae Yu, Stella Biderman
•
May 17, 2025
•
8
1
GS-Jacobi 반복법을 활용한 TarFlow 샘플링 가속화
Accelerate TarFlow Sampling with GS-Jacobi Iteration
Ben Liu, Zhen Qin
•
May 19, 2025
•
7
1
R3: 강건한 루브릭-불가지론적 보상 모델
R3: Robust Rubric-Agnostic Reward Models
David Anugraha, Zilu Tang, Lester James V. Miranda, Hanyang Zhao, Mohammad Rifqi Farhansyah, Garry Kuwanto, Derry Wijaya, Genta Indra Winata
•
May 19, 2025
•
6
1
Tiny QA Benchmark++: 연속적인 LLM 평가를 위한 초경량 합성 다국어 데이터셋 생성 및 스모크 테스트
Tiny QA Benchmark++: Ultra-Lightweight, Synthetic Multilingual Dataset Generation & Smoke-Tests for Continuous LLM Evaluation
Vincent Koc
•
May 17, 2025
•
6
2
FinePhys: 물리 법칙을 명시적으로 통합하여 효과적인 골격 안내를 위한 세분화된 인간 행동 생성
FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance
Dian Shao, Mingfei Shi, Shengda Xu, Haodong Chen, Yongle Huang, Binglu Wang
•
May 19, 2025
•
4
1
MTVCrafter: 개방형 세계 인간 이미지 애니메이션을 위한 4D 모션 토큰화
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation
Yanbo Ding, Xirui Hu, Zhizhi Guo, Yali Wang
•
May 15, 2025
•
4
1
ExTrans: 예시 강화 강화 학습을 통한 다국어 심층 추론 번역
ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning
Jiaan Wang, Fandong Meng, Jie Zhou
•
May 19, 2025
•
3
1
HISTAI: 계산 병리학을 위한 오픈소스 대규모 전체 슬라이드 이미지 데이터셋
HISTAI: An Open-Source, Large-Scale Whole Slide Image Dataset for Computational Pathology
Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova
•
May 17, 2025
•
3
1
QVGen: 양자화된 비디오 생성 모델의 한계를 넘어서기
QVGen: Pushing the Limit of Quantized Video Generative Models
Yushi Huang, Ruihao Gong, Jing Liu, Yifu Ding, Chengtao Lv, Haotong Qin, Jun Zhang
•
May 16, 2025
•
3
1
SoftCoT++: 소프트 사고 연쇄 추론을 통한 테스트 시간 스케일링
SoftCoT++: Test-Time Scaling with Soft Chain-of-Thought Reasoning
Yige Xu, Xu Guo, Zhiwei Zeng, Chunyan Miao
•
May 16, 2025
•
3
1
울음소리에서 문법으로: 협력적 채집 행동에서 나타나는 언어의 출현
From Grunts to Grammar: Emergent Language from Cooperative Foraging
Maytus Piriyajitakonkij, Rujikorn Charakorn, Weicheng Tao, Wei Pan, Mingfei Sun, Cheston Tan, Mengmi Zhang
•
May 19, 2025
•
2
1
MedCaseReasoning: 임상 사례 보고서를 통해 진단 추론 평가 및 학습하기
MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports
Kevin Wu, Eric Wu, Rahul Thapa, Kevin Wei, Angela Zhang, Arvind Suresh, Jacqueline J. Tao, Min Woo Sun, Alejandro Lozano, James Zou
•
May 16, 2025
•
2
1
HelpSteer3-Preference: 다양한 작업과 언어에 걸친 개방형 인간 주석 선호도 데이터
HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages
Zhilin Wang, Jiaqi Zeng, Olivier Delalleau, Hoo-Chang Shin, Felipe Soares, Alexander Bukharin, Ellie Evans, Yi Dong, Oleksii Kuchaiev
•
May 16, 2025
•
2
1
토큰 하나가 천 개의 토큰보다 가치 있다: 저랭크 복제를 통한 효율적인 지식 증류
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone
Jitai Hao, Qiang Huang, Hao Liu, Xinyan Xiao, Zhaochun Ren, Jun Yu
•
May 19, 2025
•
1
1
화학식의 다중모드 검증을 위한 LLM 컨텍스트 조건화 및 PWP 프롬프팅
LLM Context Conditioning and PWP Prompting for Multimodal Validation of Chemical Formulas
Evgeny Markhasin
•
May 18, 2025
•
1
1
TechniqueRAG: 사이버 위협 인텔리전스 텍스트를 위한 적대적 기법 주석을 위한 검색 증강 생성
TechniqueRAG: Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text
Ahmed Lekssays, Utsav Shukla, Husrev Taha Sencar, Md Rizwan Parvez
•
May 17, 2025
•
1
1
비대응 데이터를 활용한 경량 스마트폰 ISP 학습
Learned Lightweight Smartphone ISP with Unpaired Data
Andrei Arhire, Radu Timofte
•
May 15, 2025
•
1
1
지속적 워크플로 프롬프팅, 메타-프롬프팅 및 메타-추론을 통한 AI 기반 학술 피어 리뷰
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning
Evgeny Markhasin
•
May 6, 2025
•
1
1
빠르지만 화려하지 않음: 풍부한 데이터와 규칙 기반 모델로 G2P 재고하기
Fast, Not Fancy: Rethinking G2P with Rich Data and Rule-Based Models
Mahta Fetrat Qharabagh, Zahra Dehghanian, Hamid R. Rabiee
•
May 19, 2025
•
0
1
컴퓨터 사용 데이터를 통한 일반 사용자 모델 생성
Creating General User Models from Computer Use
Omar Shaikh, Shardul Sapkota, Shan Rizvi, Eric Horvitz, Joon Sung Park, Diyi Yang, Michael S. Bernstein
•
May 16, 2025
•
0
1