ChatPaper.aiChatPaper.ai
홈

arXiv

HuggingFace

요금제계정작업공간

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

AI 연구 논문 데일리

번역이 포함된 일일 선별된 AI 연구 논문

지식 기반 구축을 통한 지식 증강 텍스트-투-SQL
Knowledge Base Construction for Knowledge-Augmented Text-to-SQL

Jinheon Baek, Horst Samulowitz, Oktie Hassanzadeh, Dharmashankar Subramanian, Sola Shirai, Alfio Gliozzo, Debarun Bhattacharjya•May 28, 2025•11

복잡한 명령어 수행을 위한 역방향 선호도 최적화
Reverse Preference Optimization for Complex Instruction Following

Xiang Huang, Ting-En Lin, Feiteng Fang, Yuchuan Wu, Hangyu Li, Yuzhong Qu, Fei Huang, Yongbin Li•May 28, 2025•31

추론 언어 모델을 위한 강화 학습의 엔트로피 메커니즘
The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Ganqu Cui, Yuchen Zhang, Jiacheng Chen, Lifan Yuan, Zhi Wang, Yuxin Zuo, Haozhan Li, Yuchen Fan, Huayu Chen, Weize Chen, Zhiyuan Liu, Hao Peng, Lei Bai, Wanli Ouyang, Yu Cheng, Bowen Zhou, Ning Ding•May 28, 2025•1123

SWE-rebench: 소프트웨어 엔지니어링 에이전트를 위한 작업 수집 및 오염 제거 평가를 위한 자동화된 파이프라인
SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents

Ibragim Badertdinov, Alexander Golubev, Maksim Nekrashevich, Anton Shevtsov, Simon Karasik, Andrei Andriushchenko, Maria Trofimova, Daria Litvintseva, Boris Yangel•May 26, 2025•842

R2R: 소형-대형 모델 토큰 라우팅을 통해 다양한 추론 경로를 효율적으로 탐색
R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing

Tianyu Fu, Yi Ge, Yichen You, Enshu Liu, Zhihang Yuan, Guohao Dai, Shengen Yan, Huazhong Yang, Yu Wang•May 27, 2025•682

스카이워크 오픈 리소너 1 기술 보고서
Skywork Open Reasoner 1 Technical Report

Jujie He, Jiacai Liu, Chris Yuhao Liu, Rui Yan, Chaojie Wang, Peng Cheng, Xiaoyu Zhang, Fuxiang Zhang, Jiacheng Xu, Wei Shen, Siyuan Li, Liang Zeng, Tianwen Wei, Cheng Cheng, Bo An, Yang Liu, Yahui Zhou•May 28, 2025•526

Sherlock: 시각-언어 모델에서의 자가 수정 추론
Sherlock: Self-Correcting Reasoning in Vision-Language Models

Yi Ding, Ruqi Zhang•May 28, 2025•502

GRPO를 통한 다중 모드 LLM 추론을 위한 비지도 사후 학습
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

Lai Wei, Yuting Li, Chen Wang, Yue Wang, Linghe Kong, Weiran Huang, Lichao Sun•May 28, 2025•452

체인-오브-줌: 스케일 자기회귀와 선호도 정렬을 통한 극한 초고해상도
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Bryan Sangwoo Kim, Jeongsol Kim, Jong Chul Ye•May 24, 2025•434

SageAttention2++: SageAttention2의 더 효율적인 구현
SageAttention2++: A More Efficient Implementation of SageAttention2

Jintao Zhang, Xiaoming Xu, Jia Wei, Haofeng Huang, Pengle Zhang, Chendong Xiang, Jun Zhu, Jianfei Chen•May 27, 2025•412

콜드 스타트와 함께 강화 학습을 통한 다중 모달 추론의 발전
Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start

Lai Wei, Yuting Li, Kaipeng Zheng, Chen Wang, Yue Wang, Linghe Kong, Lichao Sun, Weiran Huang•May 28, 2025•362

RenderFormer: 전역 조명을 적용한 삼각형 메쉬의 트랜스포머 기반 신경 렌더링
RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination

Chong Zeng, Yue Dong, Pieter Peers, Hongzhi Wu, Xin Tong•May 28, 2025•333

다음 이벤트 예측을 통한 비디오 추론 능력 강화
Fostering Video Reasoning via Next-Event Prediction

Haonan Wang, Hongfu Liu, Xiangyan Liu, Chao Du, Kenji Kawaguchi, Ye Wang, Tianyu Pang•May 28, 2025•272

DeepResearchGym: 무료, 투명, 재현 가능한 딥 리서치 평가 샌드박스
DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research

João Coelho, Jingjie Ning, Jingyuan He, Kangrui Mao, Abhijay Paladugu, Pranav Setlur, Jiahe Jin, Jamie Callan, João Magalhães, Bruno Martins, Chenyan Xiong•May 25, 2025•252

엔터프라이즈 시스템에서 도메인 특화 검색을 위한 하드 네거티브 마이닝
Hard Negative Mining for Domain-Specific Retrieval in Enterprise Systems

Hansa Meghwani, Amit Agarwal, Priyaranjan Pattnayak, Hitesh Laxmichand Patel, Srikant Panda•May 23, 2025•252

FS-DAG: 시각적으로 풍부한 문서 이해를 위한 Few Shot 도메인 적응 그래프 네트워크
FS-DAG: Few Shot Domain Adapting Graph Networks for Visually Rich Document Understanding

Amit Agarwal, Srikant Panda, Kulbhushan Pachauri•May 22, 2025•222

유니버설 리소너: 고정된 LLM을 위한 단일, 구성 가능한 플러그 앤 플레이 추론기
Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs

Jaemin Kim, Hangeol Chang, Hyunmin Hwang, Choonghan Kim, Jong Chul Ye•May 25, 2025•212

WebDancer: 자율적 정보 탐색 에이전시를 향하여
WebDancer: Towards Autonomous Information Seeking Agency

Jialong Wu, Baixuan Li, Runnan Fang, Wenbiao Yin, Liwen Zhang, Zhengwei Tao, Dingchu Zhang, Zekun Xi, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou•May 28, 2025•185

다국어 접근 방식을 통한 사전 학습 데이터 필터링: 언어 모델을 활용한 품질 평가
Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models

Mehdi Ali, Manuel Brack, Max Lübbering, Elias Wendt, Abbas Goher Khan, Richard Rutmann, Alex Jude, Maurice Kraus, Alexander Arno Weber, Felix Stollenwerk, David Kaczér, Florian Mai, Lucie Flek, Rafet Sifa, Nicolas Flores-Herr, Joachim Köhler, Patrick Schramowski, Michael Fromm, Kristian Kersting•May 28, 2025•182

문장별로 예측해 봅시다
Let's Predict Sentence by Sentence

Hyeonbin Hwang, Byeongguk Jeon, Seungone Kim, Jiyeon Kim, Hoyeon Chang, Sohee Yang, Seungpil Won, Dohaeng Lee, Youbin Ahn, Minjoon Seo•May 28, 2025•172

안정적인 확산을 통한 텍스트에서 360도 파노라마 생성의 조건은 무엇인가?
What Makes for Text to 360-degree Panorama Generation with Stable Diffusion?

Jinhong Ni, Chang-Bin Zhang, Qiang Zhang, Jing Zhang•May 28, 2025•152

SVRPBench: 확률적 차량 경로 문제를 위한 현실적인 벤치마크
SVRPBench: A Realistic Benchmark for Stochastic Vehicle Routing Problem

Ahmed Heakl, Yahia Salaheldin Shaaban, Martin Takac, Salem Lahlou, Zangir Iklassov•May 28, 2025•152

LLM을 위한 개인화된 안전성: 벤치마크 및 계획 기반 에이전트 접근법
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach

Yuchen Wu, Edward Sun, Kaijie Zhu, Jianxun Lian, Jose Hernandez-Orallo, Aylin Caliskan, Jindong Wang•May 24, 2025•142

토큰 축소는 생성 모델에서 효율성을 넘어서야 한다 -- 비전, 언어에서 다중모달리티까지
Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality

Zhenglun Kong, Yize Li, Fanhu Zeng, Lei Xin, Shvat Messica, Xue Lin, Pu Zhao, Manolis Kellis, Hao Tang, Marinka Zitnik•May 23, 2025•143

동적 마음 이론을 향하여: 인간 상태의 시간적 변화에 대한 대형 언어 모델의 적응력 평가
Towards Dynamic Theory of Mind: Evaluating LLM Adaptation to Temporal Evolution of Human States

Yang Xiao, Jiashuo Wang, Qiancheng Xu, Changhe Song, Chunpu Xu, Yi Cheng, Wenjie Li, Pengfei Liu•May 23, 2025•142

생성된 이미지로 사고하기
Thinking with Generated Images

Ethan Chern, Zhulin Hu, Steffi Chern, Siqi Kou, Jiadi Su, Yan Ma, Zhijie Deng, Pengfei Liu•May 28, 2025•133

CHIMERA: 과학 문헌 내 아이디어 재조합 지식 베이스
CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature

Noy Sternlicht, Tom Hope•May 27, 2025•133

턴 단위 신용 할당을 통한 LLM 에이전트의 다중 턴 추론 강화
Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Credit Assignment

Siliang Zeng, Quan Wei, William Brown, Oana Frunza, Yuriy Nevmyvaka, Mingyi Hong•May 17, 2025•132

LIMOPro: 효율적이고 효과적인 테스트 시간 스케일링을 위한 추론 정제
LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling

Yang Xiao, Jiashuo Wang, Ruifeng Yuan, Chunpu Xu, Kaishuai Xu, Wenjie Li, Pengfei Liu•May 25, 2025•122

VRAG-RL: 강화 학습을 통한 반복적 추론 기반 시각적 정보 이해를 위한 시각 인식 기반 RAG 강화
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning

Qiuchen Wang, Ruixue Ding, Yu Zeng, Zehui Chen, Lin Chen, Shihang Wang, Pengjun Xie, Fei Huang, Feng Zhao•May 28, 2025•103

EPiC: 정밀 앵커-비디오 안내를 통한 효율적인 비디오 카메라 제어 학습
EPiC: Efficient Video Camera Control Learning with Precise Anchor-Video Guidance

Zun Wang, Jaemin Cho, Jialu Li, Han Lin, Jaehong Yoon, Yue Zhang, Mohit Bansal•May 28, 2025•92

RICO: 시각적 재구성을 통한 이미지 재캡션의 정확성과 완전성 향상
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

Yuchi Wang, Yishuo Cai, Shuhuai Ren, Sihan Yang, Linli Yao, Yuanxin Liu, Yuanxing Zhang, Pengfei Wan, Xu Sun•May 28, 2025•72

PrismLayers: 고품질 다중 레이어 투명 이미지 생성 모델을 위한 오픈 데이터
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

Junwen Chen, Heyang Jiang, Yanbin Wang, Keming Wu, Ji Li, Chao Zhang, Keiji Yanai, Dong Chen, Yuhui Yuan•May 28, 2025•62

Text2Grad: 자연어 피드백을 통한 강화 학습
Text2Grad: Reinforcement Learning from Natural Language Feedback

Hanyang Wang, Lu Wang, Chaoyun Zhang, Tianjun Mao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang•May 28, 2025•62

규칙 및 모델 기반 검증기의 함정 — 수학적 추론 사례 연구
Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Yuzhen Huang, Weihao Zeng, Xingshan Zeng, Qi Zhu, Junxian He•May 28, 2025•62

Prot2Token: 다음 토큰 예측을 통한 단백질 모델링을 위한 통합 프레임워크
Prot2Token: A Unified Framework for Protein Modeling via Next-Token Prediction

Mahdi Pourmirzaei, Farzaneh Esmaili, Salhuldin Alqarghuli, Mohammadreza Pourmirzaei, Ye Han, Kai Chen, Mohsen Rezaei, Duolin Wang, Dong Xu•May 26, 2025•62

MangaVQA와 MangaLMM: 멀티모달 만화 이해를 위한 벤치마크 및 전용 모델
MangaVQA and MangaLMM: A Benchmark and Specialized Model for Multimodal Manga Understanding

Jeonghun Baek, Kazuki Egashira, Shota Onohara, Atsuyuki Miyai, Yuki Imajuku, Hikaru Ikuta, Kiyoharu Aizawa•May 26, 2025•62

원웨이 티켓: 텍스트-이미지 확산 모델 증류를 위한 시간 독립적 통합 인코더
One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

Senmao Li, Lei Wang, Kai Wang, Tao Liu, Jiehang Xie, Joost van de Weijer, Fahad Shahbaz Khan, Shiqi Yang, Yaxing Wang, Jian Yang•May 28, 2025•52

인간이 백신이 필요하듯, 모델도 마찬가지입니다: 허위 정보 퇴치를 위한 모델 면역화
Just as Humans Need Vaccines, So Do Models: Model Immunization to Combat Falsehoods

Shaina Raza, Rizwan Qureshi, Marcelo Lotif, Aman Chadha, Deval Pandya, Christos Emmanouilidis•May 23, 2025•52

Styl3R: 임의의 장면과 스타일에 대한 즉각적인 3D 스타일화 재구성
Styl3R: Instant 3D Stylized Reconstruction for Arbitrary Scenes and Styles

Peng Wang, Xiang Liu, Peidong Liu•May 27, 2025•42

대규모 데이터 선택을 위한 영향력 증류 기법
Efficient Data Selection at Scale via Influence Distillation

Mahdi Nikdan, Vincent Cohen-Addad, Dan Alistarh, Vahab Mirrokni•May 25, 2025•42

GRE Suite: 세밀하게 조정된 시각-언어 모델과 강화된 추론 체인을 통한 지리적 위치 추론
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains

Chun Wang, Xiaoran Pan, Zihao Pan, Haofan Wang, Yiren Song•May 24, 2025•42

Safe-Sora: 그래픽 워터마킹을 통한 안전한 텍스트-투-비디오 생성
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking

Zihan Su, Xuerui Qiu, Hongbin Xu, Tangyu Jiang, Junhao Zhuang, Chun Yuan, Ming Li, Shengfeng He, Fei Richard Yu•May 19, 2025•42

LLM 서로게이트를 통한 제로샷 비전 인코더 접목
Zero-Shot Vision Encoder Grafting via LLM Surrogates

Kaiyu Yue, Vasu Singla, Menglin Jia, John Kirchenbauer, Rifaa Qadri, Zikui Cai, Abhinav Bhatele, Furong Huang, Tom Goldstein•May 28, 2025•32

FastTD3: 인간형 로봇 제어를 위한 단순하고 빠르며 강력한 강화 학습
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

Younggyo Seo, Carmelo Sferrazza, Haoran Geng, Michal Nauman, Zhao-Heng Yin, Pieter Abbeel•May 28, 2025•32

AITEE - 전기공학을 위한 에이전트 기반 튜터
AITEE -- Agentic Tutor for Electrical Engineering

Christopher Knievel, Alexander Bernhardt, Christian Bernhardt•May 27, 2025•32

HoPE: 비전-언어 모델의 길이 일반화를 위한 하이브리드 위치 임베딩
HoPE: Hybrid of Position Embedding for Length Generalization in Vision-Language Models

Haoran Li, Yingjie Qin, Baoyuan Ou, Lai Xu, Ruiwen Xu•May 26, 2025•32

Hugging Face 지식 그래프 기반 추천, 분류 및 추적 벤치마킹
Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph

Qiaosheng Chen, Kaijia Huang, Xiao Zhou, Weiqing Luo, Yuanning Cui, Gong Cheng•May 23, 2025•32

인간 고차 시각 피질의 인-컨텍스트 트랜스포머 모델을 위한 메타러닝
Meta-Learning an In-Context Transformer Model of Human Higher Visual Cortex

Muquan Yu, Mu Nan, Hossein Adeli, Jacob S. Prince, John A. Pyles, Leila Wehbe, Margaret M. Henderson, Michael J. Tarr, Andrew F. Luo•May 21, 2025•32

편향 특성화: 간체 중국어 대 번체 중국어에서의 대형 언어 모델 벤치마킹
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese

Hanjia Lyu, Jiebo Luo, Jian Kang, Allison Koenecke•May 28, 2025•22

똑바로 세워졌나? 다축 세부 인지 과제를 통해 MLLM의 방향 이해 능력 분석
Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks

Keanu Nichols, Nazia Tasnim, Yan Yuting, Nicholas Ikechukwu, Elva Zou, Deepti Ghadiyaram, Bryan Plummer•May 27, 2025•22

명령어 특정 뉴런 및 전문가의 발견: 대형 언어 모델의 명령어 수행 능력에 대한 분석적 프레임워크
Unveiling Instruction-Specific Neurons & Experts: An Analytical Framework for LLM's Instruction-Following Capabilities

Junyan Zhang, Yubo Gao, Yibo Yan, Jungang Li, Zhaorui Hou, Sicheng Tao, Shuliang Liu, Song Dai, Yonghua Hei, Junzhuo Li, Xuming Hu•May 27, 2025•21

MUSEG: 타임스탬프 인식 다중 세그먼트 그라운딩을 통한 비디오 시간적 이해 강화
MUSEG: Reinforcing Video Temporal Understanding via Timestamp-Aware Multi-Segment Grounding

Fuwen Luo, Shengfeng Lou, Chi Chen, Ziyue Wang, Chenliang Li, Weizhou Shen, Jiyue Guo, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Yang Liu•May 27, 2025•22

대규모 언어 모델에서 정밀한 매개변수 내 개념 삭제
Precise In-Parameter Concept Erasure in Large Language Models

Yoav Gur-Arieh, Clara Suslik, Yihuai Hong, Fazl Barez, Mor Geva•May 28, 2025•12

확장 가능한 3D 의료 영상을 위한 언어-이미지 사전 학습 방향
Towards Scalable Language-Image Pre-training for 3D Medical Imaging

Chenhui Zhao, Yiwei Lyu, Asadur Chowdury, Edward Harake, Akhil Kondepudi, Akshay Rao, Xinhai Hou, Honglak Lee, Todd Hollon•May 28, 2025•12

대규모 언어 모델은 실제 세계의 텍스트로부터 인과관계를 추론할 수 있는가?
Can Large Language Models Infer Causal Relationships from Real-World Text?

Ryan Saklad, Aman Chadha, Oleg Pavlov, Raha Moraffah•May 25, 2025•12

퍼스트 피니시 서치: 대규모 언어 모델에서의 효율적인 테스트 타임 스케일링
First Finish Search: Efficient Test-Time Scaling in Large Language Models

Aradhye Agarwal, Ayan Sengupta, Tanmoy Chakraborty•May 23, 2025•12

IQBench: 시각-언어 모델은 얼마나 "똑똑"한가? 인간 IQ 테스트를 통한 연구
IQBench: How "Smart'' Are Vision-Language Models? A Study with Human IQ Tests

Tan-Hanh Pham, Phu-Vinh Nguyen, Dang The Hung, Bui Trong Duong, Vu Nguyen Thanh, Chris Ngo, Tri Quang Truong, Truong-Son Hy•May 17, 2025•02