ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
May 23rd, 2025
NovelSeek: 에이전트가 과학자가 될 때 - 가설에서 검증까지의 폐쇄형 시스템 구축
NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification
NovelSeek Team, Bo Zhang, Shiyang Feng, Xiangchao Yan, Jiakang Yuan, Zhiyin Yu, Xiaohan He, Songtao Huang, Shaowei Hou, Zheng Nie, Zhilong Wang, Jinyao Liu, Runmin Ma, Tianshuo Peng, Peng Ye, Dongzhan Zhou, Shufei Zhang, Xiaosong Wang, Yilan Zhang, Meng Li, Zhongying Tu, Xiangyu Yue, Wangli Ouyang, Bowen Zhou, Lei Bai
•
May 22, 2025
•
82
0
추론 확장, 통제 상실: 대규모 추론 모델의 명령어 수행 능력 평가
Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models
Tingchen Fu, Jiawei Gu, Yafu Li, Xiaoye Qu, Yu Cheng
•
May 20, 2025
•
49
1
Tool-Star: 강화 학습을 통한 LLM 기반 다중 도구 추론기 강화
Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning
Guanting Dong, Yifei Chen, Xiaoxi Li, Jiajie Jin, Hongjin Qian, Yutao Zhu, Hangyu Mao, Guorui Zhou, Zhicheng Dou, Ji-Rong Wen
•
May 22, 2025
•
42
1
Pixel Reasoner: 호기심 기반 강화 학습을 통한 픽셀 공간 추론 유도
Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning
Alex Su, Haozhe Wang, Weimin Ren, Fangzhen Lin, Wenhu Chen
•
May 21, 2025
•
37
1
KRIS-Bench: 차세대 지능형 이미지 편집 모델 벤치마킹
KRIS-Bench: Benchmarking Next-Level Intelligent Image Editing Models
Yongliang Wu, Zonghui Li, Xinting Hu, Xinyu Ye, Xianfang Zeng, Gang Yu, Wenbo Zhu, Bernt Schiele, Ming-Hsuan Yang, Xu Yang
•
May 22, 2025
•
36
1
QuickVideo: 시스템 알고리즘 공동 설계를 통한 실시간 장영상 이해
QuickVideo: Real-Time Long Video Understanding with System Algorithm Co-Design
Benjamin Schneider, Dongfu Jiang, Chao Du, Tianyu Pang, Wenhu Chen
•
May 22, 2025
•
30
1
GoT-R1: 강화 학습을 통한 MLLM의 시각적 생성 능력과 추론 능력의 결합
GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning
Chengqi Duan, Rongyao Fang, Yuqing Wang, Kun Wang, Linjiang Huang, Xingyu Zeng, Hongsheng Li, Xihui Liu
•
May 22, 2025
•
23
1
LLaDA-V: 시각적 명령어 튜닝을 통한 대규모 언어 확산 모델
LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning
Zebin You, Shen Nie, Xiaolu Zhang, Jun Hu, Jun Zhou, Zhiwu Lu, Ji-Rong Wen, Chongxuan Li
•
May 22, 2025
•
22
2
μP를 통해 확산 트랜스포머를 효율적으로 확장하기
Scaling Diffusion Transformers Efficiently via μP
Chenyu Zheng, Xinyu Zhang, Rongzhen Wang, Wei Huang, Zhi Tian, Weilin Huang, Jun Zhu, Chongxuan Li
•
May 21, 2025
•
21
1
이타쿠라-사이토 손실을 활용한 위험 회피형 강화 학습
Risk-Averse Reinforcement Learning with Itakura-Saito Loss
Igor Udovichenko, Olivier Croissant, Anita Toleutaeva, Evgeny Burnaev, Alexander Korotin
•
May 22, 2025
•
20
1
일상적인 이미지 편집 작업에서 생성형 AI의 능력 이해하기
Understanding Generative AI Capabilities in Everyday Image Editing Tasks
Mohammad Reza Taesiri, Brandon Collins, Logan Bolton, Viet Dac Lai, Franck Dernoncourt, Trung Bui, Anh Totti Nguyen
•
May 22, 2025
•
20
1
과도한 사고에서 벗어나도록 LLM을 자가 제동 튜닝으로 조정하기
Let LLMs Break Free from Overthinking via Self-Braking Tuning
Haoran Zhao, Yuchen Yan, Yongliang Shen, Haolei Xu, Wenqi Zhang, Kaitao Song, Jian Shao, Weiming Lu, Jun Xiao, Yueting Zhuang
•
May 20, 2025
•
18
1
VideoGameQA-Bench: 비디오 게임 품질 보증을 위한 비전-언어 모델 평가
VideoGameQA-Bench: Evaluating Vision-Language Models for Video Game Quality Assurance
Mohammad Reza Taesiri, Abhijay Ghildyal, Saman Zadtootaghaj, Nabajeet Barman, Cor-Paul Bezemer
•
May 21, 2025
•
17
1
간극을 주목하라: 사고 도약을 연결하여 사고 사슬(Chain-of-Thought) 튜닝 개선하기
Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning
Haolei Xu, Yuchen Yan, Yongliang Shen, Wenqi Zhang, Guiyang Hou, Shengpei Jiang, Kaitao Song, Weiming Lu, Jun Xiao, Yueting Zhuang
•
May 20, 2025
•
17
1
AceReason-Nemotron: 강화 학습을 통한 수학 및 코드 추론의 발전
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning
Yang Chen, Zhuolin Yang, Zihan Liu, Chankyu Lee, Peng Xu, Mohammad Shoeybi, Bryan Catanzaro, Wei Ping
•
May 22, 2025
•
16
1
Dimple: 병렬 디코딩을 지원하는 이산 확산 멀티모달 대형 언어 모델
Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding
Runpeng Yu, Xinyin Ma, Xinchao Wang
•
May 22, 2025
•
14
1
MLLM 미세 조정에서 외부 지침 없이 백도어 정리하기
Backdoor Cleaning without External Guidance in MLLM Fine-tuning
Xuankun Rong, Wenke Huang, Jian Liang, Jinhe Bi, Xun Xiao, Yiming Li, Bo Du, Mang Ye
•
May 22, 2025
•
14
1
동적 토큰 조각화를 통한 학습 없이 효율적인 비디오 생성
Training-Free Efficient Video Generation via Dynamic Token Carving
Yuechen Zhang, Jinbo Xing, Bin Xia, Shaoteng Liu, Bohao Peng, Xin Tao, Pengfei Wan, Eric Lo, Jiaya Jia
•
May 22, 2025
•
12
1
SophiaVL-R1: 사고 보상을 통한 MLLM 추론 강화
SophiaVL-R1: Reinforcing MLLMs Reasoning with Thinking Reward
Kaixuan Fan, Kaituo Feng, Haoming Lyu, Dongzhan Zhou, Xiangyu Yue
•
May 22, 2025
•
11
1
성능을 저해하는 데이터 수정: 강건한 정보 검색을 위한 어려운 부정 예제 재라벨링을 위한 LLM 캐스케이딩
Fixing Data That Hurts Performance: Cascading LLMs to Relabel Hard Negatives for Robust Information Retrieval
Nandan Thakur, Crystina Zhang, Xueguang Ma, Jimmy Lin
•
May 22, 2025
•
11
2
SpatialScore: 다중모달 공간 이해를 위한 통합 평가 프레임워크
SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding
Haoning Wu, Xiao Huang, Yaohui Chen, Ya Zhang, Yanfeng Wang, Weidi Xie
•
May 22, 2025
•
10
1
LaViDa: 멀티모달 이해를 위한 대규모 확산 언어 모델
LaViDa: A Large Diffusion Language Model for Multimodal Understanding
Shufan Li, Konstantinos Kallidromitis, Hritik Bansal, Akash Gokul, Yusuke Kato, Kazuki Kozuka, Jason Kuen, Zhe Lin, Kai-Wei Chang, Aditya Grover
•
May 22, 2025
•
10
1
TinyV: 검증 과정에서의 거짓 음성 감소가 LLM 추론을 위한 강화 학습을 개선한다
TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning
Zhangchen Xu, Yuetai Li, Fengqing Jiang, Bhaskar Ramasubramanian, Luyao Niu, Bill Yuchen Lin, Radha Poovendran
•
May 20, 2025
•
10
1
WebAgent-R1: 엔드투엔드 다중 턴 강화 학습을 통한 웹 에이전트 훈련
WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning
Zhepei Wei, Wenlin Yao, Yao Liu, Weizhi Zhang, Qin Lu, Liang Qiu, Changlong Yu, Puyang Xu, Chao Zhang, Bing Yin, Hyokun Yun, Lihong Li
•
May 22, 2025
•
7
1
MLLM에서의 학습 없이 추론과 성찰
Training-Free Reasoning and Reflection in MLLMs
Hongchen Wei, Zhenzhong Chen
•
May 22, 2025
•
7
2
GRIT: 이미지를 통해 MLLM이 사고하도록 가르치기
GRIT: Teaching MLLMs to Think with Images
Yue Fan, Xuehai He, Diji Yang, Kaizhi Zheng, Ching-Chen Kuo, Yuting Zheng, Sravana Jyothi Narayanaraju, Xinze Guan, Xin Eric Wang
•
May 21, 2025
•
7
1
AGENTIF: 에이전트 시나리오에서 대규모 언어 모델의 명령어 수행 능력 벤치마킹
AGENTIF: Benchmarking Instruction Following of Large Language Models in Agentic Scenarios
Yunjia Qi, Hao Peng, Xiaozhi Wang, Amy Xin, Youfeng Liu, Bin Xu, Lei Hou, Juanzi Li
•
May 22, 2025
•
6
1
생각할 것인가, 말 것인가? 시각-언어 모델을 위한 강화 학습 기반 선택적 추론
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models
Jiaqi Wang, Kevin Qinghong Lin, James Cheng, Mike Zheng Shou
•
May 22, 2025
•
6
1
VLM-R^3: 향상된 멀티모달 사고 사슬을 위한 영역 인식, 추론 및 정제
VLM-R^3: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought
Chaoya Jiang, Yongrui Heng, Wei Ye, Han Yang, Haiyang Xu, Ming Yan, Ji Zhang, Fei Huang, Shikun Zhang
•
May 22, 2025
•
6
1
OViP: 온라인 비전-언어 선호도 학습
OViP: Online Vision-Language Preference Learning
Shujun Liu, Siyuan Wang, Zejun Li, Jianxiang Wang, Cheng Zeng, Zhongyu Wei
•
May 21, 2025
•
6
1
형식 검증 도구를 활용한 훈련 단계 수준 추론 검증기 학습
Training Step-Level Reasoning Verifiers with Formal Verification Tools
Ryo Kamoi, Yusen Zhang, Nan Zhang, Sarkar Snigdha Sarathi Das, Rui Zhang
•
May 21, 2025
•
6
1
SafeKey: 안전 추론을 위한 통찰력 증폭
SafeKey: Amplifying Aha-Moment Insights for Safety Reasoning
Kaiwen Zhou, Xuandong Zhao, Gaowen Liu, Jayanth Srinivasa, Aosong Feng, Dawn Song, Xin Eric Wang
•
May 22, 2025
•
5
1
강화 학습은 대규모 언어 모델 내의 작은 서브네트워크를 미세 조정합니다
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models
Sagnik Mukherjee, Lifan Yuan, Dilek Hakkani-Tur, Hao Peng
•
May 16, 2025
•
5
1
Think-RM: 생성적 보상 모델에서 장기적 추론 가능하게 하기
Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models
Ilgee Hong, Changlong Yu, Liang Qiu, Weixiang Yan, Zhenghao Xu, Haoming Jiang, Qingru Zhang, Qin Lu, Xin Liu, Chao Zhang, Tuo Zhao
•
May 22, 2025
•
4
1
안드로이드가 전기 양을 꿈꾸게 하라: 인간과 유사한 이미지 함의 이해 및 추론 프레임워크
Let Androids Dream of Electric Sheep: A Human-like Image Implication Understanding and Reasoning Framework
Chenhao Zhang, Yazhe Niu
•
May 22, 2025
•
3
2
Multi-SpatialMLLM: 다중 프레임 공간 이해를 위한 다중 모달 대형 언어 모델
Multi-SpatialMLLM: Multi-Frame Spatial Understanding with Multi-Modal Large Language Models
Runsen Xu, Weiyao Wang, Hao Tang, Xingyu Chen, Xiaodong Wang, Fu-Jen Chu, Dahua Lin, Matt Feiszli, Kevin J. Liang
•
May 22, 2025
•
3
1
Robo2VLM: 대규모 실세계 로봇 조작 데이터셋을 활용한 시각 질의응답
Robo2VLM: Visual Question Answering from Large-Scale In-the-Wild Robot Manipulation Datasets
Kaiyuan Chen, Shuangyu Xie, Zehan Ma, Ken Goldberg
•
May 21, 2025
•
3
1
대규모 언어 모델을 활용한 기계 번역 개인화 조정
Steering Large Language Models for Machine Translation Personalization
Daniel Scalena, Gabriele Sarti, Arianna Bisazza, Elisabetta Fersini, Malvina Nissim
•
May 22, 2025
•
2
1
언제 LLM이 자신의 실수를 인정하는가? 수정 과정에서 모델의 믿음의 역할 이해하기
When Do LLMs Admit Their Mistakes? Understanding the Role of Model Belief in Retraction
Yuqing Yang, Robin Jia
•
May 22, 2025
•
2
1
날짜 조각: 시간적 추론을 위한 토큰화의 숨겨진 병목 현상
Date Fragments: A Hidden Bottleneck of Tokenization for Temporal Reasoning
Gagan Bhatia, Maxime Peyrard, Wei Zhao
•
May 22, 2025
•
2
1
대규모 시각-언어 모델은 이미지 내 텍스트를 어떻게 인식하는가? OCR 헤드의 독특한 역할 해부
How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads
Ingeol Baek, Hwan Chang, Sunghyun Ryu, Hwanhee Lee
•
May 21, 2025
•
2
1
RAVENEA: 다중모달 검색 증강 시각 문화 이해를 위한 벤치마크
RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding
Jiaang Li, Yifei Yuan, Wenyan Li, Mohammad Aliannejadi, Daniel Hershcovich, Anders Søgaard, Ivan Vulić, Wenxuan Zhang, Paul Pu Liang, Yang Deng, Serge Belongie
•
May 20, 2025
•
2
1
MUG-Eval: 모든 언어에서의 다국어 생성 능력을 위한 프록시 평가 프레임워크
MUG-Eval: A Proxy Evaluation Framework for Multilingual Generation Capabilities in Any Language
Seyoung Song, Seogyeong Jeong, Eunsu Kim, Jiho Jin, Dongkwan Kim, Jay Shin, Alice Oh
•
May 20, 2025
•
2
1
SPhyR: 물질 분포에 대한 공간-물리적 추론 벤치마크
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution
Philipp D. Siedler
•
May 21, 2025
•
1
1
RoPECraft: 궤적 기반 RoPE 최적화를 통한 학습 없이 가능한 디퓨전 트랜스포머 기반 모션 전이
RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers
Ahmet Berke Gokmen, Yigit Ekin, Bahri Batuhan Bilecen, Aysegul Dundar
•
May 19, 2025
•
1
1
SAKURA: 음성 및 오디오 정보 기반 대규모 오디오-언어 모델의 다중 홉 추론
SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information
Chih-Kai Yang, Neo Ho, Yen-Ting Piao, Hung-yi Lee
•
May 19, 2025
•
0
1