ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
March 28th, 2025
Video-R1: MLLM에서 비디오 추론 강화하기
Video-R1: Reinforcing Video Reasoning in MLLMs
Kaituo Feng, Kaixiong Gong, Bohao Li, Zonghao Guo, Yibing Wang, Tianshuo Peng, Benyou Wang, Xiangyu Yue
•
Mar 27, 2025
•
78
6
대형 언어 모델 에이전트: 방법론, 응용 및 과제에 대한 조사
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
Junyu Luo, Weizhi Zhang, Ye Yuan, Yusheng Zhao, Junwei Yang, Yiyang Gu, Bohan Wu, Binqi Chen, Ziyue Qiao, Qingqing Long, Rongcheng Tu, Xiao Luo, Wei Ju, Zhiping Xiao, Yifan Wang, Meng Xiao, Chenwu Liu, Jingyang Yuan, Shichang Zhang, Yiqiao Jin, Fan Zhang, Xian Wu, Hanqing Zhao, Dacheng Tao, Philip S. Yu, Ming Zhang
•
Mar 27, 2025
•
77
2
UI-R1: 강화 학습을 통한 GUI 에이전트의 액션 예측 성능 향상
UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning
Zhengxi Lu, Yuxiang Chai, Yaxuan Guo, Xi Yin, Liang Liu, Hao Wang, Guanjing Xiong, Hongsheng Li
•
Mar 27, 2025
•
61
9
추론의 경계에 도전하다: 대규모 언어 모델을 위한 올림피아드 수준의 수학 벤치마크
Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models
Haoxiang Sun, Yingqian Min, Zhipeng Chen, Wayne Xin Zhao, Zheng Liu, Zhongyuan Wang, Lei Fang, Ji-Rong Wen
•
Mar 27, 2025
•
37
4
VBench-2.0: 본질적 충실도를 위한 비디오 생성 벤치마크 제품군의 발전
VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness
Dian Zheng, Ziqi Huang, Hongbo Liu, Kai Zou, Yinan He, Fan Zhang, Yuanhan Zhang, Jingwen He, Wei-Shi Zheng, Yu Qiao, Ziwei Liu
•
Mar 27, 2025
•
33
2
ReaRAG: 지식 기반 추론을 통한 대형 추론 모델의 사실성 강화 및 반복적 검색 증강 생성
ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation
Zhicheng Lee, Shulin Cao, Jinxin Liu, Jiajie Zhang, Weichuan Liu, Xiaoyin Che, Lei Hou, Juanzi Li
•
Mar 27, 2025
•
28
4
LeX-Art: 확장 가능한 고품질 데이터 합성을 통한 텍스트 생성 재고
LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis
Shitian Zhao, Qilong Wu, Xinyue Li, Bo Zhang, Ming Li, Qi Qin, Dongyang Liu, Kaipeng Zhang, Hongsheng Li, Yu Qiao, Peng Gao, Bin Fu, Zhen Li
•
Mar 27, 2025
•
26
2
ChatAnyone: 계층적 모션 확산 모델을 통한 스타일화된 실시간 초상화 비디오 생성
ChatAnyone: Stylized Real-time Portrait Video Generation with Hierarchical Motion Diffusion Model
Jinwei Qi, Chaonan Ji, Sheng Xu, Peng Zhang, Bang Zhang, Liefeng Bo
•
Mar 27, 2025
•
25
3
구현된 추론기(Embodied-Reasoner): 시각적 탐색, 추론, 그리고 행동의 시너지를 통한 구현된 상호작용 작업
Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks
Wenqi Zhang, Mengna Wang, Gangao Liu, Xu Huixin, Yiwei Jiang, Yongliang Shen, Guiyang Hou, Zhe Zheng, Hang Zhang, Xin Li, Weiming Lu, Peng Li, Yueting Zhuang
•
Mar 27, 2025
•
22
3
루미나-이미지 2.0: 통합적이고 효율적인 이미지 생성 프레임워크
Lumina-Image 2.0: A Unified and Efficient Image Generative Framework
Qi Qin, Le Zhuo, Yi Xin, Ruoyi Du, Zhen Li, Bin Fu, Yiting Lu, Jiakang Yuan, Xinyue Li, Dongyang Liu, Xiangyang Zhu, Manyuan Zhang, Will Beddow, Erwann Millon, Victor Perez, Wenhai Wang, Conghui He, Bo Zhang, Xiaohong Liu, Hongsheng Li, Yu Qiao, Chang Xu, Peng Gao
•
Mar 27, 2025
•
21
2
ResearchBench: 영감 기반 작업 분해를 통한 과학적 발견에서의 대형 언어 모델 벤치마킹
ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition
Yujie Liu, Zonglin Yang, Tong Xie, Jinjie Ni, Ben Gao, Yuqiang Li, Shixiang Tang, Wanli Ouyang, Erik Cambria, Dongzhan Zhou
•
Mar 27, 2025
•
20
2
FinAudio: 금융 애플리케이션을 위한 오디오 대형 언어 모델 벤치마크
FinAudio: A Benchmark for Audio Large Language Models in Financial Applications
Yupeng Cao, Haohang Li, Yangyang Yu, Shashidhar Reddy Javaji, Yueru He, Jimin Huang, Zining Zhu, Qianqian Xie, Xiao-yang Liu, Koduvayur Subbalakshmi, Meikang Qiu, Sophia Ananiadou, Jian-Yun Nie
•
Mar 26, 2025
•
19
2
합성 비디오는 비디오 합성에서 물리적 정확도를 향상시킨다.
Synthetic Video Enhances Physical Fidelity in Video Synthesis
Qi Zhao, Xingyu Ni, Ziyu Wang, Feng Cheng, Ziyan Yang, Lu Jiang, Bohan Wang
•
Mar 26, 2025
•
16
3
확산 샘플링을 위한 최적의 스텝 크기
Optimal Stepsize for Diffusion Sampling
Jianning Pei, Han Hu, Shuyang Gu
•
Mar 27, 2025
•
13
2
비디오 생성에서 물리학 인식의 진화 탐구: 연구 동향 분석
Exploring the Evolution of Physics Cognition in Video Generation: A Survey
Minghui Lin, Xiang Wang, Yishan Wang, Shu Wang, Fengqi Dai, Pengxiang Ding, Cunxiang Wang, Zhengrong Zuo, Nong Sang, Siteng Huang, Donglin Wang
•
Mar 27, 2025
•
11
2
통합 다중모달 이산 확산
Unified Multimodal Discrete Diffusion
Alexander Swerdlow, Mihir Prabhudesai, Siddharth Gandhi, Deepak Pathak, Katerina Fragkiadaki
•
Mar 26, 2025
•
9
2
Feature4X: 다목적 가우시안 특징 필드를 통해 단안 비디오를 4D 에이전트 AI로 연결하기
Feature4X: Bridging Any Monocular Video to 4D Agentic AI with Versatile Gaussian Feature Fields
Shijie Zhou, Hui Ren, Yijia Weng, Shuwang Zhang, Zhen Wang, Dejia Xu, Zhiwen Fan, Suya You, Zhangyang Wang, Leonidas Guibas, Achuta Kadambi
•
Mar 26, 2025
•
8
2
시맨틱 라이브러리 적응: 오픈-보커블러리 시맨틱 세그멘테이션을 위한 LoRA 검색 및 융합
Semantic Library Adaptation: LoRA Retrieval and Fusion for Open-Vocabulary Semantic Segmentation
Reza Qorbani, Gianluca Villani, Theodoros Panagiotakopoulos, Marc Botet Colomer, Linus Härenstam-Nielsen, Mattia Segu, Pier Luigi Dovesi, Jussi Karlgren, Daniel Cremers, Federico Tombari, Matteo Poggi
•
Mar 27, 2025
•
7
2
ZJUKLAB, SemEval-2025 Task 4: 모델 병합을 통한 언러닝
ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging
Haoming Xu, Shuxun Wang, Yanqiu Zhao, Yi Zhong, Ziyan Jiang, Ningyuan Zhao, Shumin Deng, Huajun Chen, Ningyu Zhang
•
Mar 27, 2025
•
7
2
LLPut: 버그 리포트 기반 입력 생성을 위한 대형 언어 모델 연구
LLPut: Investigating Large Language Models for Bug Report-Based Input Generation
Alif Al Hasan, Subarna Saha, Mia Mohammad Imran, Tarannum Shaila Zaman
•
Mar 26, 2025
•
5
2
Tracktention: 포인트 트래킹을 활용하여 더 빠르고 더 나은 비디오 주목 수행
Tracktention: Leveraging Point Tracking to Attend Videos Faster and Better
Zihang Lai, Andrea Vedaldi
•
Mar 25, 2025
•
2
2
LOCATEdit: 텍스트 기반 이미지 편집을 위한 그래프 라플라시안 최적화 교차 주의 메커니즘
LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing
Achint Soni, Meet Soni, Sirisha Rambhatla
•
Mar 27, 2025
•
1
2