ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
April 10th, 2025
WildGS-SLAM: 동적 환경에서의 단안 Gaussian Splatting SLAM
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments
Jianhao Zheng, Zihan Zhu, Valentin Bieri, Marc Pollefeys, Songyou Peng, Iro Armeni
•
Apr 4, 2025
•
10
3
객체 중심 학습은 이제 끝난 것인가?
Are We Done with Object-Centric Learning?
Alexander Rubinstein, Ameya Prabhu, Matthias Bethge, Seong Joon Oh
•
Apr 9, 2025
•
6
2
DiTaiListener: 확산 모델 기반의 제어 가능한 고품질 청자 비디오 생성
DiTaiListener: Controllable High Fidelity Listener Video Generation with Diffusion
Maksim Siniukov, Di Chang, Minh Tran, Hongkun Gong, Ashutosh Chaubey, Mohammad Soleymani
•
Apr 5, 2025
•
10
2
결여된 전제가 과도한 사고를 악화시킨다: 추론 모델이 비판적 사고 능력을 상실하고 있는가?
Missing Premise exacerbates Overthinking: Are Reasoning Models losing Critical Thinking Skill?
Chenrui Fan, Ming Li, Lichao Sun, Tianyi Zhou
•
Apr 9, 2025
•
39
3
OmniCaptioner: 모든 것을 포괄하는 단일 캡셔너
OmniCaptioner: One Captioner to Rule Them All
Yiting Lu, Jiakang Yuan, Zhen Li, Shitian Zhao, Qi Qin, Xinyue Li, Le Zhuo, Licheng Wen, Dongyang Liu, Yuewen Cao, Xiangchao Yan, Xin Li, Botian Shi, Tao Chen, Zhibo Chen, Lei Bai, Bo Zhang, Peng Gao
•
Apr 9, 2025
•
20
2
RobustDexGrasp: 단일 시각 인식을 통한 일반 물체의 강건한 정밀 그리핑
RobustDexGrasp: Robust Dexterous Grasping of General Objects from Single-view Perception
Hui Zhang, Zijian Wu, Linyi Huang, Sammy Christen, Jie Song
•
Apr 7, 2025
•
5
2
조건부 이미지 생성을 평가하기 위한 통합 에이전트 프레임워크
A Unified Agentic Framework for Evaluating Conditional Image Generation
Jifang Wang, Xue Yang, Longyue Wang, Zhenran Xu, Yiyu Wang, Yaowei Wang, Weihua Luo, Kaifu Zhang, Baotian Hu, Min Zhang
•
Apr 9, 2025
•
30
2
적응형 가중치 거부 샘플링을 통한 언어 모델의 빠른 제어 생성
Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling
Benjamin Lipkin, Benjamin LeBrun, Jacob Hoover Vigly, João Loula, David R. MacIver, Li Du, Jason Eisner, Ryan Cotterell, Vikash Mansinghka, Timothy J. O'Donnell, Alexander K. Lew, Tim Vieira
•
Apr 7, 2025
•
3
2
DDT: 디커플드 디퓨전 트랜스포머
DDT: Decoupled Diffusion Transformer
Shuai Wang, Zhi Tian, Weilin Huang, Limin Wang
•
Apr 8, 2025
•
73
3
자기 주도 언어 모델
Self-Steering Language Models
Gabriel Grand, Joshua B. Tenenbaum, Vikash K. Mansinghka, Alexander K. Lew, Jacob Andreas
•
Apr 9, 2025
•
18
2
언어 모델 추론의 진보에 대한 냉철한 평가: 재현성의 함정과 해결 방안
A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility
Andreas Hochlehnert, Hardik Bhatnagar, Vishaal Udandarao, Samuel Albanie, Ameya Prabhu, Matthias Bethge
•
Apr 9, 2025
•
21
3
역사적 언어 변화 탐색을 위한 언어 모델 사전 학습
Pretraining Language Models for Diachronic Linguistic Change Discovery
Elisabeth Fittschen, Sabrina Li, Tom Lippincott, Leshem Choshen, Craig Messner
•
Apr 7, 2025
•
6
2
GenDoP: 자동회귀적 카메라 궤적 생성 기술로서의 촬영 감독
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography
Mengchen Zhang, Tong Wu, Jing Tan, Ziwei Liu, Gordon Wetzstein, Dahua Lin
•
Apr 9, 2025
•
23
2
VideoChat-R1: 강화 학습 기반 미세 조정을 통한 시공간 인지 능력 향상
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
Xinhao Li, Ziang Yan, Desen Meng, Lu Dong, Xiangyu Zeng, Yinan He, Yali Wang, Yu Qiao, Yi Wang, Limin Wang
•
Apr 9, 2025
•
10
2
RuOpinionNE-2024: 러시아 뉴스 텍스트에서의 의견 튜플 추출
RuOpinionNE-2024: Extraction of Opinion Tuples from Russian News Texts
Natalia Loukachevitch, Natalia Tkachenko, Anna Lapanitsyna, Mikhail Tikhomirov, Nicolay Rusnachenko
•
Apr 9, 2025
•
4
3
비디오 속 모든 것 캡션화: 시공간적 멀티모달 프롬프팅을 통한 세밀한 객체 중심 캡션 생성
Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting
Yunlong Tang, Jing Bi, Chao Huang, Susan Liang, Daiki Shimada, Hang Hua, Yunzhong Xiao, Yizhi Song, Pinxin Liu, Mingqian Feng, Junjia Guo, Zhuo Liu, Luchuan Song, Ali Vosoughi, Jinxi He, Liu He, Zeliang Zhang, Jiebo Luo, Chenliang Xu
•
Apr 7, 2025
•
16
1
마스크된 장면 모델링: 3D 장면 이해에서 지도 학습과 자기 지도 학습 간의 격차 좁히기
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding
Pedro Hermosilla, Christian Stippel, Leon Sick
•
Apr 9, 2025
•
9
2
FantasyTalking: 일관된 모션 합성을 통한 사실적 초상화 대화 생성
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis
Mengchao Wang, Qiang Wang, Fan Jiang, Yaqi Fan, Yunpeng Zhang, Yonggang Qi, Kun Zhao, Mu Xu
•
Apr 7, 2025
•
35
3
OLMoTrace: 수조 개의 학습 토큰으로부터 언어 모델 출력의 근원 추적
OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens
Jiacheng Liu, Taylor Blanton, Yanai Elazar, Sewon Min, YenSung Chen, Arnavi Chheda-Kothary, Huy Tran, Byron Bischoff, Eric Marsh, Michael Schmitz, Cassidy Trier, Aaron Sarnat, Jenna James, Jon Borchardt, Bailey Kuehl, Evie Cheng, Karen Farley, Sruthi Sreeram, Taira Anderson, David Albright, Carissa Schoenick, Luca Soldaini, Dirk Groeneveld, Rock Yuren Pang, Pang Wei Koh, Noah A. Smith, Sophie Lebrecht, Yejin Choi, Hannaneh Hajishirzi, Ali Farhadi, Jesse Dodge
•
Apr 9, 2025
•
73
3
SkillWeaver: 웹 에이전트는 스킬을 발견하고 연마함으로써 자기 개선이 가능하다
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
•
Apr 9, 2025
•
0
1