ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
February 25th, 2025
대규모 언어 모델의 안전성과 신뢰성에 미치는 양자화 방법의 영향 연구
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models
Artyom Kharinaev, Viktor Moskvoretskii, Egor Shvetsov, Kseniia Studenikina, Bykov Mikhail, Evgeny Burnaev
•
Feb 18, 2025
•
7
2
반사적 계획: 다단계 장기간 로봇 조작을 위한 비전-언어 모델
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation
Yunhai Feng, Jiaming Han, Zhuoran Yang, Xiangyu Yue, Sergey Levine, Jianlan Luo
•
Feb 23, 2025
•
13
2
VideoGrain: 다중 세분화 비디오 편집을 위한 시공간 주의력 조절
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing
Xiangpeng Yang, Linchao Zhu, Hehe Fan, Yi Yang
•
Feb 24, 2025
•
79
5
Stable-SPAM: 16비트 Adam보다 더 안정적으로 4비트에서 학습하는 방법
Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam
Tianjin Huang, Haotian Hu, Zhenyu Zhang, Gaojie Jin, Xiang Li, Li Shen, Tianlong Chen, Lu Liu, Qingsong Wen, Zhangyang Wang, Shiwei Liu
•
Feb 24, 2025
•
18
2
LoRA의 위대함을 다시 찾아서: 적응형 특이값과 전문가 혼합 최적화 정렬을 통한 LoRA 성능 향상
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment
Chenghao Fan, Zhenyi Lu, Sichen Liu, Xiaoye Qu, Wei Wei, Chengfeng Gu, Yu Cheng
•
Feb 24, 2025
•
29
4
Mobile-Agent-V: 비디오 기반 다중 에이전트 협업을 통한 모바일 디바이스 조작 학습
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Xi Zhang, Ming Yan, Ji Zhang, Fei Huang, Jitao Sang
•
Feb 24, 2025
•
13
2
X-Dancer: 표현력 있는 음악에서 인간의 댄스 비디오 생성
X-Dancer: Expressive Music to Human Dance Video Generation
Zeyuan Chen, Hongyi Xu, Guoxian Song, You Xie, Chenxu Zhang, Xin Chen, Chao Wang, Di Chang, Linjie Luo
•
Feb 24, 2025
•
11
3
InductionBench: LLM들이 가장 단순한 복잡도 클래스에서 실패하다
InductionBench: LLMs Fail in the Simplest Complexity Class
Wenyue Hua, Tyler Wong, Sun Fei, Liangming Pan, Adam Jardine, William Yang Wang
•
Feb 20, 2025
•
7
2
수학적 추론에서 테스트 타임 스케일링의 언어적 일반화 가능성
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
Guijin Son, Jiwoo Hong, Hyunwoo Ko, James Thorne
•
Feb 24, 2025
•
26
2
MutaGReP: 코드 사용을 위한 실행 없이 저장소 기반 계획 탐색
MutaGReP: Execution-Free Repository-Grounded Plan Search for Code-Use
Zaid Khan, Ali Farhadi, Ranjay Krishna, Luca Weihs, Mohit Bansal, Tanmay Gupta
•
Feb 21, 2025
•
5
2
슬래밍: 단일 GPU에서 하루 만에 음성 언어 모델 학습하기
Slamming: Training a Speech Language Model on One GPU in a Day
Gallil Maimon, Avishai Elmakies, Yossi Adi
•
Feb 19, 2025
•
69
2
MONSTER: 모나쉬 확장 가능 시계열 평가 리포지토리
MONSTER: Monash Scalable Time Series Evaluation Repository
Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
•
Feb 21, 2025
•
3
2
중국 왕조 간 시간적 추론 및 정렬 성능 벤치마킹
Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties
Zhenglin Wang, Jialong Wu, Pengfei LI, Yong Jiang, Deyu Zhou
•
Feb 24, 2025
•
8
4
간극에 주목하라! 대규모 오디오 모델의 정적 및 상호작용적 평가
Mind the Gap! Static and Interactive Evaluations of Large Audio Models
Minzhi Li, William Barr Held, Michael J Ryan, Kunat Pipatanakul, Potsawee Manakul, Hao Zhu, Diyi Yang
•
Feb 21, 2025
•
4
2
출시 이후: 생성형 AI 시스템을 위한 접근성 고려사항
Beyond Release: Access Considerations for Generative AI Systems
Irene Solaiman, Rishi Bommasani, Dan Hendrycks, Ariel Herbert-Voss, Yacine Jernite, Aviya Skowron, Andrew Trask
•
Feb 23, 2025
•
16
4
브라운 구체 속의 뱀
The snake in the Brownian sphere
Omer Angel, Emmanuel Jacob, Brett Kolesnik, Grégory Miermont
•
Feb 18, 2025
•
2
2
TAG: 다중 에이전트 계층적 강화 학습을 위한 분산형 프레임워크
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning
Giuseppe Paolo, Abdelhakim Benechehab, Hamza Cherkaoui, Albert Thomas, Balázs Kégl
•
Feb 21, 2025
•
9
2
CodeCriticBench: 대규모 언어 모델을 위한 종합적인 코드 비평 벤치마크
CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models
Alexander Zhang, Marcus Dong, Jiaheng Liu, Wei Zhang, Yejie Wang, Jian Yang, Ge Zhang, Tianyu Liu, Zhongyuan Peng, Yingshui Tan, Yuanxing Zhang, Zhexu Wang, Weixun Wang, Yancheng He, Ken Deng, Wangchunshu Zhou, Wenhao Huang, Zhaoxiang Zhang
•
Feb 23, 2025
•
27
3
Pandora3D: 고품질 3D 형태 및 텍스처 생성을 위한 포괄적 프레임워크
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation
Jiayu Yang, Taizhang Shang, Weixuan Sun, Xibin Song, Ziang Cheng, Senbo Wang, Shenzhou Chen, Weizhe Liu, Hongdong Li, Pan Ji
•
Feb 20, 2025
•
6
2
DICEPTION: 시각적 인지 작업을 위한 범용 확산 모델
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks
Canyu Zhao, Mingyu Liu, Huanyi Zheng, Muzhi Zhu, Zhiyue Zhao, Hao Chen, Tong He, Chunhua Shen
•
Feb 24, 2025
•
53
3
조기 종료 및 즉각적 신뢰도 기반 번역 품질 추정
Early-Exit and Instant Confidence Translation Quality Estimation
Vilém Zouhar, Maike Züfle, Beni Egressy, Julius Cheng, Jan Niehues
•
Feb 20, 2025
•
4
2
MegaLoc: 모든 장소를 하나의 검색으로 찾아내다
MegaLoc: One Retrieval to Place Them All
Gabriele Berton, Carlo Masone
•
Feb 24, 2025
•
3
2
흉부 X-RAY 이미지를 활용한 COVID-19 중증도 진단: ViT와 CNN 아키텍처 기반
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures
Luis Lara, Lucia Eve Berger, Rajesh Raju, Shawn Whitfield
•
Feb 23, 2025
•
2
2
멀티모달 불일치 추론(MMIR): 멀티모달 추론 모델을 위한 새로운 벤치마크
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models
Qianqi Yan, Yue Fan, Hongquan Li, Shan Jiang, Yang Zhao, Xinze Guan, Ching-Chen Kuo, Xin Eric Wang
•
Feb 22, 2025
•
18
2
허깅 페이스에서 오픈 웨이트 AI 모델 성장 예측
Forecasting Open-Weight AI Model Growth on Hugging Face
Kushal Raj Bhandari, Pin-Yu Chen, Jianxi Gao
•
Feb 21, 2025
•
10
3
RIFLEx: 비디오 확산 트랜스포머에서 길이 외삽을 위한 무료 점심
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers
Min Zhao, Guande He, Yixiao Chen, Hongzhou Zhu, Chongxuan Li, Jun Zhu
•
Feb 21, 2025
•
20
3
GCC: 컬러 체커 확산을 통한 생성적 색온도 보정
GCC: Generative Color Constancy via Diffusing a Color Checker
Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
•
Feb 24, 2025
•
28
2
오디오-FLAN: 초기 릴리스
Audio-FLAN: A Preliminary Release
Liumeng Xue, Ziya Zhou, Jiahao Pan, Zixuan Li, Shuai Fan, Yinghao Ma, Sitong Cheng, Dongchao Yang, Haohan Guo, Yujia Xiao, Xinsheng Wang, Zixuan Shen, Chuanbo Zhu, Xinshen Zhang, Tianchi Liu, Ruibin Yuan, Zeyue Tian, Haohe Liu, Emmanouil Benetos, Ge Zhang, Yike Guo, Wei Xue
•
Feb 23, 2025
•
37
2
자가 학습 기반 장기 문맥 이해
Self-Taught Agentic Long Context Understanding
Yufan Zhuang, Xiaodong Yu, Jialian Wu, Ximeng Sun, Ze Wang, Jiang Liu, Yusheng Su, Jingbo Shang, Zicheng Liu, Emad Barsoum
•
Feb 21, 2025
•
3
2
M3-AGIQA: 다중 모달, 다중 라운드, 다중 측면 AI 생성 이미지 품질 평가
M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment
Chuan Cui, Kejiang Chen, Zhihua Wei, Wen Shen, Weiming Zhang, Nenghai Yu
•
Feb 21, 2025
•
2
2
이렇게 말하노라, 장문맥 대형 언어 모델
Thus Spake Long-Context Large Language Model
Xiaoran Liu, Ruixiao Li, Mianqiu Huang, Zhigeng Liu, Yuerong Song, Qipeng Guo, Siyang He, Qiqi Wang, Linlin Li, Qun Liu, Yaqian Zhou, Xuanjing Huang, Xipeng Qiu
•
Feb 24, 2025
•
73
6
자동화 마케팅을 위한 근거 기반 설득적 언어 생성
Grounded Persuasive Language Generation for Automated Marketing
Jibang Wu, Chenghao Yang, Simon Mahns, Chaoqi Wang, Hao Zhu, Fei Fang, Haifeng Xu
•
Feb 24, 2025
•
12
3
커뮤니티 노트가 전문 팩트체커를 대체할 수 있을까?
Can Community Notes Replace Professional Fact-Checkers?
Nadav Borenstein, Greta Warren, Desmond Elliott, Isabelle Augenstein
•
Feb 19, 2025
•
6
2