ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
May 6th, 2025
WorldGenBench: 추론 기반 텍스트-이미지 생성을 위한 세계 지식 통합 벤치마크
WorldGenBench: A World-Knowledge-Integrated Benchmark for Reasoning-Driven Text-to-Image Generation
Daoan Zhang, Che Jiang, Ruoshi Xu, Biaoxiang Chen, Zijian Jin, Yutian Lu, Jianguo Zhang, Liang Yong, Jiebo Luo, Shengda Luo
•
May 2, 2025
•
1
1
Voila: 실시간 자율 상호작용 및 음성 롤플레이를 위한 음성-언어 기반 모델
Voila: Voice-Language Foundation Models for Real-Time Autonomous Interaction and Voice Role-Play
Yemin Shi, Yu Shu, Siwei Dong, Guangyi Liu, Jaward Sesay, Jingwen Li, Zhiting Hu
•
May 5, 2025
•
39
1
RM-R1: 추론으로서의 보상 모델링
RM-R1: Reward Modeling as Reasoning
Xiusi Chen, Gaotang Li, Ziqi Wang, Bowen Jin, Cheng Qian, Yu Wang, Hongru Wang, Yu Zhang, Denghui Zhang, Tong Zhang, Hanghang Tong, Heng Ji
•
May 5, 2025
•
26
1
R1-보상: 안정적 강화 학습을 통한 다중모달 보상 모델 훈련
R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning
Yi-Fan Zhang, Xingyu Lu, Xiao Hu, Chaoyou Fu, Bin Wen, Tianke Zhang, Changyi Liu, Kaiyu Jiang, Kaibing Chen, Kaiyu Tang, Haojie Ding, Jiankang Chen, Fan Yang, Zhang Zhang, Tingting Gao, Liang Wang
•
May 5, 2025
•
13
1
FormalMATH: 대규모 언어 모델의 형식적 수학적 추론 능력 벤치마킹
FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models
Zhouliang Yu, Ruotian Peng, Keyi Ding, Yizhe Li, Zhongyuan Peng, Minghao Liu, Yifan Zhang, Zheng Yuan, Huajian Xin, Wenhao Huang, Yandong Wen, Ge Zhang, Weiyang Liu
•
May 5, 2025
•
13
1
거부 샘플링과 강화 학습에서 그래디언트 분산 최소화를 통한 사고 연쇄 추론기 최적화
Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL
Jiarui Yao, Yifan Hao, Hanning Zhang, Hanze Dong, Wei Xiong, Nan Jiang, Tong Zhang
•
May 5, 2025
•
13
1
SkillMimic-V2: 희소하고 노이즈가 있는 시연 데이터로부터 강건하고 일반화 가능한 상호작용 기술 학습
SkillMimic-V2: Learning Robust and Generalizable Interaction Skills from Sparse and Noisy Demonstrations
Runyi Yu, Yinhuai Wang, Qihan Zhao, Hok Wai Tsui, Jingbo Wang, Ping Tan, Qifeng Chen
•
May 4, 2025
•
11
1
발빠르게 사고하기: 사회적 에이전트를 위한 강화 학습 기반 적응적 사고
Think on your Feet: Adaptive Thinking via Reinforcement Learning for Social Agents
Minzheng Wang, Yongbin Li, Haobo Wang, Xinghua Zhang, Nan Xu, Bingli Wu, Fei Huang, Haiyang Yu, Wenji Mao
•
May 4, 2025
•
9
1
강화 학습을 통한 대형 언어 모델의 행위적 추론 및 도구 통합
Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning
Joykirat Singh, Raghav Magazine, Yash Pandya, Akshay Nambi
•
Apr 28, 2025
•
8
2
SuperEdit: 지시 기반 이미지 편집을 위한 감독의 정교화 및 용이화
SuperEdit: Rectifying and Facilitating Supervision for Instruction-Based Image Editing
Ming Li, Xin Gu, Fan Chen, Xiaoying Xing, Longyin Wen, Chen Chen, Sijie Zhu
•
May 5, 2025
•
7
1
야생에서의 그로킹: 트랜스포머를 활용한 실세계 다중 홉 추론을 위한 데이터 증강
Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers
Roman Abramov, Felix Steinbauer, Gjergji Kasneci
•
Apr 29, 2025
•
7
1
대규모 언어 모델의 저정밀도 훈련: 방법, 과제, 그리고 기회
Low-Precision Training of Large Language Models: Methods, Challenges, and Opportunities
Zhiwei Hao, Jianyuan Guo, Li Shen, Yong Luo, Han Hu, Guoxia Wang, Dianhai Yu, Yonggang Wen, Dacheng Tao
•
May 2, 2025
•
6
1
Ming-Lite-Uni: 자연스러운 멀티모달 상호작용을 위한 통합 아키텍처의 발전
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction
Biao Gong, Cheng Zou, Dandan Zheng, Hu Yu, Jingdong Chen, Jianxin Sun, Junbo Zhao, Jun Zhou, Kaixiang Ji, Lixiang Ru, Libin Wang, Qingpei Guo, Rui Liu, Weilong Chai, Xinyu Xiao, Ziyuan Huang
•
May 5, 2025
•
4
1
대규모 언어 모델을 위한 추론 엔진에 관한 연구: 최적화와 효율성 관점에서의 고찰
A Survey on Inference Engines for Large Language Models: Perspectives on Optimization and Efficiency
Sihyeong Park, Sungryeol Jeon, Chaelyn Lee, Seokhun Jeon, Byung-Soo Kim, Jemin Lee
•
May 3, 2025
•
4
1
TEMPURA: 행동 추론을 위한 시간적 이벤트 마스킹 예측 및 이해
TEMPURA: Temporal Event Masked Prediction and Understanding for Reasoning in Action
Jen-Hao Cheng, Vivian Wang, Huayu Wang, Huapeng Zhou, Yi-Hao Peng, Hou-I Liu, Hsiang-Wei Huang, Kuang-Ming Chen, Cheng-Yen Yang, Wenhao Chai, Yi-Ling Chen, Vibhav Vineet, Qin Cai, Jenq-Neng Hwang
•
May 2, 2025
•
3
1
MUSAR: 단일 주제 데이터셋에서 주의 라우팅을 통한 다중 주제 맞춤화 탐구
MUSAR: Exploring Multi-Subject Customization from Single-Subject Dataset via Attention Routing
Zinan Guo, Pengze Zhang, Yanze Wu, Chong Mou, Songtao Zhao, Qian He
•
May 5, 2025
•
1
1
LLaMA-Omni2: 자동회귀 스트리밍 음성 합성을 지원하는 LLM 기반 실시간 음성 채팅봇
LLaMA-Omni2: LLM-based Real-time Spoken Chatbot with Autoregressive Streaming Speech Synthesis
Qingkai Fang, Yan Zhou, Shoutao Guo, Shaolei Zhang, Yang Feng
•
May 5, 2025
•
1
1