ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
July 12th, 2024
Skywork-Math: 대규모 언어 모델의 수학적 추론을 위한 데이터 스케일링 법칙 -- 이야기는 계속된다
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On
Liang Zeng, Liangjun Zhong, Liang Zhao, Tianwen Wei, Liu Yang, Jujie He, Cheng Cheng, Rui Hu, Yang Liu, Shuicheng Yan, Han Fang, Yahui Zhou
•
Jul 11, 2024
•
53
5
보상 그래디언트를 통한 비디오 확산 정렬
Video Diffusion Alignment via Reward Gradients
Mihir Prabhudesai, Russell Mendonca, Zheyang Qin, Katerina Fragkiadaki, Deepak Pathak
•
Jul 11, 2024
•
51
2
멀티모달 셀프-인스트럭트: 언어 모델을 활용한 합성 추상 이미지 및 시각적 추론 인스트럭션 생성
Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model
Wenqi Zhang, Zhenglin Cheng, Yuanyu He, Mengna Wang, Yongliang Shen, Zeqi Tan, Guiyang Hou, Mingqian He, Yanna Ma, Weiming Lu, Yueting Zhuang
•
Jul 9, 2024
•
47
3
MAVIS: 수학적 시각적 명령어 튜닝
MAVIS: Mathematical Visual Instruction Tuning
Renrui Zhang, Xinyu Wei, Dongzhi Jiang, Yichi Zhang, Ziyu Guo, Chengzhuo Tong, Jiaming Liu, Aojun Zhou, Bin Wei, Shanghang Zhang, Peng Gao, Hongsheng Li
•
Jul 11, 2024
•
34
3
Q-GaLore: INT4 프로젝션과 계층 적응형 저랭크 그래디언트를 적용한 양자화된 GaLore
Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients
Zhenyu Zhang, Ajay Jaiswal, Lu Yin, Shiwei Liu, Jiawei Zhao, Yuandong Tian, Zhangyang Wang
•
Jul 11, 2024
•
34
3
MambaVision: 하이브리드 맘바-트랜스포머 비전 백본
MambaVision: A Hybrid Mamba-Transformer Vision Backbone
Ali Hatamizadeh, Jan Kautz
•
Jul 10, 2024
•
33
5
언어 모델의 자기 인식
Self-Recognition in Language Models
Tim R. Davidson, Viacheslav Surkov, Veniamin Veselovsky, Giuseppe Russo, Robert West, Caglar Gulcehre
•
Jul 9, 2024
•
27
2
SEED-Story: 대규모 언어 모델을 활용한 멀티모달 장편 스토리 생성
SEED-Story: Multimodal Long Story Generation with Large Language Model
Shuai Yang, Yuying Ge, Yang Li, Yukang Chen, Yixiao Ge, Ying Shan, Yingcong Chen
•
Jul 11, 2024
•
26
5
당신의 모델은 정말 훌륭한 수학적 추론기인가? 체크리스트를 활용한 수학적 추론 평가
Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist
Zihao Zhou, Shudong Liu, Maizhen Ning, Wei Liu, Jindong Wang, Derek F. Wong, Xiaowei Huang, Qiufeng Wang, Kaizhu Huang
•
Jul 11, 2024
•
23
4
DenseFusion-1M: 포괄적인 멀티모달 인식을 위한 비전 전문가 통합
DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception
Xiaotong Li, Fan Zhang, Haiwen Diao, Yueze Wang, Xinlong Wang, Ling-Yu Duan
•
Jul 11, 2024
•
19
2
GTA: 범용 도구 에이전트를 위한 벤치마크
GTA: A Benchmark for General Tool Agents
Jize Wang, Zerun Ma, Yining Li, Songyang Zhang, Cailian Chen, Kai Chen, Xinyi Le
•
Jul 11, 2024
•
17
3
벡터 양자화 없이 자동회귀 방식의 음성 합성
Autoregressive Speech Synthesis without Vector Quantization
Lingwei Meng, Long Zhou, Shujie Liu, Sanyuan Chen, Bing Han, Shujie Hu, Yanqing Liu, Jinyu Li, Sheng Zhao, Xixin Wu, Helen Meng, Furu Wei
•
Jul 11, 2024
•
17
4
데이터와 멀티모달 대형 언어 모델 간의 시너지: 공동 개발 관점에서의 조사
The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective
Zhen Qin, Daoyuan Chen, Wenhao Zhang, Liuyi Yao, Yilun Huang, Bolin Ding, Yaliang Li, Shuiguang Deng
•
Jul 11, 2024
•
13
4
그래디언트 부스팅 강화 학습
Gradient Boosting Reinforcement Learning
Benjamin Fuhrer, Chen Tessler, Gal Dalal
•
Jul 11, 2024
•
13
2
Live2Diff: 비디오 확산 모델에서 단방향 주의 메커니즘을 통한 라이브 스트림 변환
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models
Zhening Xing, Gereon Fox, Yanhong Zeng, Xingang Pan, Mohamed Elgharib, Christian Theobalt, Kai Chen
•
Jul 11, 2024
•
12
2
일반화 가능한 내재적 모션 모델링을 통한 비디오 프레임 보간
Generalizable Implicit Motion Modeling for Video Frame Interpolation
Zujin Guo, Wei Li, Chen Change Loy
•
Jul 11, 2024
•
12
2
Map It Anywhere (MIA): 대규모 공공 데이터를 활용한 조감도 매핑 기능 강화
Map It Anywhere (MIA): Empowering Bird's Eye View Mapping using Large-scale Public Data
Cherie Ho, Jiaye Zou, Omar Alama, Sai Mitheran Jagadesh Kumar, Benjamin Chiang, Taneesh Gupta, Chen Wang, Nikhil Keetha, Katia Sycara, Sebastian Scherer
•
Jul 11, 2024
•
11
4
시스템 1과 시스템 2의 융합을 통한 전문화된 범용 AI 구축을 향하여
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion
Kaiyan Zhang, Biqing Qi, Bowen Zhou
•
Jul 11, 2024
•
11
2
WildGaussians: 야생 환경에서의 3D 가우시안 스플래팅
WildGaussians: 3D Gaussian Splatting in the Wild
Jonas Kulhanek, Songyou Peng, Zuzana Kukelova, Marc Pollefeys, Torsten Sattler
•
Jul 11, 2024
•
10
2
OmniNOCS: 2D 객체의 3D 리프팅을 위한 통합 NOCS 데이터셋 및 모델
OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects
Akshay Krishnan, Abhijit Kundu, Kevis-Kokitsi Maninis, James Hays, Matthew Brown
•
Jul 11, 2024
•
9
2
작업 벡터 맞춤화를 통한 개인화된 미적 평가의 확장
Scaling Up Personalized Aesthetic Assessment via Task Vector Customization
Jooyeol Yun, Jaegul Choo
•
Jul 9, 2024
•
6
3