ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
February 29th, 2024
1비트 LLM의 시대: 모든 대형 언어 모델은 1.58비트에 있다
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu Wei
•
Feb 27, 2024
•
618
143
EMO: 감정이 담긴 초상화를 살아 움직이게 하기 - 약한 조건 하에서 오디오-비디오 확산 모델을 활용한 표현력 있는 초상화 비디오 생성
EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo
•
Feb 27, 2024
•
196
20
Sora: 대규모 비전 모델의 배경, 기술, 한계 및 기회에 대한 리뷰
Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models
Yixin Liu, Kai Zhang, Yuan Li, Zhiling Yan, Chujie Gao, Ruoxi Chen, Zhengqing Yuan, Yue Huang, Hanchi Sun, Jianfeng Gao, Lifang He, Lichao Sun
•
Feb 27, 2024
•
89
5
OmniACT: 데스크톱 및 웹을 위한 다중 모달 일반 자율 에이전트 활성화를 위한 데이터셋 및 벤치마크
OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web
Raghav Kapoor, Yash Parag Butala, Melisa Russak, Jing Yu Koh, Kiran Kamble, Waseem Alshikh, Ruslan Salakhutdinov
•
Feb 27, 2024
•
26
6
스케일링이 LLM 파인튜닝과 만날 때: 데이터, 모델 및 파인튜닝 방법의 영향
When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method
Biao Zhang, Zhongtao Liu, Colin Cherry, Orhan Firat
•
Feb 27, 2024
•
26
3
훈련 없이 대규모 언어 모델의 장문맥 확장
Training-Free Long-Context Scaling of Large Language Models
Chenxin An, Fei Huang, Jun Zhang, Shansan Gong, Xipeng Qiu, Chang Zhou, Lingpeng Kong
•
Feb 27, 2024
•
25
4
DiffuseKronA: 개인화된 디퓨전 모델을 위한 파라미터 효율적 미세 조정 기법
DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model
Shyam Marjit, Harshit Singh, Nityanand Mathur, Sayak Paul, Chia-Mu Yu, Pin-Yu Chen
•
Feb 27, 2024
•
25
1
비디오: 현실 세계 의사결정을 위한 새로운 언어
Video as the New Language for Real-World Decision Making
Sherry Yang, Jacob Walker, Jack Parker-Holder, Yilun Du, Jake Bruce, Andre Barreto, Pieter Abbeel, Dale Schuurmans
•
Feb 27, 2024
•
22
1
LLM 에이전트의 초장기 대화 메모리 평가
Evaluating Very Long-Term Conversational Memory of LLM Agents
Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang
•
Feb 27, 2024
•
20
3
언어 모델의 최적 학습을 향하여
Towards Optimal Learning of Language Models
Yuxian Gu, Li Dong, Yaru Hao, Qingxiu Dong, Minlie Huang, Furu Wei
•
Feb 27, 2024
•
18
1
Sora는 놀라운 기하학적 일관성을 가진 비디오를 생성합니다.
Sora Generates Videos with Stunning Geometrical Consistency
Xuanyi Li, Daquan Zhou, Chenxu Zhang, Shaodong Wei, Qibin Hou, Ming-Ming Cheng
•
Feb 27, 2024
•
18
1
보고 듣기: 확산 잠재 정렬기를 활용한 개방형 도메인 시각-음향 생성
Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
Yazhou Xing, Yingqing He, Zeyue Tian, Xintao Wang, Qifeng Chen
•
Feb 27, 2024
•
16
1
Playground v2.5: 텍스트-이미지 생성의 미적 품질 향상을 위한 세 가지 통찰
Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation
Daiqing Li, Aleks Kamko, Ehsan Akhgari, Ali Sabet, Linmiao Xu, Suhail Doshi
•
Feb 27, 2024
•
12
1
레이아웃 학습을 통한 분리된 3D 장면 생성
Disentangled 3D Scene Generation with Layout Learning
Dave Epstein, Ben Poole, Ben Mildenhall, Alexei A. Efros, Aleksander Holynski
•
Feb 26, 2024
•
12
1
VastGaussian: 대규모 장면 재구성을 위한 방대한 3D 가우시안
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Jiaqi Lin, Zhihao Li, Xiao Tang, Jianzhuang Liu, Shiyong Liu, Jiayue Liu, Yangdi Lu, Xiaofei Wu, Songcen Xu, Youliang Yan, Wenming Yang
•
Feb 27, 2024
•
11
45