ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
February 29th, 2024
1ビットLLMの時代:すべての大規模言語モデルは1.58ビットである
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu Wei
•
Feb 27, 2024
•
618
143
EMO: エモーショナル・ポートレート・アライブ - 弱い条件下でのオーディオ2ビデオ拡散モデルによる表現力豊かなポートレート動画の生成
EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo
•
Feb 27, 2024
•
196
20
Sora: 大規模視覚モデルの背景、技術、限界、そして可能性に関するレビュー
Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models
Yixin Liu, Kai Zhang, Yuan Li, Zhiling Yan, Chujie Gao, Ruoxi Chen, Zhengqing Yuan, Yue Huang, Hanchi Sun, Jianfeng Gao, Lifang He, Lichao Sun
•
Feb 27, 2024
•
89
5
OmniACT: デスクトップおよびWeb向けマルチモーダル汎用自律エージェントを実現するためのデータセットとベンチマーク
OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web
Raghav Kapoor, Yash Parag Butala, Melisa Russak, Jing Yu Koh, Kiran Kamble, Waseem Alshikh, Ruslan Salakhutdinov
•
Feb 27, 2024
•
26
6
スケーリングがLLMファインチューニングに出会うとき:データ、モデル、ファインチューニング手法の影響
When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method
Biao Zhang, Zhongtao Liu, Colin Cherry, Orhan Firat
•
Feb 27, 2024
•
26
3
トレーニング不要の長文脈スケーリングによる大規模言語モデルの拡張
Training-Free Long-Context Scaling of Large Language Models
Chenxin An, Fei Huang, Jun Zhang, Shansan Gong, Xipeng Qiu, Chang Zhou, Lingpeng Kong
•
Feb 27, 2024
•
25
4
DiffuseKronA:パーソナライズド拡散モデルのためのパラメータ効率の良いファインチューニング手法
DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model
Shyam Marjit, Harshit Singh, Nityanand Mathur, Sayak Paul, Chia-Mu Yu, Pin-Yu Chen
•
Feb 27, 2024
•
25
1
ビデオを現実世界の意思決定のための新たな言語として
Video as the New Language for Real-World Decision Making
Sherry Yang, Jacob Walker, Jack Parker-Holder, Yilun Du, Jake Bruce, Andre Barreto, Pieter Abbeel, Dale Schuurmans
•
Feb 27, 2024
•
22
1
LLMエージェントの超長期会話メモリの評価
Evaluating Very Long-Term Conversational Memory of LLM Agents
Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang
•
Feb 27, 2024
•
20
3
言語モデルの最適学習に向けて
Towards Optimal Learning of Language Models
Yuxian Gu, Li Dong, Yaru Hao, Qingxiu Dong, Minlie Huang, Furu Wei
•
Feb 27, 2024
•
18
1
Soraは驚くべき幾何学的整合性を備えた動画を生成する
Sora Generates Videos with Stunning Geometrical Consistency
Xuanyi Li, Daquan Zhou, Chenxu Zhang, Shaodong Wei, Qibin Hou, Ming-Ming Cheng
•
Feb 27, 2024
•
18
1
視覚と聴覚:拡散モデルを用いたオープンドメイン視覚-音声生成と潜在空間アライナー
Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
Yazhou Xing, Yingqing He, Zeyue Tian, Xintao Wang, Qifeng Chen
•
Feb 27, 2024
•
16
1
Playground v2.5: テキストから画像生成における美的品質向上に向けた3つの洞察
Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation
Daiqing Li, Aleks Kamko, Ehsan Akhgari, Ali Sabet, Linmiao Xu, Suhail Doshi
•
Feb 27, 2024
•
12
1
レイアウト学習による分離型3Dシーン生成
Disentangled 3D Scene Generation with Layout Learning
Dave Epstein, Ben Poole, Ben Mildenhall, Alexei A. Efros, Aleksander Holynski
•
Feb 26, 2024
•
12
1
VastGaussian: 大規模シーン再構築のための広大な3Dガウシアン
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Jiaqi Lin, Zhihao Li, Xiao Tang, Jianzhuang Liu, Shiyong Liu, Jiayue Liu, Yangdi Lu, Xiaofei Wu, Songcen Xu, Youliang Yan, Wenming Yang
•
Feb 27, 2024
•
11
45