ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
May 14th, 2024
ビジョン・ランゲージモデルを構築する際に重要なことは何か?
What matters when building vision-language models?
Hugo Laurençon, Léo Tronchon, Matthieu Cord, Victor Sanh
•
May 3, 2024
•
104
3
RLHFワークフロー:報酬モデリングからオンラインRLHFまで
RLHF Workflow: From Reward Modeling to Online RLHF
Hanze Dong, Wei Xiong, Bo Pang, Haoxiang Wang, Han Zhao, Yingbo Zhou, Nan Jiang, Doyen Sahoo, Caiming Xiong, Tong Zhang
•
May 13, 2024
•
71
5
SUTRA:スケーラブルな多言語言語モデルアーキテクチャ
SUTRA: Scalable Multilingual Language Model Architecture
Abhijit Bendale, Michael Sapienza, Steven Ripplinger, Simon Gibbs, Jaewon Lee, Pranav Mistry
•
May 7, 2024
•
40
2
SambaNova SN40L:データフローとエキスパートの構成によるAIメモリ壁のスケーリング
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts
Raghu Prabhakar, Ram Sivaramakrishnan, Darshan Gandhi, Yun Du, Mingran Wang, Xiangyu Song, Kejie Zhang, Tianren Gao, Angela Wang, Karen Li, Yongning Sheng, Joshua Brot, Denis Sokolov, Apurv Vivek, Calvin Leung, Arjun Sabnis, Jiayu Bai, Tuowen Zhao, Mark Gottscho, David Jackson, Mark Luttrell, Manish K. Shah, Edison Chen, Kaizhao Liang, Swayambhoo Jain, Urmish Thakker, Dawei Huang, Sumti Jairath, Kevin J. Brown, Kunle Olukotun
•
May 13, 2024
•
28
0
MS MARCO Web Search:数百万の実クリックラベルを伴う大規模で情報豊富なウェブデータセット
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels
Qi Chen, Xiubo Geng, Corby Rosset, Carolyn Buractaon, Jingwen Lu, Tao Shen, Kun Zhou, Chenyan Xiong, Yeyun Gong, Paul Bennett, Nick Craswell, Xing Xie, Fan Yang, Bryan Tower, Nikhil Rao, Anlei Dong, Wenqi Jiang, Zheng Liu, Mingqin Li, Chuanjie Liu, Zengzhong Li, Rangan Majumder, Jennifer Neville, Andy Oakley, Knut Magne Risvik, Harsha Vardhan Simhadri, Manik Varma, Yujing Wang, Linjun Yang, Mao Yang, Ce Zhang
•
May 13, 2024
•
22
1
Plot2Code: 科学プロットからのコード生成におけるマルチモーダル大規模言語モデルを評価するための包括的ベンチマーク
Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
Chengyue Wu, Yixiao Ge, Qiushan Guo, Jiahao Wang, Zhixuan Liang, Zeyu Lu, Ying Shan, Ping Luo
•
May 13, 2024
•
21
4
Piccolo2: マルチタスクハイブリッド損失トレーニングによる汎用テキスト埋め込み
Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training
Junqin Huang, Zhongjie Hu, Zihao Jing, Mengya Gao, Yichao Wu
•
May 11, 2024
•
21
1
LogoMotion: コンテンツ認識アニメーションのための視覚的基盤に基づくコード生成
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
•
May 11, 2024
•
19
2
大規模言語モデルをプランニングドメイン生成器として
Large Language Models as Planning Domain Generators
James Oswald, Kavitha Srinivas, Harsha Kokel, Junkyu Lee, Michael Katz, Shirin Sohrabi
•
Apr 2, 2024
•
14
2