ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
June 6th, 2024
ブロックトランスフォーマー:高速推論のためのグローバルからローカルへの言語モデリング
Block Transformer: Global-to-Local Language Modeling for Fast Inference
Namgyu Ho, Sangmin Bae, Taehyeon Kim, Hyunjik Jo, Yireun Kim, Tal Schuster, Adam Fisch, James Thorne, Se-Young Yun
•
Jun 4, 2024
•
41
1
Parrot: 多言語視覚指示チューニング
Parrot: Multilingual Visual Instruction Tuning
Hai-Long Sun, Da-Wei Zhou, Yang Li, Shiyin Lu, Chao Yi, Qing-Guo Chen, Zhao Xu, Weihua Luo, Kaifu Zhang, De-Chuan Zhan, Han-Jia Ye
•
Jun 4, 2024
•
39
2
Mobile-Agent-v2: マルチエージェント協調による効率的なナビゲーションを備えたモバイルデバイス操作アシスタント
Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Haitao Jia, Xi Zhang, Ming Yan, Weizhou Shen, Ji Zhang, Fei Huang, Jitao Sang
•
Jun 3, 2024
•
35
2
Ouroboros3D: 3D認識再帰的拡散による画像から3D生成
Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion
Hao Wen, Zehuan Huang, Yaohui Wang, Xinyuan Chen, Yu Qiao, Lu Sheng
•
Jun 5, 2024
•
22
2
Audio Mamba: 音声表現学習のための双方向状態空間モデル
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning
Mehmet Hamza Erol, Arda Senocak, Jiu Feng, Joon Son Chung
•
Jun 5, 2024
•
21
1
PosterLLaVa: LLMを活用した統一的なマルチモーダルレイアウト生成器の構築
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM
Tao Yang, Yingmin Luo, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen
•
Jun 5, 2024
•
18
2
LiveSpeech: オーディオ離散コードの自己回帰モデリングによる低遅延ゼロショットテキスト音声合成
LiveSpeech: Low-Latency Zero-shot Text-to-Speech via Autoregressive Modeling of Audio Discrete Codes
Trung Dang, David Aponte, Dung Tran, Kazuhito Koishida
•
Jun 5, 2024
•
16
2
事前分布の探索がテキストからビデオへの合成を改善する
Searching Priors Makes Text-to-Video Synthesis Better
Haoran Cheng, Liang Peng, Linxuan Xia, Yuepeng Hu, Hengjia Li, Qinglin Lu, Xiaofei He, Boxi Wu
•
Jun 5, 2024
•
14
2
直接アライメントアルゴリズムにおける報酬モデルの過最適化に関するスケーリング則
Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms
Rafael Rafailov, Yaswanth Chittepu, Ryan Park, Harshit Sikchi, Joey Hejna, Bradley Knox, Chelsea Finn, Scott Niekum
•
Jun 5, 2024
•
14
0
会話型レコメンデーションのためのアイテム言語モデル
Item-Language Model for Conversational Recommendation
Li Yang, Anushya Subbiah, Hardik Patel, Judith Yue Li, Yanwei Song, Reza Mirghaderi, Vikram Aggarwal
•
Jun 5, 2024
•
12
1
PLaD: 疑似選好ペアを用いた選好ベース大規模言語モデル蒸留
PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference Pairs
Rongzhi Zhang, Jiaming Shen, Tianqi Liu, Haorui Wang, Zhen Qin, Feng Han, Jialu Liu, Simon Baumgartner, Michael Bendersky, Chao Zhang
•
Jun 5, 2024
•
11
1
Xmodel-LM技術レポート
Xmodel-LM Technical Report
Yichuan Wang, Yang Liu, Yu Yan, Xucheng Huang, Ling Jiang
•
Jun 5, 2024
•
11
1