ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
April 16th, 2024
真の整合性を実現するための参照モデルの学習
Learn Your Reference Model for Real Good Alignment
Alexey Gorbatovski, Boris Shaposhnikov, Alexey Malakhov, Nikita Surnachev, Yaroslav Aksenov, Ian Maksimov, Nikita Balagansky, Daniil Gavrilov
•
Apr 15, 2024
•
87
0
Megalodon: 無制限のコンテキスト長を実現する効率的なLLM事前学習と推論
Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length
Xuezhe Ma, Xiaomeng Yang, Wenhan Xiong, Beidi Chen, Lili Yu, Hao Zhang, Jonathan May, Luke Zettlemoyer, Omer Levy, Chunting Zhou
•
Apr 12, 2024
•
68
2
TransformerFAM: フィードバックアテンションはワーキングメモリとして機能する
TransformerFAM: Feedback attention is working memory
Dongseong Hwang, Weiran Wang, Zhuoyuan Huo, Khe Chai Sim, Pedro Moreno Mengibar
•
Apr 14, 2024
•
44
0
Video2Game: 単一の動画から実時間・インタラクティブ・リアルでブラウザ互換の環境を生成
Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video
Hongchi Xia, Zhi-Hao Lin, Wei-Chiu Ma, Shenlong Wang
•
Apr 15, 2024
•
31
2
圧縮は知能を線形に表現する
Compression Represents Intelligence Linearly
Yuzhen Huang, Jinghan Zhang, Zifei Shan, Junxian He
•
Apr 15, 2024
•
28
1
Ctrl-Adapter: 多様な制御を任意の拡散モデルに適応させるための効率的で汎用的なフレームワーク
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model
Han Lin, Jaemin Cho, Abhay Zala, Mohit Bansal
•
Apr 15, 2024
•
22
0
HQ-Edit: 指示ベース画像編集のための高品質データセット
HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing
Mude Hui, Siwei Yang, Bingchen Zhao, Yichun Shi, Heng Wang, Peng Wang, Yuyin Zhou, Cihang Xie
•
Apr 15, 2024
•
13
0
マルチモーダル大規模言語モデルにおける推測的デコーディングについて
On Speculative Decoding for Multimodal Large Language Models
Mukul Gagrani, Raghavv Goel, Wonseok Jeon, Junyoung Park, Mingu Lee, Christopher Lott
•
Apr 13, 2024
•
13
2
Tango 2: 直接選好最適化による拡散モデルベースのテキストから音声生成のアラインメント
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization
Navonil Majumder, Chia-Yu Hung, Deepanway Ghosal, Wei-Ning Hsu, Rada Mihalcea, Soujanya Poria
•
Apr 15, 2024
•
12
0
TextHawk: マルチモーダル大規模言語モデルの効率的な細粒度知覚の探求
TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models
Ya-Qi Yu, Minghui Liao, Jihao Wu, Yongxin Liao, Xiaoyu Zheng, Wei Zeng
•
Apr 14, 2024
•
11
0
潜在拡散モデルをニューラルラジアンスフィールドインペインティングに適応させる
Taming Latent Diffusion Model for Neural Radiance Field Inpainting
Chieh Hubert Lin, Changil Kim, Jia-Bin Huang, Qinbo Li, Chih-Yao Ma, Johannes Kopf, Ming-Hsuan Yang, Hung-Yu Tseng
•
Apr 15, 2024
•
7
0
CompGS:圧縮ガウススプラッティングによる効率的な3Dシーン表現
CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting
Xiangrui Liu, Xinju Wu, Pingping Zhang, Shiqi Wang, Zhu Li, Sam Kwong
•
Apr 15, 2024
•
7
0