ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
December 17th, 2024
SplineGS:モノクル動画からのリアルタイムダイナミック3Dガウス分布のための頑健なモーション適応スプライン
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello, Jaeho Moon, Jihyong Oh, Munchurl Kim
•
Dec 13, 2024
•
7
3
Whisper-GPT: ハイブリッド表現オーディオ大規模言語モデル
Whisper-GPT: A Hybrid Representation Audio Large Language Model
Prateek Verma
•
Dec 16, 2024
•
4
2
MaxInfoRL:情報利得最大化を通じた強化学習における探索の向上
MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximization
Bhavya Sukhija, Stelian Coros, Andreas Krause, Pieter Abbeel, Carmelo Sferrazza
•
Dec 16, 2024
•
5
2
IDArb: 任意の入力ビュー数と照明のための固有分解
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations
Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin
•
Dec 16, 2024
•
12
2
生成モデリングのための因果拡散トランスフォーマー
Causal Diffusion Transformers for Generative Modeling
Chaorui Deng, Deyao Zh, Kunchang Li, Shi Guan, Haoqi Fan
•
Dec 16, 2024
•
23
3
小さな言語モデルは、より優れた指示進化体です。
Smaller Language Models Are Better Instruction Evolvers
Tingfeng Hui, Lulu Zhao, Guanting Dong, Yaqi Zhang, Hua Zhou, Sen Su
•
Dec 15, 2024
•
29
2
SPaR: 大規模言語モデルにおける指示に従う能力向上のための木探索精緻化を用いたセルフプレイ
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models
Jiale Cheng, Xiao Liu, Cunxiang Wang, Xiaotao Gu, Yida Lu, Dan Zhang, Yuxiao Dong, Jie Tang, Hongning Wang, Minlie Huang
•
Dec 16, 2024
•
18
2
VividFace:高精細ビデオフェイススワッピングのための拡散ベースのハイブリッドフレームワーク
VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping
Hao Shao, Shulun Wang, Yang Zhou, Guanglu Song, Dailan He, Shuo Qin, Zhuofan Zong, Bingqi Ma, Yu Liu, Hongsheng Li
•
Dec 15, 2024
•
12
2
ガウス性質:物理的性質をLMMsを用いて3Dガウス関数に統合する
GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs
Xinli Xu, Wenhang Ge, Dicong Qiu, ZhiFei Chen, Dongyu Yan, Zhuoyun Liu, Haoyu Zhao, Hanfeng Zhao, Shunsi Zhang, Junwei Liang, Ying-Cong Chen
•
Dec 15, 2024
•
13
2
垂直フェデレーテッドラーニングにおけるデータ保護には、単純な変換が十分である
Just a Simple Transformation is Enough for Data Protection in Vertical Federated Learning
Andrei Semenov, Philip Zmushko, Alexander Pichugin, Aleksandr Beznosikov
•
Dec 16, 2024
•
2
2
MOVIS: 屋内シーンの複数オブジェクトの新しい視点合成の向上
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes
Ruijie Lu, Yixin Chen, Junfeng Ni, Baoxiong Jia, Yu Liu, Diwen Wan, Gang Zeng, Siyuan Huang
•
Dec 16, 2024
•
6
2
素晴らしい行列: より効率的かつ効果的な基盤モデルアーキテクチャのための組み合わせ
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture
Jingze Shi, Bingheng Wu
•
Dec 16, 2024
•
8
2
評価エージェント:視覚生成モデル向けの効率的かつ迅速な評価フレームワーク
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models
Fan Zhang, Shulin Tian, Ziqi Huang, Yu Qiao, Ziwei Liu
•
Dec 10, 2024
•
37
2
DynamicScaler:パノラマシーンのためのシームレスかつスケーラブルなビデオ生成
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes
Jinxiu Liu, Shaoheng Lin, Yinxiao Li, Ming-Hsuan Yang
•
Dec 15, 2024
•
7
2
TidyBot++: ロボット学習のためのオープンソースホロノミックモバイルマニピュレータ
TidyBot++: An Open-Source Holonomic Mobile Manipulator for Robot Learning
Jimmy Wu, William Chong, Robert Holmberg, Aaditya Prasad, Yihuai Gao, Oussama Khatib, Shuran Song, Szymon Rusinkiewicz, Jeannette Bohg
•
Dec 11, 2024
•
5
2
RLDG: 強化学習を通じたロボット汎用ポリシー蒸留
RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning
Charles Xu, Qiyang Li, Jianlan Luo, Sergey Levine
•
Dec 13, 2024
•
1
2
Evalicaを使用した信頼性の高い、再現性のある、そして非常に高速なリーダーボード
Reliable, Reproducible, and Really Fast Leaderboards with Evalica
Dmitry Ustalov
•
Dec 15, 2024
•
2
2
Emma-X: 根拠付きの思考連鎖と先読み空間推論を持つ具現化された多様な行動モデル
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning
Qi Sun, Pengfei Hong, Tej Deep Pala, Vernon Toh, U-Xuan Tan, Deepanway Ghosal, Soujanya Poria
•
Dec 16, 2024
•
9
2
StrandHead: テキストを使用した髪の幾何学的事前知識を利用したストランド分離された3Dヘッドアバター
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors
Xiaokun Sun, Zeyu Cai, Zhenyu Zhang, Ying Tai, Jian Yang
•
Dec 16, 2024
•
11
2
個人化拡散モデルによる模倣へのほぼゼロコストの保護
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models
Namhyuk Ahn, KiYoon Yoo, Wonhyuk Ahn, Daesik Kim, Seung-Hun Nam
•
Dec 16, 2024
•
2
2
大規模言語モデル(LLM)におけるオープンソースの利点
The Open Source Advantage in Large Language Models (LLMs)
Jiya Manchanda, Laura Boettcher, Matheus Westphalen, Jasser Jasser
•
Dec 16, 2024
•
10
2
ワンダーランド:単一画像からの3Dシーンナビゲーション
Wonderland: Navigating 3D Scenes from a Single Image
Hanwen Liang, Junli Cao, Vidit Goel, Guocheng Qian, Sergei Korolev, Demetri Terzopoulos, Konstantinos N. Plataniotis, Sergey Tulyakov, Jian Ren
•
Dec 16, 2024
•
16
2
BrushEdit: 画像修復と編集を一括で行うツール
BrushEdit: All-In-One Image Inpainting and Editing
Yaowei Li, Yuxuan Bian, Xuan Ju, Zhaoyang Zhang, Ying Shan, Qiang Xu
•
Dec 13, 2024
•
35
3
ColorFlow: 検索拡張画像シーケンスの着色
ColorFlow: Retrieval-Augmented Image Sequence Colorization
Junhao Zhuang, Xuan Ju, Zhaoyang Zhang, Yong Liu, Shiyi Zhang, Chun Yuan, Ying Shan
•
Dec 16, 2024
•
26
4
バイト潜在トランスフォーマー:パッチはトークンよりもスケーリングが優れています。
Byte Latent Transformer: Patches Scale Better Than Tokens
Artidoro Pagnoni, Ram Pasunuru, Pedro Rodriguez, John Nguyen, Benjamin Muller, Margaret Li, Chunting Zhou, Lili Yu, Jason Weston, Luke Zettlemoyer, Gargi Ghosh, Mike Lewis, Ari Holtzman, Srinivasan Iyer
•
Dec 13, 2024
•
102
8
GeoX: 統一された形式化されたビジョン言語事前トレーニングを通じた幾何学的問題解決
GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training
Renqiu Xia, Mingsheng Li, Hancheng Ye, Wenjie Wu, Hongbin Zhou, Jiakang Yuan, Tianshuo Peng, Xinyu Cai, Xiangchao Yan, Bin Wang, Conghui He, Botian Shi, Tao Chen, Junchi Yan, Bo Zhang
•
Dec 16, 2024
•
4
2
SepLLM: 1つのセグメントを1つのセパレータに圧縮することで大規模言語モデルを高速化
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator
Guoxuan Chen, Han Shi, Jiawei Li, Yihang Gao, Xiaozhe Ren, Yimeng Chen, Xin Jiang, Zhenguo Li, Weiyang Liu, Chao Huang
•
Dec 16, 2024
•
11
5
RetroLLM: 大規模言語モデルに細かい証拠を取得する力を与える
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yongkang Wu, Zhonghua Li, Qi Ye, Zhicheng Dou
•
Dec 16, 2024
•
37
4