ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
October 2nd, 2024
Embodied-RAG: 検索と生成のための一般的な非パラメトリックな具現化メモリ
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation
Quanting Xie, So Yeon Min, Tianyi Zhang, Aarav Bajaj, Ruslan Salakhutdinov, Matthew Johnson-Roberson, Yonatan Bisk
•
Sep 26, 2024
•
3
2
すべてを分割するトークン:動画における言語指示された推論セグメンテーション
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Zheng Zhang, Mike Zheng Shou
•
Sep 29, 2024
•
19
3
Flex3D: フィードフォワード3D生成と柔軟な再構築モデルおよび入力ビューのキュレーション
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation
Junlin Han, Jianyuan Wang, Andrea Vedaldi, Philip Torr, Filippos Kokkinos
•
Oct 1, 2024
•
20
5
TPI-LLM: 低リソースのエッジデバイスで70BスケールのLLMを効率的に処理する
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices
Zonghang Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Oct 1, 2024
•
33
8
ACE: 拡散を介した指示に従うオールラウンドクリエーターおよびエディター、トランスフォーマー
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
Zhen Han, Zeyinzi Jiang, Yulin Pan, Jingfeng Zhang, Chaojie Mao, Chenwei Xie, Yu Liu, Jingren Zhou
•
Sep 30, 2024
•
12
2
SyntheOcc:3DセマンティックMPIを介して幾何学制御されたストリートビュー画像を合成する
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs
Leheng Li, Weichao Qiu, Yingjie Cai, Xu Yan, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 1, 2024
•
11
2
DressRecon: 単眼ビデオからの自由形式4D人間再構築
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
Jeff Tan, Donglai Xiang, Shubham Tulsiani, Deva Ramanan, Gengshan Yang
•
Sep 30, 2024
•
9
2
損害は何か?人間中心の研究による機械翻訳におけるジェンダーバイアスの具体的な影響の数量化
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study
Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof, Luisa Bentivogli
•
Oct 1, 2024
•
5
2
最弱リンクの法則:大規模言語モデルのクロス能力
Law of the Weakest Link: Cross Capabilities of Large Language Models
Ming Zhong, Aston Zhang, Xuewei Wang, Rui Hou, Wenhan Xiong, Chenguang Zhu, Zhengxing Chen, Liang Tan, Chloe Bi, Mike Lewis, Sravya Popuri, Sharan Narang, Melanie Kambadur, Dhruv Mahajan, Sergey Edunov, Jiawei Han, Laurens van der Maaten
•
Sep 30, 2024
•
55
2
アトラスチャット:低リソースなモロッコアラビア方言向けの大規模言語モデルの適応
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect
Guokan Shang, Hadi Abdine, Yousef Khoubrane, Amr Mohamed, Yassine Abbahaddou, Sofiane Ennadir, Imane Momayiz, Xuguang Ren, Eric Moulines, Preslav Nakov, Michalis Vazirgiannis, Eric Xing
•
Sep 26, 2024
•
29
2
ビジュアルコンテキストウィンドウの拡張:長時間ビデオ理解の新しい視点
Visual Context Window Extension: A New Perspective for Long Video Understanding
Hongchen Wei, Zhenzhong Chen
•
Sep 30, 2024
•
11
2
事後平均整流フロー:最小平均二乗誤差写真実在画像の復元に向けて
Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration
Guy Ohayon, Tomer Michaeli, Michael Elad
•
Oct 1, 2024
•
10
3
著名: オープンな高度なイラストモデル
Illustrious: an Open Advanced Illustration Model
Sang Hyun Park, Jun Young Koh, Junha Lee, Joy Song, Dongha Kim, Hoyeon Moon, Hyunju Lee, Min Song
•
Sep 30, 2024
•
16
3
役立つDoggyBot:足を持つロボットとビジョン言語モデルを使用したオープンワールドの物体取得
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
Qi Wu, Zipeng Fu, Xuxin Cheng, Xiaolong Wang, Chelsea Finn
•
Sep 30, 2024
•
8
2