ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
July 17th, 2024
Qwen2-Audio 技術レポート
Qwen2-Audio Technical Report
Yunfei Chu, Jin Xu, Qian Yang, Haojie Wei, Xipin Wei, Zhifang Guo, Yichong Leng, Yuanjun Lv, Jinzheng He, Junyang Lin, Chang Zhou, Jingren Zhou
•
Jul 15, 2024
•
60
7
NeedleBench: LLMは100万トークンのコンテキストウィンドウで検索と推論が可能か?
NeedleBench: Can LLMs Do Retrieval and Reasoning in 1 Million Context Window?
Mo Li, Songyang Zhang, Yunxin Liu, Kai Chen
•
Jul 16, 2024
•
45
3
拡散トランスフォーマーを160億パラメータまでスケーリング
Scaling Diffusion Transformers to 16 Billion Parameters
Zhengcong Fei, Mingyuan Fan, Changqian Yu, Debang Li, Junshi Huang
•
Jul 16, 2024
•
27
2
Ref-AVS: オーディオビジュアルシーンにおける物体の参照とセグメンテーション
Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes
Yaoting Wang, Peiwen Sun, Dongzhan Zhou, Guangyao Li, Honggang Zhang, Di Hu
•
Jul 15, 2024
•
25
5
Sibyl: 複雑な現実世界の推論のためのシンプルかつ効果的なエージェントフレームワーク
Sibyl: Simple yet Effective Agent Framework for Complex Real-world Reasoning
Yulong Wang, Tianhao Shen, Lifeng Liu, Jian Xie
•
Jul 15, 2024
•
18
4
VLMEvalKit: 大規模マルチモーダルモデル評価のためのオープンソースツールキット
VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models
Haodong Duan, Junming Yang, Yuxuan Qiao, Xinyu Fang, Lin Chen, Yuan Liu, Xiaoyi Dong, Yuhang Zang, Pan Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jul 16, 2024
•
14
3
DreamCatalyst: 編集性と同一性保持を制御する高速かつ高品質な3D編集
DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation
Jiwook Kim, Seonho Lee, Jaeyo Shin, Jiho Choi, Hyunjung Shim
•
Jul 16, 2024
•
12
2
Animate3D: Animating Any 3D Model with Multi-view Video Diffusion
Yanqin Jiang, Chaohui Yu, Chenjie Cao, Fan Wang, Weiming Hu, Jin Gao
•
Jul 16, 2024
•
10
2
ノイズ除去されたニューラル重みを用いた効率的な訓練
Efficient Training with Denoised Neural Weights
Yifan Gong, Zheng Zhan, Yanyu Li, Yerlan Idelbayev, Andrey Zharkov, Kfir Aberman, Sergey Tulyakov, Yanzhi Wang, Jian Ren
•
Jul 16, 2024
•
9
3
FIRE: マルチモーダルモデルのフィードバック統合と改良評価のためのデータセット
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models
Pengxiang Li, Zhi Gao, Bofei Zhang, Tao Yuan, Yuwei Wu, Mehrtash Harandi, Yunde Jia, Song-Chun Zhu, Qing Li
•
Jul 16, 2024
•
9
2
YouTube-SL-25: 大規模なオープンドメイン多言語手話並列コーパス
YouTube-SL-25: A Large-Scale, Open-Domain Multilingual Sign Language Parallel Corpus
Garrett Tanzer, Biao Zhang
•
Jul 15, 2024
•
9
4
EfficientQAT: 大規模言語モデルのための効率的な量子化対応トレーニング
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models
Mengzhao Chen, Wenqi Shao, Peng Xu, Jiahao Wang, Peng Gao, Kaipeng Zhang, Yu Qiao, Ping Luo
•
Jul 10, 2024
•
9
3
GaLaReからWeLoreへ:低ランク勾配から非一様に出現する低ランク重みのメカニズム
From GaLore to WeLore: How Low-Rank Weights Non-uniformly Emerge from Low-Rank Gradients
Ajay Jaiswal, Lu Yin, Zhenyu Zhang, Shiwei Liu, Jiawei Zhao, Yuandong Tian, Zhangyang Wang
•
Jul 15, 2024
•
8
2
OmniBind:空間結合による大規模オムニモーダル表現
OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces
Zehan Wang, Ziang Zhang, Hang Zhang, Luping Liu, Rongjie Huang, Xize Cheng, Hengshuang Zhao, Zhou Zhao
•
Jul 16, 2024
•
7
3
シミュレートされたヒューマノイドによる多様な物体の把持
Grasping Diverse Objects with Simulated Humanoids
Zhengyi Luo, Jinkun Cao, Sammy Christen, Alexander Winkler, Kris Kitani, Weipeng Xu
•
Jul 16, 2024
•
5
2
Vibravox: 身体伝導オーディオセンサーを用いて収録したフランス語音声データセット
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors
Julien Hauret, Malo Olivier, Thomas Joubaud, Christophe Langrenne, Sarah Poirée, Véronique Zimpfer, Éric Bavu
•
Jul 16, 2024
•
4
2
Data-Juicer Sandbox: マルチモーダルデータとモデルの共開発のための包括的スイート
Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development
Daoyuan Chen, Haibin Wang, Yilun Huang, Ce Ge, Yaliang Li, Bolin Ding, Jingren Zhou
•
Jul 16, 2024
•
4
2
Click-Gaussian: 3Dガウシアンへのインタラクティブセグメンテーション
Click-Gaussian: Interactive Segmentation to Any 3D Gaussians
Seokhun Choi, Hyeonseop Song, Jaechul Kim, Taehyeong Kim, Hoseok Do
•
Jul 16, 2024
•
3
3
不確実性は脆い:大規模言語モデルにおける不確実性の操作
Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models
Qingcheng Zeng, Mingyu Jin, Qinkai Yu, Zhenting Wang, Wenyue Hua, Zihao Zhou, Guangyan Sun, Yanda Meng, Shiqing Ma, Qifan Wang, Felix Juefei-Xu, Kaize Ding, Fan Yang, Ruixiang Tang, Yongfeng Zhang
•
Jul 15, 2024
•
1
2