ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
June 21st, 2024
nabla^2DFT: 創薬候補分子の普遍的な量子化学データセットとニューラルネットワークポテンシャルのベンチマーク
nabla^2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials
Kuzma Khrabrov, Anton Ber, Artem Tsypin, Konstantin Ushenin, Egor Rumiantsev, Alexander Telepov, Dmitry Protasov, Ilya Shenbin, Anton Alekseev, Mikhail Shirokikh, Sergey Nikolenko, Elena Tutubalina, Artur Kadurin
•
Jun 20, 2024
•
102
4
指示事前学習:言語モデルは教師付きマルチタスク学習器である
Instruction Pre-Training: Language Models are Supervised Multitask Learners
Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei
•
Jun 20, 2024
•
94
25
詳細にこそ本質あり:StyleFeatureEditorによる詳細豊かなStyleGANの反転と高品質画像編集
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing
Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov
•
Jun 15, 2024
•
70
2
HARE: 小型言語モデルの効率性における人間の事前知識
HARE: HumAn pRiors, a key to small language model Efficiency
Lingyun Zhang, Bin jin, Gaojian Ge, Lunhui Liu, Xuewen Shen, Mingyong Wu, Houqian Zhang, Yongneng Jiang, Shiqi Chen, Shi Pu
•
Jun 17, 2024
•
40
1
Prism: VLMの能力を分離・評価するためのフレームワーク
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
36
2
MMBench-Video: ホリスティックなビデオ理解のためのロングフォーム・マルチショットベンチマーク
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding
Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
34
1
モデル統合と安全性アラインメント:悪いモデルが全体を台無しにする
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch
Hasan Abed Al Kader Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr, Adel Bibi, Bernard Ghanem, Mete Ozay
•
Jun 20, 2024
•
31
1
ホワイトボード・オブ・シンキング:モダリティを跨いだ段階的思考
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
Sachit Menon, Richard Zemel, Carl Vondrick
•
Jun 20, 2024
•
29
1
約7ステップでテキストガイド付き画像編集のための可逆的一貫性蒸留
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps
Nikita Starodubcev, Mikhail Khoroshikh, Artem Babenko, Dmitry Baranchuk
•
Jun 20, 2024
•
28
1
GLiNERマルチタスク:多様な情報抽出タスクのための汎用軽量モデル
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks
Ihor Stepanov, Mykhailo Shtopko
•
Jun 14, 2024
•
26
3
PIN: ペアリングおよびインターリーブされたマルチモーダル文書のための知識集約型データセット
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
Junjie Wang, Yin Zhang, Yatai Ji, Yuxiang Zhang, Chunyang Jiang, Yubo Wang, Kang Zhu, Zekun Wang, Tiezhen Wang, Wenhao Huang, Jie Fu, Bei Chen, Qunshu Lin, Minghao Liu, Ge Zhang, Wenhu Chen
•
Jun 20, 2024
•
23
1
DigiRL:自律的強化学習を用いた実環境デバイス制御エージェントのトレーニング
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning
Hao Bai, Yifei Zhou, Mert Cemri, Jiayi Pan, Alane Suhr, Sergey Levine, Aviral Kumar
•
Jun 14, 2024
•
20
1
実行フィードバックを伴う自己対戦:大規模言語モデルの指示追従能力の向上
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
Guanting Dong, Keming Lu, Chengpeng Li, Tingyu Xia, Bowen Yu, Chang Zhou, Jingren Zhou
•
Jun 19, 2024
•
16
2
LiveMind: 同時推論を実現する低遅延大規模言語モデル
LiveMind: Low-latency Large Language Models with Simultaneous Inference
Chuangtao Chen, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li
•
Jun 20, 2024
•
14
4
複数画像生成による言語モデルの視覚的常識の改善
Improving Visual Commonsense in Language Models via Multiple Image Generation
Guy Yariv, Idan Schwartz, Yossi Adi, Sagie Benaim
•
Jun 19, 2024
•
13
2
反復的長さ正則化直接選好最適化:7B言語モデルをGPT-4レベルに改善するケーススタディ
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
Jie Liu, Zhanhui Zhou, Jiaheng Liu, Xingyuan Bu, Chao Yang, Han-Sen Zhong, Wanli Ouyang
•
Jun 17, 2024
•
13
1
REPOEXEC: リポジトリレベルの実行可能ベンチマークによるコード生成の評価
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark
Nam Le Hai, Dung Manh Nguyen, Nghi D. Q. Bui
•
Jun 17, 2024
•
11
1
ExVideo: パラメータ効率型ポストチューニングによるビデオ拡散モデルの拡張
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning
Zhongjie Duan, Wenmeng Zhou, Cen Chen, Yaliang Li, Weining Qian
•
Jun 20, 2024
•
10
3
τ-bench: 実世界ドメインにおけるツール・エージェント・ユーザーインタラクションのベンチマーク
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains
Shunyu Yao, Noah Shinn, Pedram Razavi, Karthik Narasimhan
•
Jun 17, 2024
•
8
3
信頼性の高い検索拡張生成のためのモデル内部構造に基づく回答帰属
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
Jirui Qi, Gabriele Sarti, Raquel Fernández, Arianna Bisazza
•
Jun 19, 2024
•
7
1
StableSemantics: 自然画像における意味表現の合成言語視覚データセット
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images
Rushikesh Zawar, Shaurya Dewan, Andrew F. Luo, Margaret M. Henderson, Michael J. Tarr, Leila Wehbe
•
Jun 19, 2024
•
5
1
洞察から行動へ:解釈可能性と分析の影響 NLP研究
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP
Marius Mosbach, Vagrant Gautam, Tomás Vergara-Browne, Dietrich Klakow, Mor Geva
•
Jun 18, 2024
•
5
1
テキスト要約の体系的な調査:統計的手法から大規模言語モデルまで
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models
Haopeng Zhang, Philip S. Yu, Jiawei Zhang
•
Jun 17, 2024
•
5
2
潜在拡散モデルを用いた3Dガウシアンシーンの秒単位サンプリング
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models
Paul Henderson, Melonie de Almeida, Daniela Ivanova, Titas Anciukevičius
•
Jun 18, 2024
•
4
1