ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
July 10th, 2024
視覚言語モデルは盲目である
Vision language models are blind
Pooyan Rahmanzadehgervi, Logan Bolton, Mohammad Reza Taesiri, Anh Totti Nguyen
•
Jul 9, 2024
•
83
17
AgentInstruct: エージェント的フローを用いた生成的教授法に向けて
AgentInstruct: Toward Generative Teaching with Agentic Flows
Arindam Mitra, Luciano Del Corro, Guoqing Zheng, Shweti Mahajan, Dany Rouhana, Andres Codas, Yadong Lu, Wei-ge Chen, Olga Vrousgos, Corby Rosset, Fillipe Silva, Hamed Khanpour, Yash Lara, Ahmed Awadallah
•
Jul 3, 2024
•
51
15
エージェントのインターネット:協調的知能のための異種エージェントのウェブを構築する
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence
Weize Chen, Ziming You, Ran Li, Yitong Guan, Chen Qian, Chenyang Zhao, Cheng Yang, Ruobing Xie, Zhiyuan Liu, Maosong Sun
•
Jul 9, 2024
•
28
4
Video-STaR: 任意の監督信号によるビデオ命令チューニングを可能にする自己学習
Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision
Orr Zohar, Xiaohan Wang, Yonatan Bitton, Idan Szpektor, Serena Yeung-Levy
•
Jul 8, 2024
•
27
3
RodinHD: 拡散モデルを用いた高精細3Dアバター生成
RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models
Bowen Zhang, Yiji Cheng, Chunyu Wang, Ting Zhang, Jiaolong Yang, Yansong Tang, Feng Zhao, Dong Chen, Baining Guo
•
Jul 9, 2024
•
24
1
ヘブライ語へのLLM適応:強化された語彙と指示能力を備えたDictaLM 2.0の公開
Adapting LLMs to Hebrew: Unveiling DictaLM 2.0 with Enhanced Vocabulary and Instruction Capabilities
Shaltiel Shmidman, Avi Shmidman, Amir DN Cohen, Moshe Koppel
•
Jul 9, 2024
•
22
1
MiraData:長時間かつ構造化されたキャプションを備えた大規模ビデオデータセット
MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions
Xuan Ju, Yiming Gao, Zhaoyang Zhang, Ziyang Yuan, Xintao Wang, Ailing Zeng, Yu Xiong, Qiang Xu, Ying Shan
•
Jul 8, 2024
•
19
1
BM25S:積極的スパーススコアリングによる桁違いに高速な語彙検索
BM25S: Orders of magnitude faster lexical search via eager sparse scoring
Xing Han Lù
•
Jul 4, 2024
•
13
3
Lookback Lens: 大規模言語モデルにおける文脈的幻覚の検出と緩和 - アテンションマップのみを用いたアプローチ
Lookback Lens: Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps
Yung-Sung Chuang, Linlu Qiu, Cheng-Yu Hsieh, Ranjay Krishna, Yoon Kim, James Glass
•
Jul 9, 2024
•
12
3
TheoremLlama: 汎用LLMをLean4専門家へと変革する
TheoremLlama: Transforming General-Purpose LLMs into Lean4 Experts
Ruida Wang, Jipeng Zhang, Yizhen Jia, Rui Pan, Shizhe Diao, Renjie Pi, Tong Zhang
•
Jul 3, 2024
•
12
1
学習された異方性スケーリングを用いたタスクベクトルによる知識合成
Knowledge Composition using Task Vectors with Learned Anisotropic Scaling
Frederic Z. Zhang, Paul Albert, Cristian Rodriguez-Opazo, Anton van den Hengel, Ehsan Abbasnejad
•
Jul 3, 2024
•
12
3
グラフベースキャプショニング:領域キャプションを相互接続して視覚的記述を強化する
Graph-Based Captioning: Enhancing Visual Descriptions by Interconnecting Region Captions
Yu-Guan Hsieh, Cheng-Yu Hsieh, Shih-Ying Yeh, Louis Béthune, Hadi Pour Ansari, Pavan Kumar Anasosalu Vasu, Chun-Liang Li, Ranjay Krishna, Oncel Tuzel, Marco Cuturi
•
Jul 9, 2024
•
11
1
VIMI: マルチモーダル指示によるビデオ生成の基盤付け
VIMI: Grounding Video Generation through Multi-modal Instruction
Yuwei Fang, Willi Menapace, Aliaksandr Siarohin, Tsai-Shien Chen, Kuan-Chien Wang, Ivan Skorokhodov, Graham Neubig, Sergey Tulyakov
•
Jul 8, 2024
•
10
1
ループからオープスへ:不確実性下における言語モデルのフォールバック動作
From Loops to Oops: Fallback Behaviors of Language Models Under Uncertainty
Maor Ivgi, Ori Yoran, Jonathan Berant, Mor Geva
•
Jul 8, 2024
•
7
3
どうしてそれを知っているのですか?生物医学的質問に対する回答を参照する生成言語モデルの教育
How do you know that? Teaching Generative Language Models to Reference Answers to Biomedical Questions
Bojana Bašaragin, Adela Ljajić, Darija Medvecki, Lorenzo Cassano, Miloš Košprdić, Nikola Milošević
•
Jul 6, 2024
•
4
1
LETS-C: 時系列分類のための言語埋め込みの活用
LETS-C: Leveraging Language Embedding for Time Series Classification
Rachneet Kaur, Zhen Zeng, Tucker Balch, Manuela Veloso
•
Jul 9, 2024
•
2
5