ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
July 18th, 2024
Spectra: 三値化、量子化、FP16言語モデルの包括的研究
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models
Ayush Kaushal, Tejas Pandey, Tejas Vaidhya, Aaryan Bhagat, Irina Rish
•
Jul 17, 2024
•
80
3
GoldFinch: 線形プリフィルと極限KVキャッシュ圧縮を備えた高性能RWKV/トランスフォーマーハイブリッド
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
Daniel Goldstein, Fares Obeid, Eric Alcaide, Guangyu Song, Eugene Cheah
•
Jul 16, 2024
•
57
8
AgentPoison: メモリまたは知識ベースの汚染によるLLMエージェントのレッドチーミング
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li
•
Jul 17, 2024
•
52
3
E5-V:マルチモーダル大規模言語モデルによるユニバーサル埋め込み
E5-V: Universal Embeddings with Multimodal Large Language Models
Ting Jiang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang, Deqing Wang, Fuzhen Zhuang
•
Jul 17, 2024
•
41
3
LMMs-Eval: 大規模マルチモーダルモデルの評価に関する現実的検証
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models
Kaichen Zhang, Bo Li, Peiyuan Zhang, Fanyi Pu, Joshua Adrian Cahyono, Kairui Hu, Shuai Liu, Yuanhan Zhang, Jingkang Yang, Chunyuan Li, Ziwei Liu
•
Jul 17, 2024
•
36
4
大規模言語モデルのためのパッチレベルトレーニング
Patch-Level Training for Large Language Models
Chenze Shao, Fandong Meng, Jie Zhou
•
Jul 17, 2024
•
17
3
VD3D: 大規模ビデオ拡散トランスフォーマーを3Dカメラ制御に適応させる
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Sherwin Bahmani, Ivan Skorokhodov, Aliaksandr Siarohin, Willi Menapace, Guocheng Qian, Michael Vasilkovsky, Hsin-Ying Lee, Chaoyang Wang, Jiaxu Zou, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Jul 17, 2024
•
13
3
IMAGDressing-v1: カスタマイズ可能なバーチャルドレッシング
IMAGDressing-v1: Customizable Virtual Dressing
Fei Shen, Xin Jiang, Xin He, Hu Ye, Cong Wang, Xiaoyu Du, Zechao Li, Jinghui Tang
•
Jul 17, 2024
•
13
2
Goldfish: 任意の長さのビデオに対する視覚言語理解
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Kirolos Ataallah, Xiaoqian Shen, Eslam Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny
•
Jul 17, 2024
•
8
2
Case2Code: 合成データを用いた帰納的推論の学習
Case2Code: Learning Inductive Reasoning with Synthetic Data
Yunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan, Xipeng Qiu, Xuanjing Huang, Dahua Lin
•
Jul 17, 2024
•
8
7
離散ボトルネック特徴量を用いた音楽生成のための音声条件付け
Audio Conditioning for Music Generation via Discrete Bottleneck Features
Simon Rouard, Yossi Adi, Jade Copet, Axel Roebel, Alexandre Défossez
•
Jul 17, 2024
•
7
2
Splatfacto-W: 制約のない写真コレクションに対するガウススプラッティングのNerfstudio実装
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Congrong Xu, Justin Kerr, Angjoo Kanazawa
•
Jul 17, 2024
•
6
2
ThinkGrasp: クラッター環境における戦略的パーツ把持のための視覚-言語システム
ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter
Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
•
Jul 16, 2024
•
5
2
AUITestAgent: 要件指向のGUI機能テスト自動化
AUITestAgent: Automatic Requirements Oriented GUI Function Testing
Yongxiang Hu, Xuan Wang, Yingchuan Wang, Yu Zhang, Shiyu Guo, Chaoyi Chen, Xin Wang, Yangfan Zhou
•
Jul 12, 2024
•
5
2
NavGPT-2: 大規模視覚言語モデルのためのナビゲーション推論能力の解放
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu
•
Jul 17, 2024
•
4
2
大規模言語モデルのための実用的なアンラーニング
Practical Unlearning for Large Language Models
Chongyang Gao, Lixu Wang, Chenkai Weng, Xiao Wang, Qi Zhu
•
Jul 14, 2024
•
4
2
「ノー」と言う技術:言語モデルにおける文脈的拒否行動
The Art of Saying No: Contextual Noncompliance in Language Models
Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi
•
Jul 2, 2024
•
4
2
ゼロショット言語間転移による文法誤り検出のための合成データ生成
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection
Gaetan Lopez Latouche, Marc-André Carbonneau, Ben Swanson
•
Jul 16, 2024
•
2
4
安全でない動画生成の理解に向けて
Towards Understanding Unsafe Video Generation
Yan Pang, Aiping Xiong, Yang Zhang, Tianhao Wang
•
Jul 17, 2024
•
0
2