ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
August 12th, 2024
VITA:オープンソース型インタラクティブ・オムニマルチモーダルLLMに向けて
VITA: Towards Open-Source Interactive Omni Multimodal LLM
Chaoyou Fu, Haojia Lin, Zuwei Long, Yunhang Shen, Meng Zhao, Yifan Zhang, Xiong Wang, Di Yin, Long Ma, Xiawu Zheng, Ran He, Rongrong Ji, Yunsheng Wu, Caifeng Shan, Xing Sun
•
Aug 9, 2024
•
49
3
Gemmaスコープ:Gemma 2におけるオープンスパースオートエンコーダの全領域同時適用
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2
Tom Lieberum, Senthooran Rajamanoharan, Arthur Conmy, Lewis Smith, Nicolas Sonnerat, Vikrant Varma, János Kramár, Anca Dragan, Rohin Shah, Neel Nanda
•
Aug 9, 2024
•
40
2
mPLUG-Owl3: マルチモーダル大規模言語モデルにおける長い画像シーケンス理解に向けて
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models
Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou
•
Aug 9, 2024
•
35
2
UniBench: 視覚的推論には、スケーリングを超えた視覚と言語の再考が必要
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling
Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim
•
Aug 9, 2024
•
25
2
ToolSandbox: ステートフルで会話型のインタラクティブな評価ベンチマークによるLLMツール利用能力の検証
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities
Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang
•
Aug 8, 2024
•
18
4
カルマンインスパイアード特徴伝播によるビデオ顔超解像
Kalman-Inspired Feature Propagation for Video Face Super-Resolution
Ruicheng Feng, Chongyi Li, Chen Change Loy
•
Aug 9, 2024
•
10
3
BRAT: アーキテクチャに依存しないテキスト反転のためのボーナス直交トークン
BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion
James Baker
•
Aug 8, 2024
•
9
2
MooER: Moore ThreadsによるLLMベースの音声認識および翻訳モデル
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads
Junhao Xu, Zhenlin Liang, Yi Liu, Yichao Hu, Jian Li, Yajun Zheng, Meng Cai, Hua Wang
•
Aug 9, 2024
•
8
2
MulliVC: サイクル一貫性を備えた多言語音声変換
MulliVC: Multi-lingual Voice Conversion With Cycle Consistency
Jiawei Huang, Chen Zhang, Yi Ren, Ziyue Jiang, Zhenhui Ye, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao
•
Aug 8, 2024
•
8
2
言語モデルからの新規実験仮説の生成:与格交替の一般化に関する事例研究
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization
Kanishka Misra, Najoung Kim
•
Aug 9, 2024
•
6
1