ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
July 30th, 2024
SaulLM-54B & SaulLM-141B: 法務ドメインにおけるドメイン適応のスケールアップ
SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain
Pierre Colombo, Telmo Pires, Malik Boudiaf, Rui Melo, Dominic Culver, Sofia Morgado, Etienne Malaboeuf, Gabriel Hautreux, Johanne Charpentier, Michael Desa
•
Jul 28, 2024
•
66
2
大規模言語モデルを三モーダルアーキテクチャに統合した自動的うつ病分類
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification
Santosh V. Patapati
•
Jul 27, 2024
•
59
9
SeaLLMs 3: 東南アジア言語向けのオープン基盤およびチャット多言語大規模言語モデル
SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages
Wenxuan Zhang, Hou Pong Chan, Yiran Zhao, Mahani Aljunied, Jianyu Wang, Chaoqun Liu, Yue Deng, Zhiqiang Hu, Weiwen Xu, Yew Ken Chia, Xin Li, Lidong Bing
•
Jul 29, 2024
•
58
6
FreeLong: スペクトラルブレンド時系列アテンションを用いたトレーニング不要の長尺動画生成
FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention
Yu Lu, Yuanzhi Liang, Linchao Zhu, Yi Yang
•
Jul 29, 2024
•
52
2
Theia: ロボット学習のための多様な視覚基盤モデルの蒸留
Theia: Distilling Diverse Vision Foundation Models for Robot Learning
Jinghuan Shang, Karl Schmeckpeper, Brandon B. May, Maria Vittoria Minniti, Tarik Kelestemur, David Watkins, Laura Herlant
•
Jul 29, 2024
•
48
3
MindSearch: 人間の思考を模倣する深層AI検索システム
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao
•
Jul 29, 2024
•
44
4
MMAU:多様な領域にわたるエージェント能力の包括的ベンチマーク
MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains
Guoli Yin, Haoping Bai, Shuang Ma, Feng Nan, Yanchao Sun, Zhaoyang Xu, Shen Ma, Jiarui Lu, Xiang Kong, Aonan Zhang, Dian Ang Yap, Yizhe zhang, Karsten Ahnert, Vik Kamath, Mathias Berglund, Dominic Walsh, Tobias Gindele, Juergen Wiest, Zhengfeng Lai, Xiaoming Wang, Jiulong Shan, Meng Cao, Ruoming Pang, Zirui Wang
•
Jul 18, 2024
•
41
4
拡散フィードバックがCLIPの視覚性能を向上させる
Diffusion Feedback Helps CLIP See Better
Wenxuan Wang, Quan Sun, Fan Zhang, Yepeng Tang, Jing Liu, Xinlong Wang
•
Jul 29, 2024
•
37
2
ネストされたエキスパートの混合:視覚トークンの適応的処理
Mixture of Nested Experts: Adaptive Processing of Visual Tokens
Gagan Jain, Nidhi Hegde, Aditya Kusupati, Arsha Nagrani, Shyamal Buch, Prateek Jain, Anurag Arnab, Sujoy Paul
•
Jul 29, 2024
•
37
4
直接選好最適化を用いた自己学習が 連鎖的思考推論を改善する
Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning
Tianduo Wang, Shichen Li, Wei Lu
•
Jul 25, 2024
•
34
4
Cycle3D: 生成-再構成サイクルによる高品質で一貫性のある画像から3Dへの生成
Cycle3D: High-quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle
Zhenyu Tang, Junwu Zhang, Xinhua Cheng, Wangbo Yu, Chaoran Feng, Yatian Pang, Bin Lin, Li Yuan
•
Jul 28, 2024
•
28
2
ビジュアル・リドル:大規模視覚言語モデルに対する常識と世界知識の挑戦
Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models
Nitzan Bitton-Guetta, Aviv Slobodkin, Aviya Maimon, Eliya Habba, Royi Rassin, Yonatan Bitton, Idan Szpektor, Amir Globerson, Yuval Elovici
•
Jul 28, 2024
•
23
2
都市シーン理解のための3D質問応答
3D Question Answering for City Scene Understanding
Penglei Sun, Yaoxian Song, Xiang Liu, Xiaofei Yang, Qiang Wang, Tiefeng Li, Yang Yang, Xiaowen Chu
•
Jul 24, 2024
•
22
5
ATHAR:古典アラビア語から英語への翻訳のための高品質で多様なデータセット
ATHAR: A High-Quality and Diverse Dataset for Classical Arabic to English Translation
Mohammed Khalil, Mohammed Sabry
•
Jul 29, 2024
•
21
1
メタ報酬付き言語モデル:LLMをメタ審判として活用した自己改善型アライメント
Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge
Tianhao Wu, Weizhe Yuan, Olga Golovneva, Jing Xu, Yuandong Tian, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar
•
Jul 28, 2024
•
21
2
ImagiNet: コントラスティブ学習による汎用的な合成画像検出のためのマルチコンテンツデータセット
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
Delyan Boychev, Radostin Cholakov
•
Jul 29, 2024
•
20
2
大規模言語モデルを用いたリトアニア語オンラインレビューの感情分析
Sentiment Analysis of Lithuanian Online Reviews Using Large Language Models
Brigita Vileikytė, Mantas Lukoševičius, Lukas Stankevičius
•
Jul 29, 2024
•
12
1
ギャップを埋める:モノラルスマホ撮影からスタジオ品質のアバター生成
Bridging the Gap: Studio-like Avatar Creation from a Monocular Phone Capture
ShahRukh Athar, Shunsuke Saito, Zhengyu Yang, Stanislav Pidhorsky, Chen Cao
•
Jul 28, 2024
•
12
1
WalkTheDog: 位相多様体を介したクロスモルフォロジー運動アラインメント
WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds
Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
•
Jul 11, 2024
•
12
2
VolDoGer: 視覚言語タスクにおけるドメイン一般化のためのLLM支援データセット
VolDoGer: LLM-assisted Datasets for Domain Generalization in Vision-Language Tasks
Juhwan Choi, Junehyoung Kwon, JungMin Yun, Seunguk Yu, YoungBin Kim
•
Jul 29, 2024
•
11
3
TAPTRv2: アテンションベースの位置更新によるTracking Any Pointの改善
TAPTRv2: Attention-based Position Update Improves Tracking Any Point
Hongyang Li, Hao Zhang, Shilong Liu, Zhaoyang Zeng, Feng Li, Tianhe Ren, Bohan Li, Lei Zhang
•
Jul 23, 2024
•
11
4