ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
October 14th, 2024
白川オムニ技術レポート
Baichuan-Omni Technical Report
Yadong Li, Haoze Sun, Mingan Lin, Tianpeng Li, Guosheng Dong, Tao Zhang, Bowen Ding, Wei Song, Zhenglin Cheng, Yuqi Huo, Song Chen, Xu Li, Da Pan, Shusen Zhang, Xin Wu, Zheng Liang, Jun Liu, Tao Zhang, Keer Lu, Yaqi Zhao, Yanjun Shen, Fan Yang, Kaicheng Yu, Tao Lin, Jianhua Xu, Zenan Zhou, Weipeng Chen
•
Oct 11, 2024
•
88
8
Meissonic:マスクされた生成トランスフォーマーを活性化して、効率的な高解像度テキストから画像への合成を実現
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis
Jinbin Bai, Tian Ye, Wei Chow, Enxin Song, Qing-Guo Chen, Xiangtai Li, Zhen Dong, Lei Zhu, Shuicheng Yan
•
Oct 10, 2024
•
52
2
StructRAG:推論時間のハイブリッド情報構造化を介したLLMの知識集約的推論の強化
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization
Zhuoqun Li, Xuanang Chen, Haiyang Yu, Hongyu Lin, Yaojie Lu, Qiaoyu Tang, Fei Huang, Xianpei Han, Le Sun, Yongbin Li
•
Oct 11, 2024
•
50
2
一般から専門へ:タスク固有の視覚的指示調整を介したビジョン言語モデルの適応
From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning
Yang Bai, Yang Zhou, Jun Zhou, Rick Siow Mong Goh, Daniel Shu Wei Ting, Yong Liu
•
Oct 9, 2024
•
38
2
効率的なLLM事前学習のためのマルチエージェント協調データ選択
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining
Tianyi Bai, Ling Yang, Zhen Hao Wong, Jiahui Peng, Xinlin Zhuang, Chi Zhang, Lijun Wu, Qiu Jiantao, Wentao Zhang, Binhang Yuan, Conghui He
•
Oct 10, 2024
•
20
2
機械的置換性:層を横断して特徴をマッチング
Mechanistic Permutability: Match Features Across Layers
Nikita Balagansky, Ian Maksimov, Daniil Gavrilov
•
Oct 10, 2024
•
19
2
EvolveDirector: 大規模なビジョン言語モデルを用いた高度なテキストから画像生成のアプローチ
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models
Rui Zhao, Hangjie Yuan, Yujie Wei, Shiwei Zhang, Yuchao Gu, Lingmin Ran, Xiang Wang, Zhangjie Wu, Junhao Zhang, Yingya Zhang, Mike Zheng Shou
•
Oct 9, 2024
•
19
2
スーパーコレクト:エラー駆動型の洞察を用いた言語モデルの監督と修正
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights
Ling Yang, Zhaochen Yu, Tianjun Zhang, Minkai Xu, Joseph E. Gonzalez, Bin Cui, Shuicheng Yan
•
Oct 11, 2024
•
17
3
PositionID:LLMsは、明示的な位置認識を使用して長さを制御し、コピー&ペーストを行うことができます。
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness
Zekun Wang, Feiyu Duan, Yibo Zhang, Wangchunshu Zhou, Ke Xu, Wenhao Huang, Jie Fu
•
Oct 9, 2024
•
17
2
構成テキストから3D生成への意味スコア蒸留サンプリング
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation
Ling Yang, Zixiang Zhang, Junlin Han, Bohan Zeng, Runjia Li, Philip Torr, Wentao Zhang
•
Oct 11, 2024
•
14
2
最初のトークンまでの時間を改善するためのKV予測
KV Prediction for Improved Time to First Token
Maxwell Horton, Qingqing Cao, Chenfan Sun, Yanzi Jin, Sachin Mehta, Mohammad Rastegari, Moin Nabi
•
Oct 10, 2024
•
12
2
生成する際に考える:計画されたノイズ除去と離散拡散
Think While You Generate: Discrete Diffusion with Planned Denoising
Sulin Liu, Juno Nam, Andrew Campbell, Hannes Stärk, Yilun Xu, Tommi Jaakkola, Rafael Gómez-Bombarelli
•
Oct 8, 2024
•
11
3
ZeroComp:画像固有の情報を介したゼロショットオブジェクト合成による拡散
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion
Zitian Zhang, Frédéric Fortier-Chouinard, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Oct 10, 2024
•
9
3
I-Max: 事前学習されたRectified Flow Transformersの解像度ポテンシャルをProjected Flowで最大化
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
Ruoyi Du, Dongyang Liu, Le Zhuo, Qin Qi, Hongsheng Li, Zhanyu Ma, Peng Gao
•
Oct 10, 2024
•
5
2
DA-Code: 大規模言語モデルのためのエージェントデータサイエンスコード生成ベンチマーク
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models
Yiming Huang, Jianwen Luo, Yan Yu, Yitong Zhang, Fangyu Lei, Yifan Wei, Shizhu He, Lifu Huang, Xiao Liu, Jun Zhao, Kang Liu
•
Oct 9, 2024
•
5
3
MiRAGeNews: マルチモーダルなリアルなAI生成ニュースの検出
MiRAGeNews: Multimodal Realistic AI-Generated News Detection
Runsheng Huang, Liam Dugan, Yue Yang, Chris Callison-Burch
•
Oct 11, 2024
•
4
2
SimpleStrat: 層化を用いた言語モデル生成の多様化
SimpleStrat: Diversifying Language Model Generation with Stratification
Justin Wong, Yury Orlovskiy, Michael Luo, Sanjit A. Seshia, Joseph E. Gonzalez
•
Oct 11, 2024
•
4
2
Mentor-KD: 小さな言語モデルをより良い多段階推論者にする
Mentor-KD: Making Small Language Models Better Multi-step Reasoners
Hojae Lee, Junho Kim, SangKeun Lee
•
Oct 11, 2024
•
4
2
GenARM:報酬誘導生成における自己回帰報酬モデルによるテスト時アラインメント
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment
Yuancheng Xu, Udari Madhushani Sehwag, Alec Koppel, Sicheng Zhu, Bang An, Furong Huang, Sumitra Ganesh
•
Oct 10, 2024
•
4
2
Synth-SONAR: デュアル拡散モデルとGPTプロンプティングを介した多様性とリアリズムを向上させたソナー画像合成
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting
Purushothaman Natarajan, Kamal Basha, Athira Nambiar
•
Oct 11, 2024
•
1
2