ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
July 9th, 2024
MJ-Bench: Ist Ihr multimodales Belohnungsmodell wirklich ein guter Richter für die Generierung von Text-zu-Bild?
MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?
Zhaorun Chen, Yichao Du, Zichen Wen, Yiyang Zhou, Chenhang Cui, Zhenzhen Weng, Haoqin Tu, Chaoqi Wang, Zhengwei Tong, Qinglan Huang, Canyu Chen, Qinghao Ye, Zhihong Zhu, Yuqing Zhang, Jiawei Zhou, Zhuokai Zhao, Rafael Rafailov, Chelsea Finn, Huaxiu Yao
•
Jul 5, 2024
•
57
5
LLaMAX: Skalierung der linguistischen Horizonte von LLM durch Verbesserung der Übersetzungsfähigkeiten über 100 Sprachen hinaus
LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages
Yinquan Lu, Wenhao Zhu, Lei Li, Yu Qiao, Fei Yuan
•
Jul 8, 2024
•
38
2
Assoziativer Rekurrenter Gedächtnis-Transformer
Associative Recurrent Memory Transformer
Ivan Rodkin, Yuri Kuratov, Aydar Bulatov, Mikhail Burtsev
•
Jul 5, 2024
•
37
2
Lernen von aktions- und begründungszentrierter Bildbearbeitung aus Videos und Simulationen
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations
Benno Krojer, Dheeraj Vattikonda, Luis Lara, Varun Jampani, Eva Portelance, Christopher Pal, Siva Reddy
•
Jul 3, 2024
•
32
2
ANOLE: Ein offenes, autoregressives, natives großes multimodales Modell für die simultane Erzeugung von Bildern und Texten.
ANOLE: An Open, Autoregressive, Native Large Multimodal Models for Interleaved Image-Text Generation
Ethan Chern, Jiadi Su, Yan Ma, Pengfei Liu
•
Jul 8, 2024
•
23
4
Bewertung von Sprachmodellkontextfenstern: Ein "Arbeitsgedächtnis"-Test und Korrektur zur Inferenzzeit
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction
Amanda Dsouza, Christopher Glaze, Changho Shin, Frederic Sala
•
Jul 4, 2024
•
17
1
UltraEdit: Anweisungsbasierte Feinkörnige Bildbearbeitung im großen Maßstab
UltraEdit: Instruction-based Fine-Grained Image Editing at Scale
Haozhe Zhao, Xiaojian Ma, Liang Chen, Shuzheng Si, Rujie Wu, Kaikai An, Peiyu Yu, Minjia Zhang, Qing Li, Baobao Chang
•
Jul 7, 2024
•
15
1
Tailor3D: Anpassung von 3D-Assets durch Bearbeitung und Generierung mit Dual-Side-Bildern
Tailor3D: Customized 3D Assets Editing and Generation with Dual-Side Images
Zhangyang Qi, Yunhan Yang, Mengchen Zhang, Long Xing, Xiaoyang Wu, Tong Wu, Dahua Lin, Xihui Liu, Jiaqi Wang, Hengshuang Zhao
•
Jul 8, 2024
•
14
1
InverseCoder: Die Kraft von Instruktion-angepassten Code LLMs mit Inverse-Instruct entfesseln
InverseCoder: Unleashing the Power of Instruction-Tuned Code LLMs with Inverse-Instruct
Yutong Wu, Di Huang, Wenxuan Shi, Wei Wang, Lingzhe Gao, Shihao Liu, Ziyuan Nan, Kaizhao Yuan, Rui Zhang, Xishan Zhang, Zidong Du, Qi Guo, Yewen Pu, Dawei Yin, Xing Hu, Yunji Chen
•
Jul 8, 2024
•
14
2
Kompositionelle Videogenerierung als Flussausgleich
Compositional Video Generation as Flow Equalization
Xingyi Yang, Xinchao Wang
•
Jun 10, 2024
•
14
1
Mehr-Objekt-Halluzination in Vision-Language-Modellen
Multi-Object Hallucination in Vision-Language Models
Xuweiyi Chen, Ziqiao Ma, Xuejun Zhang, Sihan Xu, Shengyi Qian, Jianing Yang, David F. Fouhey, Joyce Chai
•
Jul 8, 2024
•
12
2
DPE: Daten-effizientes Plug-and-Play Prompt-Erweiterungssystem
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System
Miao Zheng, Hao Liang, Fan Yang, Haoze Sun, Tianpeng Li, Lingchu Xiong, Yan Zhang, Yozhen Wu, Kun Li, Yanjun Sheng, Mingan Lin, Tao Zhang, Guosheng Dong, Yujing Qiao, Kun Fang, Weipeng Chen, Bin Cui, Wentao Zhang, Zenan Zhou
•
Jul 8, 2024
•
11
2
Schulung von Aufgabenspezialisten durch distillationsbasiertes Retrieval-Training.
Training Task Experts through Retrieval Based Distillation
Jiaxin Ge, Xueying Jia, Vijay Viswanathan, Hongyin Luo, Graham Neubig
•
Jul 7, 2024
•
10
1
Das Verständnis der visuellen Merkmalsabhängigkeit im Kontext der Komplexität
Understanding Visual Feature Reliance through the Lens of Complexity
Thomas Fel, Louis Bethune, Andrew Kyle Lampinen, Thomas Serre, Katherine Hermann
•
Jul 8, 2024
•
7
1
PartCraft: Kreative Objekte durch Teile herstellen
PartCraft: Crafting Creative Objects by Parts
Kam Woh Ng, Xiatian Zhu, Yi-Zhe Song, Tao Xiang
•
Jul 5, 2024
•
6
2
LLMAEL: Große Sprachmodelle sind gute Kontextverstärker für die Verknüpfung von Entitäten.
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking
Amy Xin, Yunjia Qi, Zijun Yao, Fangwei Zhu, Kaisheng Zeng, Xu Bin, Lei Hou, Juanzi Li
•
Jul 4, 2024
•
4
1
ANAH-v2: Skalierung der analytischen Halluzinationsannotation großer Sprachmodelle
ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models
Yuzhe Gu, Ziwei Ji, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen
•
Jul 5, 2024
•
3
3