ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
July 18th, 2024
스펙트라: 삼항, 양자화, FP16 언어 모델에 대한 포괄적 연구
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models
Ayush Kaushal, Tejas Pandey, Tejas Vaidhya, Aaryan Bhagat, Irina Rish
•
Jul 17, 2024
•
80
3
GoldFinch: 선형 프리필과 극단적인 KV 캐시 압축을 지원하는 고성능 RWKV/트랜스포머 하이브리드
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
Daniel Goldstein, Fares Obeid, Eric Alcaide, Guangyu Song, Eugene Cheah
•
Jul 16, 2024
•
57
8
AgentPoison: 메모리 또는 지식 베이스 중독을 통한 LLM 에이전트 레드팀 테스트
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li
•
Jul 17, 2024
•
52
3
E5-V: 멀티모달 대형 언어 모델을 활용한 범용 임베딩
E5-V: Universal Embeddings with Multimodal Large Language Models
Ting Jiang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang, Deqing Wang, Fuzhen Zhuang
•
Jul 17, 2024
•
41
3
LMMs-Eval: 대규모 멀티모달 모델 평가에 대한 현실 점검
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models
Kaichen Zhang, Bo Li, Peiyuan Zhang, Fanyi Pu, Joshua Adrian Cahyono, Kairui Hu, Shuai Liu, Yuanhan Zhang, Jingkang Yang, Chunyuan Li, Ziwei Liu
•
Jul 17, 2024
•
36
4
대규모 언어 모델을 위한 패치 수준 학습
Patch-Level Training for Large Language Models
Chenze Shao, Fandong Meng, Jie Zhou
•
Jul 17, 2024
•
17
3
VD3D: 대형 비디오 확산 트랜스포머를 3D 카메라 제어에 적용하기
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Sherwin Bahmani, Ivan Skorokhodov, Aliaksandr Siarohin, Willi Menapace, Guocheng Qian, Michael Vasilkovsky, Hsin-Ying Lee, Chaoyang Wang, Jiaxu Zou, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Jul 17, 2024
•
13
3
IMAGDressing-v1: 맞춤형 가상 의상 체험
IMAGDressing-v1: Customizable Virtual Dressing
Fei Shen, Xin Jiang, Xin He, Hu Ye, Cong Wang, Xiaoyu Du, Zechao Li, Jinghui Tang
•
Jul 17, 2024
•
13
2
Goldfish: 임의 길이 비디오에 대한 시각-언어 이해
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Kirolos Ataallah, Xiaoqian Shen, Eslam Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny
•
Jul 17, 2024
•
8
2
Case2Code: 합성 데이터를 활용한 귀납적 추론 학습
Case2Code: Learning Inductive Reasoning with Synthetic Data
Yunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan, Xipeng Qiu, Xuanjing Huang, Dahua Lin
•
Jul 17, 2024
•
8
7
이산적 병목 특징을 통한 음악 생성을 위한 오디오 조건화
Audio Conditioning for Music Generation via Discrete Bottleneck Features
Simon Rouard, Yossi Adi, Jade Copet, Axel Roebel, Alexandre Défossez
•
Jul 17, 2024
•
7
2
Splatfacto-W: 제약 없는 사진 컬렉션을 위한 가우시안 스플래팅의 Nerfstudio 구현
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Congrong Xu, Justin Kerr, Angjoo Kanazawa
•
Jul 17, 2024
•
6
2
ThinkGasp: 혼잡한 환경에서 전략적 부품 파지를 위한 시각-언어 시스템
ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter
Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
•
Jul 16, 2024
•
5
2
AUITestAgent: 요구사항 기반 GUI 기능 테스트 자동화
AUITestAgent: Automatic Requirements Oriented GUI Function Testing
Yongxiang Hu, Xuan Wang, Yingchuan Wang, Yu Zhang, Shiyu Guo, Chaoyi Chen, Xin Wang, Yangfan Zhou
•
Jul 12, 2024
•
5
2
NavGPT-2: 대규모 시각-언어 모델을 위한 항법 추론 능력의 해방
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu
•
Jul 17, 2024
•
4
2
대규모 언어 모델을 위한 실용적 언러닝
Practical Unlearning for Large Language Models
Chongyang Gao, Lixu Wang, Chenkai Weng, Xiao Wang, Qi Zhu
•
Jul 14, 2024
•
4
2
말하지 않는 기술: 언어 모델의 맥락적 비순응성
The Art of Saying No: Contextual Noncompliance in Language Models
Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi
•
Jul 2, 2024
•
4
2
제로샷 교차 언어 전이를 활용한 문법 오류 탐지를 위한 합성 데이터 생성
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection
Gaetan Lopez Latouche, Marc-André Carbonneau, Ben Swanson
•
Jul 16, 2024
•
2
4
안전하지 않은 비디오 생성의 이해를 향하여
Towards Understanding Unsafe Video Generation
Yan Pang, Aiping Xiong, Yang Zhang, Tianhao Wang
•
Jul 17, 2024
•
0
2