ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
April 15th, 2025
소시오버스: LLM 에이전트와 1천만 명의 실세계 사용자 풀로 구동되는 사회 시뮬레이션을 위한 세계 모델
SocioVerse: A World Model for Social Simulation Powered by LLM Agents and A Pool of 10 Million Real-World Users
Xinnong Zhang, Jiayu Lin, Xinyi Mou, Shiyue Yang, Xiawei Liu, Libo Sun, Hanjia Lyu, Yihang Yang, Weihong Qi, Yue Chen, Guanying Li, Ling Yan, Yao Hu, Siming Chen, Yu Wang, Jingxuan Huang, Jiebo Luo, Shiping Tang, Libo Wu, Baohua Zhou, Zhongyu Wei
•
Apr 14, 2025
•
16
3
TinyLLaVA-Video-R1: 비디오 추론을 위한 더 작은 LMM(Large Multimodal Model) 모델 개발
TinyLLaVA-Video-R1: Towards Smaller LMMs for Video Reasoning
Xingjian Zhang, Siwei Wen, Wenjun Wu, Lei Huang
•
Apr 13, 2025
•
16
3
이미지 생성과 이해를 통합했는가? GPT-4o의 이미지 생성 능력에 대한 실증적 연구
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability
Ning Li, Jingran Zhang, Justin Cui
•
Apr 9, 2025
•
49
2
PRIMA.CPP: 저사양 일상 가정용 클러스터에서 700억 규모 LLM 추론 가속화
PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters
Zonghang Li, Tao Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Apr 7, 2025
•
126
7
Mavors: 멀티모달 대규모 언어 모델을 위한 다중 세분화 비디오 표현
Mavors: Multi-granularity Video Representation for Multimodal Large Language Model
Yang Shi, Jiaheng Liu, Yushuo Guan, Zhenhua Wu, Yuanxing Zhang, Zihao Wang, Weihong Lin, Jingyun Hua, Zekun Wang, Xinlong Chen, Bohan Zeng, Wentao Zhang, Fuzheng Zhang, Wenjing Yang, Di Zhang
•
Apr 14, 2025
•
30
2
강화 재순위화를 통한 코드 생성을 위한 반복적 자기 학습
Iterative Self-Training for Code Generation via Reinforced Re-Ranking
Nikita Sorokin, Ivan Sedykh, Valentin Malykh
•
Apr 13, 2025
•
34
2
DUMP: RL 기반 LLM 사후 학습을 위한 자동화된 분산 수준 커리큘럼 학습
DUMP: Automated Distribution-Level Curriculum Learning for RL-based LLM Post-training
Zhenting Wang, Guofeng Cui, Kun Wan, Wentian Zhao
•
Apr 13, 2025
•
19
2
VisuoThink: 다중모드 트리 탐색을 통해 LVLM 추론 강화하기
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search
Yikun Wang, Siyin Wang, Qinyuan Cheng, Zhaoye Fei, Liang Ding, Qipeng Guo, Dacheng Tao, Xipeng Qiu
•
Apr 12, 2025
•
12
4
FUSION: 심층적인 크로스모달 이해를 위한 시각-언어 표현의 완전 통합
FUSION: Fully Integration of Vision-Language Representations for Deep Cross-Modal Understanding
Zheng Liu, Mengjie Liu, Jingzhou Chen, Jingwei Xu, Bin Cui, Conghui He, Wentao Zhang
•
Apr 14, 2025
•
38
3
AgentRewardBench: 웹 에이전트 트랙토리 자동 평가의 성능 측정
AgentRewardBench: Evaluating Automatic Evaluations of Web Agent Trajectories
Xing Han Lù, Amirhossein Kazemnejad, Nicholas Meade, Arkil Patel, Dongchan Shin, Alejandra Zambrano, Karolina Stańczak, Peter Shaw, Christopher J. Pal, Siva Reddy
•
Apr 11, 2025
•
27
2
새로운 데이터가 LLM(대형 언어 모델) 지식에 어떻게 스며들고 이를 희석하는 방법
How new data permeates LLM knowledge and how to dilute it
Chen Sun, Renat Aksitov, Andrey Zhmoginov, Nolan Andrew Miller, Max Vladymyrov, Ulrich Rueckert, Been Kim, Mark Sandler
•
Apr 13, 2025
•
7
2
VL-Rethinker: 강화 학습을 통한 시각-언어 모델의 자기 성찰 유도
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning
Haozhe Wang, Chao Qu, Zuming Huang, Wei Chu, Fangzhen Lin, Wenhu Chen
•
Apr 10, 2025
•
42
2
LLM은 위험한 설득자가 될 수 있다: 대규모 언어 모델의 설득 안전성에 대한 실증적 연구
LLM Can be a Dangerous Persuader: Empirical Study of Persuasion Safety in Large Language Models
Minqian Liu, Zhiyang Xu, Xinyi Zhang, Heajun An, Sarvech Qadir, Qi Zhang, Pamela J. Wisniewski, Jin-Hee Cho, Sang Won Lee, Ruoxi Jia, Lifu Huang
•
Apr 14, 2025
•
4
2
3D CoCa: 대조 학습 모델이 3D 캡션 생성기로
3D CoCa: Contrastive Learners are 3D Captioners
Ting Huang, Zeyu Zhang, Yemin Wang, Hao Tang
•
Apr 13, 2025
•
5
2
LLM-SRBench: 대규모 언어 모델을 활용한 과학적 방정식 발견을 위한 새로운 벤치마크
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models
Parshin Shojaee, Ngoc-Hieu Nguyen, Kazem Meidani, Amir Barati Farimani, Khoa D Doan, Chandan K Reddy
•
Apr 14, 2025
•
8
2
MDK12-Bench: 다중 모달 대형 언어 모델의 추론 능력을 평가하기 위한 다학제적 벤치마크
MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models
Pengfei Zhou, Fanrui Zhang, Xiaopeng Peng, Zhaopan Xu, Jiaxin Ai, Yansheng Qiu, Chuanhao Li, Zhen Li, Ming Li, Yukang Feng, Jianwen Sun, Haoquan Zhang, Zizhen Li, Xiaofeng Mao, Wangbo Zhao, Kai Wang, Xiaojun Chang, Wenqi Shao, Yang You, Kaipeng Zhang
•
Apr 8, 2025
•
4
2
M1: Mamba 추론 모델을 통한 확장 가능한 테스트 타임 컴퓨팅을 향하여
M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models
Junxiong Wang, Wen-Ding Li, Daniele Paliotta, Daniel Ritter, Alexander M. Rush, Tri Dao
•
Apr 14, 2025
•
10
2
MIEB: 대규모 이미지 임베딩 벤치마크
MIEB: Massive Image Embedding Benchmark
Chenghao Xiao, Isaac Chung, Imene Kerboua, Jamie Stirling, Xin Zhang, Márton Kardos, Roman Solomatin, Noura Al Moubayed, Kenneth Enevoldsen, Niklas Muennighoff
•
Apr 14, 2025
•
16
2
InternVL3: 오픈소스 멀티모달 모델을 위한 고급 학습 및 테스트 시점 기법 탐구
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models
Jinguo Zhu, Weiyun Wang, Zhe Chen, Zhaoyang Liu, Shenglong Ye, Lixin Gu, Yuchen Duan, Hao Tian, Weijie Su, Jie Shao, Zhangwei Gao, Erfei Cui, Yue Cao, Yangzhou Liu, Weiye Xu, Hao Li, Jiahao Wang, Han Lv, Dengnian Chen, Songze Li, Yinan He, Tan Jiang, Jiapeng Luo, Yi Wang, Conghui He, Botian Shi, Xingcheng Zhang, Wenqi Shao, Junjun He, Yingtong Xiong, Wenwen Qu, Peng Sun, Penglong Jiao, Lijun Wu, Kaipeng Zhang, Huipeng Deng, Jiaye Ge, Kai Chen, Limin Wang, Min Dou, Lewei Lu, Xizhou Zhu, Tong Lu, Dahua Lin, Yu Qiao, Jifeng Dai, Wenhai Wang
•
Apr 14, 2025
•
250
8
DeepSeek 대 o3-mini: 추론 LLM이 기계 번역과 요약을 얼마나 잘 평가할 수 있는가?
DeepSeek vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization?
Daniil Larionov, Sotaro Takeshita, Ran Zhang, Yanran Chen, Christoph Leiter, Zhipin Wang, Christian Greisinger, Steffen Eger
•
Apr 10, 2025
•
4
2
추론 모델은 사고 없이도 효과적일 수 있다
Reasoning Models Can Be Effective Without Thinking
Wenjie Ma, Jingxuan He, Charlie Snell, Tyler Griggs, Sewon Min, Matei Zaharia
•
Apr 14, 2025
•
10
2
S1-Bench: 대규모 추론 모델의 시스템 1 사고 능력 평가를 위한 간단한 벤치마크
S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models
Wenyuan Zhang, Shuaiyi Nie, Xinghua Zhang, Zefeng Zhang, Tingwen Liu
•
Apr 14, 2025
•
21
3
실행 가능한 기능적 추상화: 고급 수학 문제를 위한 생성적 프로그램 추론
Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems
Zaid Khan, Elias Stengel-Eskin, Archiki Prasad, Jaemin Cho, Mohit Bansal
•
Apr 14, 2025
•
13
2
데이터 장벽을 넘어서 - 작업 일반화를 통해 GUI 에이전트 구축하기
Breaking the Data Barrier -- Building GUI Agents Through Task Generalization
Junlei Zhang, Zichen Ding, Chang Ma, Zijie Chen, Qiushi Sun, Zhenzhong Lan, Junxian He
•
Apr 14, 2025
•
17
2
EmoAgent: 정신 건강 안전을 위한 인간-AI 상호작용 평가 및 보호
EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety
Jiahao Qiu, Yinghui He, Xinzhe Juan, Yiming Wang, Yuhan Liu, Zixin Yao, Yue Wu, Xun Jiang, Ling Yang, Mengdi Wang
•
Apr 13, 2025
•
7
3
DiffuMural: 다중 스케일 확산을 통한 둔황 벽화 복원
DiffuMural: Restoring Dunhuang Murals with Multi-scale Diffusion
Puyu Han, Jiaju Kang, Yuhang Pan, Erting Pan, Zeyu Zhang, Qunchao Jin, Juntao Jiang, Zhichen Liu, Luqi Gong
•
Apr 13, 2025
•
1
2
MCP 보안 감사: 모델 컨텍스트 프로토콜을 사용하는 LLM은 주요 보안 취약점을 허용함
MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits
Brandon Radosevich, John Halloran
•
Apr 2, 2025
•
3
2
AI Scientist-v2: 에이전트 기반 트리 탐색을 통한 워크숍 수준 자동화 과학 발견
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search
Yutaro Yamada, Robert Tjarko Lange, Cong Lu, Shengran Hu, Chris Lu, Jakob Foerster, Jeff Clune, David Ha
•
Apr 10, 2025
•
11
2