ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
July 16th, 2024
Informe Técnico Qwen2
Qwen2 Technical Report
An Yang, Baosong Yang, Binyuan Hui, Bo Zheng, Bowen Yu, Chang Zhou, Chengpeng Li, Chengyuan Li, Dayiheng Liu, Fei Huang, Guanting Dong, Haoran Wei, Huan Lin, Jialong Tang, Jialin Wang, Jian Yang, Jianhong Tu, Jianwei Zhang, Jianxin Ma, Jin Xu, Jingren Zhou, Jinze Bai, Jinzheng He, Junyang Lin, Kai Dang, Keming Lu, Keqin Chen, Kexin Yang, Mei Li, Mingfeng Xue, Na Ni, Pei Zhang, Peng Wang, Ru Peng, Rui Men, Ruize Gao, Runji Lin, Shijie Wang, Shuai Bai, Sinan Tan, Tianhang Zhu, Tianhao Li, Tianyu Liu, Wenbin Ge, Xiaodong Deng, Xiaohuan Zhou, Xingzhang Ren, Xinyu Zhang, Xipin Wei, Xuancheng Ren, Yang Fan, Yang Yao, Yichang Zhang, Yu Wan, Yunfei Chu, Zeyu Cui, Zhenru Zhang, Zhihao Fan
•
Jul 15, 2024
•
163
3
Aprendiendo a Rechazar: Hacia la Mitigación de Riesgos de Privacidad en LLMs
Learning to Refuse: Towards Mitigating Privacy Risks in LLMs
Zhenhua Liu, Tong Zhu, Chuanyuan Tan, Wenliang Chen
•
Jul 14, 2024
•
32
4
GRUtopia: Robots Generales en un Sueño de Ciudad a Gran Escala
GRUtopia: Dream General Robots in a City at Scale
Hanqing Wang, Jiahe Chen, Wensi Huang, Qingwei Ben, Tai Wang, Boyu Mi, Tao Huang, Siheng Zhao, Yilun Chen, Sizhe Yang, Peizhou Cao, Wenye Yu, Zichao Ye, Jialun Li, Junfeng Long, Zirui Wang, Huiling Wang, Ying Zhao, Zhongying Tu, Yu Qiao, Dahua Lin, Jiangmiao Pang
•
Jul 15, 2024
•
26
2
Lo Bueno, lo Malo y lo Codicioso: La Evaluación de LLMs no Debería Ignorar el No Determinismo
The Good, The Bad, and The Greedy: Evaluation of LLMs Should Not Ignore Non-Determinism
Yifan Song, Guoyin Wang, Sujian Li, Bill Yuchen Lin
•
Jul 15, 2024
•
25
4
Q-Esparso: Todos los Modelos de Lenguaje Grandes pueden ser Totalmente Activados de forma Esparsa.
Q-Sparse: All Large Language Models can be Fully Sparsely-Activated
Hongyu Wang, Shuming Ma, Ruiping Wang, Furu Wei
•
Jul 15, 2024
•
23
3
Autorrevisores Fundamentales: Domando Modelos de Lenguaje Grandes para una Mejor Evaluación Automática
Foundational Autoraters: Taming Large Language Models for Better Automatic Evaluation
Tu Vu, Kalpesh Krishna, Salaheddin Alzubi, Chris Tar, Manaal Faruqui, Yun-Hsuan Sung
•
Jul 15, 2024
•
15
8
Make-An-Agent: Un Generador de Redes de Políticas Generalizable con Difusión Provocada por Comportamiento
Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion
Yongyuan Liang, Tingqiang Xu, Kaizhe Hu, Guangqi Jiang, Furong Huang, Huazhe Xu
•
Jul 15, 2024
•
11
2
DataDream: Generación de Conjuntos de Datos Guiada de Pocas Muestras
DataDream: Few-shot Guided Dataset Generation
Jae Myung Kim, Jessica Bader, Stephan Alaniz, Cordelia Schmid, Zeynep Akata
•
Jul 15, 2024
•
10
2
Transformadores Generativos de Video a Audio enmascarados con Sincronicidad Mejorada
Masked Generative Video-to-Audio Transformers with Enhanced Synchronicity
Santiago Pascual, Chunghsin Yeh, Ioannis Tsiamas, Joan Serrà
•
Jul 15, 2024
•
8
2
Modelos de Ocupación de Video
Video Occupancy Models
Manan Tomar, Philippe Hansen-Estruch, Philip Bachman, Alex Lamb, John Langford, Matthew E. Taylor, Sergey Levine
•
Jun 25, 2024
•
8
2
Spider2-V: ¿Qué tan lejos están los agentes multimodales de automatizar los flujos de trabajo de la ciencia de datos y la ingeniería?
Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows?
Ruisheng Cao, Fangyu Lei, Haoyuan Wu, Jixuan Chen, Yeqiao Fu, Hongcheng Gao, Xinzhuang Xiong, Hanchong Zhang, Yuchen Mao, Wenjing Hu, Tianbao Xie, Hongshen Xu, Danyang Zhang, Sida Wang, Ruoxi Sun, Pengcheng Yin, Caiming Xiong, Ansong Ni, Qian Liu, Victor Zhong, Lu Chen, Kai Yu, Tao Yu
•
Jul 15, 2024
•
7
2
LAB-Bench: Medición de las Capacidades de los Modelos de Lenguaje para la Investigación en Biología
LAB-Bench: Measuring Capabilities of Language Models for Biology Research
Jon M. Laurent, Joseph D. Janizek, Michael Ruzo, Michaela M. Hinks, Michael J. Hammerling, Siddharth Narayanan, Manvitha Ponnapati, Andrew D. White, Samuel G. Rodriques
•
Jul 14, 2024
•
6
2
SHERL: Sintetizando Alta Precisión y Memoria Eficiente para Aprendizaje por Transferencia con Recursos Limitados
SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning
Haiwen Diao, Bo Wan, Xu Jia, Yunzhi Zhuge, Ying Zhang, Huchuan Lu, Long Chen
•
Jul 10, 2024
•
6
2
MMM: Efecto de Reforzamiento Mutuo Multilingüe Mezclar Conjuntos de Datos y Probar con Modelos de Lenguaje de Gran Escala para la Extracción de Información de Dominio Abierto.
MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models
Chengguang Gan, Qingyu Yin, Xinyang He, Hanjun Wei, Yunhao Liang, Younghun Lim, Shijian Wang, Hexiang Huang, Qinghao Zhang, Shiwen Ni, Tatsunori Mori
•
Jul 15, 2024
•
5
2
Los análisis de circuitos LLM son consistentes a lo largo del entrenamiento y la escala.
LLM Circuit Analyses Are Consistent Across Training and Scale
Curt Tigges, Michael Hanna, Qinan Yu, Stella Biderman
•
Jul 15, 2024
•
5
2
Calibración de Ruido: Mejora de Video Preservando el Contenido con Conexión Automática utilizando Modelos de Difusión de Video Pre-entrenados
Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models
Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan
•
Jul 14, 2024
•
5
2