ChatPaper.aiChatPaper

Набор инструментов BEHAVIOR Vision: настраиваемая генерация набора данных через симуляцию

BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation

May 15, 2024
Авторы: Yunhao Ge, Yihe Tang, Jiashu Xu, Cem Gokmen, Chengshu Li, Wensi Ai, Benjamin Jose Martinez, Arman Aydin, Mona Anvari, Ayush K Chakravarthy, Hong-Xing Yu, Josiah Wong, Sanjana Srivastava, Sharon Lee, Shengxin Zha, Laurent Itti, Yunzhu Li, Roberto Martín-Martín, Miao Liu, Pengchuan Zhang, Ruohan Zhang, Li Fei-Fei, Jiajun Wu
cs.AI

Аннотация

Систематическая оценка и понимание моделей компьютерного зрения в различных условиях требуют больших объемов данных с подробными и настраиваемыми метками, чего реальные наборы данных по компьютерному зрению редко удовлетворяют. В то время как текущие генераторы синтетических данных предлагают многообещающую альтернативу, особенно для задач искусственного интеллекта воплощенного типа, они часто не соответствуют для задач компьютерного зрения из-за низкого качества ресурсов и рендеринга, ограниченного разнообразия и нереалистичных физических свойств. Мы представляем набор инструментов и ресурсов BEHAVIOR Vision Suite (BVS) для создания полностью настраиваемых синтетических данных для систематической оценки моделей компьютерного зрения, основанный на недавно разработанном эталоне искусственного интеллекта воплощенного типа, BEHAVIOR-1K. BVS поддерживает большое количество настраиваемых параметров на уровне сцены (например, освещение, размещение объектов), на уровне объекта (например, конфигурация соединений, атрибуты, такие как "заполненный" и "согнутый") и на уровне камеры (например, угол обзора, фокусное расстояние). Исследователи могут произвольно изменять эти параметры во время генерации данных для проведения контролируемых экспериментов. Мы продемонстрируем три примерных сценария применения: систематическая оценка устойчивости моделей на различных непрерывных осях сдвига домена, оценка моделей понимания сцены на одном и том же наборе изображений и обучение и оценка передачи симуляции в реальность для новой задачи компьютерного зрения: предсказание унарного и бинарного состояния. Веб-сайт проекта: https://behavior-vision-suite.github.io/
English
The systematic evaluation and understanding of computer vision models under varying conditions require large amounts of data with comprehensive and customized labels, which real-world vision datasets rarely satisfy. While current synthetic data generators offer a promising alternative, particularly for embodied AI tasks, they often fall short for computer vision tasks due to low asset and rendering quality, limited diversity, and unrealistic physical properties. We introduce the BEHAVIOR Vision Suite (BVS), a set of tools and assets to generate fully customized synthetic data for systematic evaluation of computer vision models, based on the newly developed embodied AI benchmark, BEHAVIOR-1K. BVS supports a large number of adjustable parameters at the scene level (e.g., lighting, object placement), the object level (e.g., joint configuration, attributes such as "filled" and "folded"), and the camera level (e.g., field of view, focal length). Researchers can arbitrarily vary these parameters during data generation to perform controlled experiments. We showcase three example application scenarios: systematically evaluating the robustness of models across different continuous axes of domain shift, evaluating scene understanding models on the same set of images, and training and evaluating simulation-to-real transfer for a novel vision task: unary and binary state prediction. Project website: https://behavior-vision-suite.github.io/

Summary

AI-Generated Summary

PDF130December 15, 2024