Является ли GPT-4 хорошим аналитиком данных?
Is GPT-4 a Good Data Analyst?
May 24, 2023
Авторы: Liying Cheng, Xingxuan Li, Lidong Bing
cs.AI
Аннотация
Поскольку крупные языковые модели (LLM) продемонстрировали свои мощные возможности в различных областях и задачах, включая понимание контекста, генерацию кода, создание текста, визуализацию данных и т.д., многие аналитики данных могут задаваться вопросом, будут ли их работы заменены искусственным интеллектом. Эта спорная тема привлекла значительное внимание общественности. Однако мы все еще находимся на этапе расхождения мнений без какого-либо окончательного вывода. Вдохновленные этим, мы ставим исследовательский вопрос: «Является ли GPT-4 хорошим аналитиком данных?» — и стремимся ответить на него, проводя сравнительные исследования. В частности, мы рассматриваем GPT-4 как аналитика данных, выполняющего сквозной анализ данных с использованием баз данных из различных областей. Мы предлагаем подход к решению проблем, тщательно разрабатывая промты для GPT-4 для проведения экспериментов. Также мы разрабатываем несколько специфических метрик оценки для систематического сравнения производительности нескольких профессиональных аналитиков данных и GPT-4. Результаты экспериментов показывают, что GPT-4 может достичь сопоставимой с людьми производительности. Мы также предоставляем подробное обсуждение наших результатов, чтобы пролить свет на дальнейшие исследования, прежде чем прийти к выводу, что GPT-4 может заменить аналитиков данных.
English
As large language models (LLMs) have demonstrated their powerful capabilities
in plenty of domains and tasks, including context understanding, code
generation, language generation, data storytelling, etc., many data analysts
may raise concerns if their jobs will be replaced by AI. This controversial
topic has drawn a lot of attention in public. However, we are still at a stage
of divergent opinions without any definitive conclusion. Motivated by this, we
raise the research question of "is GPT-4 a good data analyst?" in this work and
aim to answer it by conducting head-to-head comparative studies. In detail, we
regard GPT-4 as a data analyst to perform end-to-end data analysis with
databases from a wide range of domains. We propose a framework to tackle the
problems by carefully designing the prompts for GPT-4 to conduct experiments.
We also design several task-specific evaluation metrics to systematically
compare the performance between several professional human data analysts and
GPT-4. Experimental results show that GPT-4 can achieve comparable performance
to humans. We also provide in-depth discussions about our results to shed light
on further studies before we reach the conclusion that GPT-4 can replace data
analysts.