생성형 AI 모델 (Gemini Advanced, Claude 3 Opus, GPT-4o) 데이터 분석 능력 비교
1930년부터 2014년까지의 월드컵 경기 데이터 (아래 시트) 를 3가지 생성형 AI 모델 (Claude AI, GPT-4o, Gemini Advanced)을 사용하여 분석하고, 그 결과를 비교 분석해보았습니다. 각 모델별로 스프레드시트 데이터를 어떻게 분석하고 시각화하여 월드컵 경기의 추세와 특징을 어떻게 설명을 하고 있는지 비교 평가 해보았습니다.
테스트용 스프레드시트 데이터는 1930년부터 2014년까지 월드컵 경기에 대한 데이터 (개최연도, 개최지, 승리국가, 준우승 국가, 평균 관중 수, 총 경기수, 골 수, 평균 골 수) 입니다.
월드컵 | 연도 | 개최지 | 승리국 | 준우승 | 평군관중 | 참가팀 | 경기수 | 골 스코어 | 평균 골수 |
1930 World Cup Uruguay | 1930 | Uruguay | Uruguay | Argentina | 32,808 | 13 | 18 | 70 | 3.9 |
1934 World Cup Italy | 1934 | Italy | Italy | Czechoslovakia | 21,353 | 16 | 17 | 70 | 4.1 |
1938 World Cup France | 1938 | France | Italy | Hungary | 20,872 | 15 | 18 | 84 | 4.7 |
1950 World Cup Brazil | 1950 | Brazil | Uruguay | Brazil | 47,511 | 13 | 22 | 88 | 4 |
1954 World Cup Switzerland | 1954 | Switzerland | Germany | Hungary | 29,562 | 16 | 26 | 140 | 5.4 |
1958 World Cup Sweden | 1958 | Sweden | Brazil | Sweden | 23,423 | 16 | 35 | 126 | 3.6 |
1962 World Cup Chile | 1962 | Chile | Brazil | Czechoslovakia | 27,912 | 16 | 32 | 89 | 2.8 |
1966 World Cup England | 1966 | England | England | Germany | 48,848 | 16 | 32 | 89 | 2.8 |
1970 World Cup Mexico | 1970 | Mexico | Brazil | Italy | 50,124 | 16 | 32 | 95 | 3 |
1974 World Cup Germany | 1974 | Germany | Germany | Netherlands | 49,099 | 16 | 38 | 97 | 2.6 |
1978 World Cup Argentina | 1978 | Argentina | Argentina | Netherlands | 40,679 | 16 | 38 | 102 | 2.7 |
1982 World Cup Spain | 1982 | Spain | Italy | Germany | 40,572 | 24 | 52 | 146 | 2.8 |
1986 World Cup Mexico | 1986 | Mexico | Argentina | Germany | 46,039 | 24 | 52 | 132 | 2.5 |
1990 World Cup Italy | 1990 | Italy | Germany | Argentina | 48,389 | 24 | 52 | 115 | 2.2 |
1994 World Cup United States | 1994 | United States | Brazil | Italy | 68,991 | 24 | 52 | 141 | 2.7 |
1998 World Cup France | 1998 | France | France | Brazil | 43,517 | 32 | 64 | 171 | 2.7 |
2002 World Cup Korea & Japan | 2002 | Korea & Japan | Brazil | Germany | 42,269 | 32 | 64 | 161 | 2.5 |
2006 World Cup Germany | 2006 | Germany | Italy | France | 52,491 | 32 | 64 | 147 | 2.3 |
2010 World Cup South Africa | 2010 | South Africa | Spain | Netherlands | 49,670 | 32 | 64 | 145 | 2.3 |
2014 World Cup Brazil | 2014 | Brazil | Germany | Argentina | 53,592 | 32 | 64 | 171 | 2.7 |
2018 World Cup Russia | 2018 | Russia | France | Croatia | 47,371 | 32 | 64 | 169 | 2.6 |
(** 이 통계는 https://en.wikipedia.org/wiki/FIFA_World_Cup 에서 발췌한 것입니다 **)
각 모델별 질문 “질문: 평균 관중수 추이 분석해주세요. 필요하면 차트도 그려서 설명” 에 대한 각 모델별 분석 결과 요약
- Claude AI: 표 형태로 데이터를 제시하고, 시대별 특징을 요약하는 텍스트 설명을 제공했습니다. 하지만 시각적인 자료가 없고, 설명이 다소 장황하다는 단점이 있었습니다.
- GPT-4o: 차트를 통해 연도별 평균 관중 수 변화를 시각적으로 보여주고, 간결한 텍스트 설명을 제공했습니다. 하지만 차트의 시각적인 요소가 부족하고, 1994년 이후 감소 추세에 대한 설명이 없었습니다.
- Gemini Advanced: Altair 라이브러리를 사용하여 인터랙티브한 시각화를 제공하고, 상세한 텍스트 설명과 함께 상관계수를 제시하여 통계적인 근거를 뒷받침했습니다.
종합 평가
세 가지 모델 중 Gemini Advanced가 가장 우수한 분석 결과를 제공했습니다. 시각적인 자료와 텍스트 설명의 조화, 구체적인 수치 언급, 분석 결과에 대한 근거 제시 등이 균형 있게 이루어져 사용자가 정보를 쉽게 이해하고 해석할 수 있도록 했습니다. 다만,
결론
이번 비교 분석을 통해 생성형 AI 모델이 월드컵 경기 데이터와 같은 스포츠 데이터 분석에 유용하게 활용될 수 있음을 확인했습니다. 특히, Gemini Advanced 모델은 뛰어난 분석 능력과 시각화 기능을 바탕으로 데이터에 대한 깊이 있는 이해를 돕는 결과를 제공했습니다.
여기서 한가지 놀라웠던 점은, Gemini Advanced 가 분석한 결과 내용중에는 2002년 한일 월드컵때에 관중수가 1994년 대비 거의 반토막 나고 1998년 보다 다소 감소한 결과에 대해서 다음과 같이 분석 설명을 했다는 사실에 놀라울 따름입니다.
‘다만, 2002년 한일 월드컵에서는 평균 관중 수가 다소 감소하는 모습을 보였는데, 이는 개최국의 지리적 위치나 경기 시간 등이 현지 관중의 참여에 영향을 미쳤을 수 있습니다.”
이 결과로 인하여 모든 스프레드시트 데이터 분석에서 Gemini Advanced 가 가장 우수한 것으로 일반화할 수는 없습니다. 단편적인 월드컵 경기 데이터만으로 평가한 결과임을 참고하여 주시기 바랍니다.
—---------------------------------------------------------------------------------------
Claude 3 Opus :
질문: 평균 관중수 추이 분석해주세요. 필요하면 차트도 그려서 설명
답변:
평균 관중수 추이를 분석해 보겠습니다. 데이터를 연도순으로 정렬하고, 평균 관중수의 변화를 살펴보면 다음과 같습니다.
이를 그래프로 나타내면 다음과 같습니다:
분석 결과:
- 1930년대부터 1950년대까지 평균 관중수는 2-3만 명 수준이었습니다.
- 1950년 브라질 월드컵에서 평균 관중수가 크게 증가한 후, 1960년대부터 1980년대 중반까지 4-5만 명 수준을 유지했습니다.
- 1994년 미국 월드컵에서 평균 관중수가 약 69,000명으로 크게 증가했지만, 이후 다시 4-5만 명 수준으로 감소했습니다.
- 2000년대 들어 평균 관중수는 소폭 증가하는 추세를 보이며, 2014년 브라질 월드컵에서는 약 53,600명을 기록했습니다.
전반적으로 평균 관중수는 1950년대 이후 꾸준히 증가해 왔으며, 1994년 미국 월드컵에서 정점을 찍은 후 다소 감소했지만, 최근 다시 증가 추세에 있습니다. 이는 월드컵의 인기와 규모가 지속적으로 성장해 왔음을 보여줍니다. 다만 개최국의 스타디움 규모, 경제 상황, 축구 인기도 등 다양한 요인에 따라 평균 관중수에는 등락이 있었던 것으로 보입니다.
GPT-4o
연도별 월드컵 평균 관중수 추이를 분석한 결과입니다. 아래 차트는 각 대회가 열린 연도에 따른 평균 관중수의 변화를 시각적으로 나타냅니다.
분석 결과 요약:
- 1930-1960년대: 초기 월드컵 대회에서는 평균 관중수가 비교적 낮았으나, 1950년 브라질 월드컵에서 관중수가 급증한 것을 볼 수 있습니다.
- 1970-1990년대: 이 시기 동안 평균 관중수는 지속적으로 증가했으며, 특히 1994년 미국 월드컵에서 가장 높은 관중수를 기록했습니다.
- 2000년대 이후: 최근 월드컵 대회에서도 여전히 높은 관중수를 유지하고 있으며, 2014년 브라질 월드컵과 2010년 남아프리카 공화국 월드컵에서도 많은 관중이 경기를 관람했습니다.
이러한 추이는 월드컵의 인기가 지속적으로 증가하고 있으며, 전 세계적으로 많은 팬들이 경기를 관람하러 온다는 것을 보여줍니다. 추가적으로 궁금한 사항이나 다른 분석이 필요하시면 말씀해 주세요.
—---------------------------------------------------------------------------------
Gemini Advanced (Gemini 1.5 Pro)
월드컵 개최 연도(Year)별 평균 관중 수(Average attendance)의 추이를 분석하고 시각화하여 보여드리겠습니다.
연도별 월드컵 평균 관중 수 추이를 나타내는 그래프를 보면, 대체로 시간이 지남에 따라 평균 관중 수가 증가하는 추세를 보입니다. 특히 1994년 미국 월드컵에서 크게 증가한 이후로 높은 수준을 유지하고 있습니다.
이는 월드컵이 전 세계적으로 인기를 얻으면서 더 많은 사람들이 경기장을 찾게 된 것으로 해석할 수 있습니다. 또한, 경기 수와 참가 팀 수의 증가 또한 평균 관중 수 증가에 영향을 미쳤을 가능성이 있습니다.
다만, 2002년 한일 월드컵에서는 평균 관중 수가 다소 감소하는 모습을 보였는데, 이는 개최국의 지리적 위치나 경기 시간 등이 현지 관중의 참여에 영향을 미쳤을 수 있습니다.
전반적으로 월드컵은 시간이 지남에 따라 더 많은 관중을 끌어모으는 스포츠 행사로 성장해왔으며, 이는 월드컵의 세계적인 인기와 위상을 반영한다고 볼 수 있습니다.
참고로 연도와 평균 관중 수 간의 상관계수는 0.708로, 비교적 강한 양의 상관관계를 나타냅니다. 즉, 연도가 증가함에 따라 평균 관중 수도 증가하는 경향이 통계적으로 유의미하다는 것을 의미합니다.
댓글
댓글 쓰기