기본 콘텐츠로 건너뛰기

라벨이 마이크로소프트 LLM인 게시물 표시

[Microsoft사에서 최근에 공개했던 LLM 인 WizardLM2 에 대한 요약 및 Claude 3와 비교]

다음 내용은 최근에 Microsoft 에서 새롭게 공개한 LLM 인 WizardLM2 ( https://anakin.ai/blog/wizardlm-2-microsoft/ )  를 Claude 3 Opus 에 의해서 번역 요약 분석한 것입니다. —---------------------------------------- 마이크로소프트에서 새롭게 공개한 WizardLM 2는 대형 언어 모델 분야에서 획기적인 성과를 보여주고 있습니다. WizardLM 2는 복잡한 대화, 다국어 이해, 추론, 에이전트 기능 등에서 GPT-4를 비롯한 최신 경쟁 모델들을 능가하는 놀라운 성능을 자랑합니다. 이 그래프는 WizardLM-2 모델과 다양한 경쟁 모델들의 성능을 사람의 선호도 평가(Human Preferences Evaluation)를 통해 비교하고 있습니다. 먼저 WizardLM-2 8x22B 모델은 GPT-4-1106-preview와 근소한 차이로 뒤쳐졌지만, Command R Plus와 GPT4-0314 모델은 확실히 앞섰습니다. 이는 WizardLM-2 8x22B가 최신 GPT-4 모델에 근접한 성능을 보임을 의미합니다. WizardLM-2 70B 모델은 GPT4-0613, Mistral-Large, Qwen1.5-72B-Chat 등의 모델보다 우수한 것으로 나타났습니다. 70B급 모델 중에서는 최고 성능을 기록한 셈이죠. WizardLM-2 7B 모델은 Qwen1.5-32B-Chat과 비슷한 수준을 보였고, Qwen1.5-14B-Chat이나 Starling-LM-7B-beta보다는 확실히 앞섰습니다. 경량 모델 부문에서도 선전했다고 볼 수 있겠네요. 종합해보면 WizardLM-2 모델은 동급 최고 수준의 경쟁 모델들과 견주어도 손색없는 성능을 보여주었습니다. 특히 8x22B 모델은 최첨단 GPT-4에 도전장을 내밀 정도로 인상적인데요, 이는 WizardLM-2의 독자적인 학습 방법이 효과를 발휘한 결과로 보입니다. 다만 아쉬운 점은 원문에서 언급된 것처럼 이 평가에