최근 생성형 AI의 발전으로 멀티스텝 추론(Multi-step reasoning) 기능이 크게 향상되었습니다. 이에 따라 사용자가 프롬프트 엔지니어링 기법 중 하나인 CoT(Chain of Thought) 프롬프팅을 직접 적용하여 단계별로 질의를 할 필요성이 줄어들고 있습니다.
CoT 프롬프팅은 복잡한 문제를 해결할 때 단계별로 사고 과정을 거치도록 유도하는 기법입니다. 하지만 이를 위해서는 사용자가 CoT 프롬프팅 기법에 대해 잘 이해하고 있어야 하며, 문제를 단계별로 나누어 프롬프트를 직접 설계해야 합니다. 이는 일반 사용자에게는 다소 어려울 수 있습니다.
반면에 PP의 멀티스텝 추론 방식은 사용자가 복잡한 질문을 던지면, 시스템이 내부적으로 이를 하위 질문으로 분해하여 순차적으로 처리한 후 최종 답변을 제시합니다. 따라서 사용자는 CoT 프롬프팅 기법에 대한 전문 지식 없이도 자연스러운 질문만으로 원하는 답변을 얻을 수 있습니다.
즉, CoT 프롬프팅은 사용자의 적극적인 개입과 프롬프트 엔지니어링 능력을 요구하는 반면, PP의 멀티스텝 추론은 이 과정을 자동화하여 사용자 편의성을 대폭 향상시킵니다. 일반 사용자 입장에서는 PP와 같은 방식이 훨씬 더 직관적이고 접근성이 높다고 할 수 있겠습니다.
(Perplexity Pro 멀티 스텝 추론 검색의 예)
Chain of Thought(CoT) 프롬프팅과 멀티스텝 추론의 중요성
Chain of Thought(CoT) 프롬프팅과 멀티스텝 추론은 대규모 언어 모델(LLM)의 추론 능력을 향상시키는 데 중요한 역할을 합니다.
CoT 프롬프팅은 LLM이 복잡한 문제를 중간 단계로 분해하여 추가적인 계산을 수행할 수 있도록 돕습니다. 이는 산술, 상식, 추론 작업 등 다양한 분야에서 LLM의 성능을 높이는 데 효과적입니다. 특히 전통적인 방법으로는 계산하기 어려운 복잡한 문제에 좋은 접근 방식이 됩니다.
멀티스텝 추론은 CoT의 핵심 개념을 실제 문제 해결에 적용하여, 직관적인 사고 과정을 모방하는 것에 초점을 둡니다. 구글 검색에 도입된 멀티스텝 추론 기능은 여러 단계나 하위 쿼리가 포함된 복잡한 질문을 이해하고 처리할 수 있게 해줍니다. 이는 사용자가 한 번의 검색으로 원하는 정보를 얻을 수 있도록 도와 사용자 경험을 개선합니다.
CoT 프롬프팅과 멀티스텝 추론의 차이점
CoT 프롬프팅은 LLM의 추론 능력 자체를 향상시키는 방법론적인 접근인 반면, 멀티스텝 추론은 이를 실제 서비스에 적용하여 사용자 질의를 처리하는 응용 기술이라는 점에서 차이가 있습니다.
CoT는 few-shot 프롬프팅, self-consistency 프롬프팅, zero-shot CoT 등 다양한 기법을 통해 LLM의 추론 성능을 높이는 데 주력합니다. 반면 멀티스텝 추론은 CoT로 강화된 LLM을 활용하여 복잡한 사용자 질의를 이해하고, 여러 하위 질문으로 분해한 뒤 순차적으로 처리하여 최종 답변을 제시하는 데 초점을 둡니다.
따라서 CoT는 LLM의 내재된 추론 능력을 향상시키는 기반 기술이며, 멀티스텝 추론은 이를 실제 서비스에 활용하는 응용 기술이라고 할 수 있습니다. 두 가지 모두 인공지능 시스템이 인간과 유사한 사고 과정을 통해 문제를 해결할 수 있도록 하는 데 기여하고 있습니다.
Chain of Thought(CoT) 프롬프팅과 멀티스텝 추론의 차이점 예시
기업의 실제 업무에서 CoT 프롬프팅과 멀티스텝 추론이 어떻게 활용될 수 있는지 마케팅 전략 수립 과정을 통해 살펴보겠습니다.
시나리오: A 기업은 신제품 출시를 앞두고 효과적인 마케팅 전략을 수립하려 합니다.
CoT 프롬프팅 적용 예시
CoT 프롬프팅은 전략 수립 과정을 단계별로 안내하여 체계적인 접근을 유도합니다.
프롬프트:
“신제품 마케팅 전략을 수립하기 위한 단계별 과정을 생각해봅시다.”
- 타겟 고객 선정: 제품의 주요 타겟 고객층을 명확히 정의합니다. 연령, 성별, 관심사, 구매력 등을 고려하여 세분화된 고객 페르소나를 만듭니다.
- 경쟁 제품 분석: 시장에서 경쟁 제품의 강점과 약점을 파악합니다. 경쟁사의 마케팅 전략, 가격 정책, 고객 반응 등을 면밀히 분석합니다.
- 차별화 포인트 도출: 자사 제품만의 독특한 특징과 장점을 찾아냅니다. 경쟁 제품과 비교했을 때 두드러지는 차별화 요소를 중심으로 마케팅 메시지를 구성합니다.
- 마케팅 채널 선택: 타겟 고객층이 자주 이용하는 매체와 플랫폼을 선택합니다. 소셜 미디어, 온라인 광고, 오프라인 이벤트 등 다양한 채널을 검토하고 최적의 조합을 만듭니다.
- 예산 및 일정 계획 수립: 마케팅 활동에 필요한 예산을 산정하고 단계별 일정을 계획합니다. 제품 출시일을 고려하여 사전 홍보, 런칭 이벤트, 사후 관리 등의 세부 일정을 수립합니다.
이렇게 단계별로 생각해보면 체계적인 마케팅 전략을 수립할 수 있습니다.
멀티스텝 추론 적용 예시
멀티스텝 추론은 마케팅 전략 수립 과정에서 발생하는 복잡한 질문을 하위 질문으로 분해하여 순차적으로 해결합니다.
질문: A 기업이 신제품 마케팅 전략을 수립하려 합니다. 가장 효과적인 방법은 무엇일까요?
- 하위 질문 1: 신제품의 주요 타겟 고객층은 누구인가요?
- 모델 출력: 신제품의 특성과 가격대를 고려할 때, 주요 타겟 고객층은 20-30대 직장인으로 설정하는 것이 적절해 보입니다. 이들은 트렌드에 민감하고 새로운 제품에 대한 관심이 높은 편입니다.
- 하위 질문 2: 경쟁 제품 대비 신제품만의 차별화 포인트는 무엇인가요?
- 모델 출력: 경쟁 제품 분석 결과, A 기업의 신제품은 혁신적인 기술을 적용하여 사용 편의성과 성능이 크게 향상되었습니다. 이를 마케팅 메시지로 적극 활용한다면 경쟁력을 높일 수 있을 것입니다.
- 하위 질문 3: 마케팅 채널로는 어떤 것이 효과적일까요?
- 모델 출력: 20-30대 직장인이 주로 이용하는 소셜 미디어 플랫폼과 온라인 광고를 중심으로 마케팅 채널을 구성하는 것이 좋겠습니다. 인플루언서와의 협업, 바이럴 영상 제작 등을 통해 신제품에 대한 관심과 화제성을 높일 수 있습니다.
- 하위 질문 4: 마케팅 예산과 일정은 어떻게 계획하는 것이 좋을까요?
- 모델 출력: 신제품의 중요성을 고려하여 마케팅 예산을 전년 대비 20% 증액하는 것이 필요해 보입니다. 제품 출시 1개월 전부터 사전 홍보를 시작하고, 출시 직후에는 집중적인 프로모션을 진행하는 것이 효과적일 것입니다. 출시 후 3개월 동안은 고객 반응을 모니터링하며 추가 마케팅 활동을 전개해야 합니다.
이처럼 CoT 프롬프팅은 마케팅 전략 수립 과정 전반을 체계적으로 안내하는 반면, 멀티스텝 추론은 세부 질문을 순차적으로 해결하며 구체적인 방향성을 제시합니다. 두 방식 모두 기업의 의사결정을 지원하고 효과적인 전략 수립에 기여할 수 있습니다.
CoT 프롬프팅에서는 사용자가 문제 해결을 위한 단계를 직접 명시하고, 각 단계에 대한 프롬프트를 제공하여 모델이 그에 따라 답변을 생성하도록 유도합니다. 즉, 사용자가 문제 해결 과정을 세분화하고 주도하는 방식입니다.
반면에 멀티스텝 추론에서는 사용자가 포괄적인 질문을 던지면, PP와 같은 시스템이 해당 질문을 분석하여 자동으로 하위 질문을 생성합니다. 그리고 각 하위 질문에 대한 답변을 순차적으로 도출한 후, 이를 종합하여 최종 결과를 제시합니다. 이 경우, 사용자는 복잡한 문제를 단순화된 형태로 질문할 수 있고, 시스템이 문제 해결 과정을 자동으로 처리하게 됩니다.
따라서 CoT 프롬프팅은 사용자의 적극적인 개입과 통제가 필요한 반면, 멀티스텝 추론은 사용자 편의성을 높이고 시스템의 자동화된 문제 해결 능력을 강조한다고 볼 수 있습니다.
생성형 AI의 멀티스텝 추론 기능 향상
생성형 AI는 점점 더 복잡한 질문에 대해서도 체계적인 추론 과정을 거쳐 답변을 생성할 수 있게 되었습니다. 예를 들어 Perplexity의 'Pro Search' 기능은 복잡한 질의에 대해 단계별 추론을 통해 정확하고 심도 있는 답변을 제공합니다. 질문의 난이도를 파악하고 세부 목표를 설정한 뒤, 순차적으로 정보를 수집 및 분석하여 종합적인 답변을 도출하는 방식입니다.
CoT 프롬프팅의 필요성 감소
CoT 프롬프팅은 복잡한 문제를 단계별로 나누어 질의하는 방식으로, AI가 순차적 추론을 통해 답변을 도출하도록 돕는 기법입니다. 하지만 Perplexity와 같은 최신 생성형 AI들은 사용자가 CoT 프롬프팅을 직접 적용하지 않아도 멀티스텝 추론이 가능해졌기에, 점차 CoT 프롬프팅의 필요성이 줄어들고 있습니다.
물론 아직 생성형 AI의 추론 능력이 인간 수준에는 미치지 못하므로, 경우에 따라 CoT 프롬프팅을 활용하는 것이 도움이 될 수 있습니다. 특히 매우 전문적이고 복잡한 문제를 다룰 때는 CoT 프롬프팅으로 질의를 세분화하는 것이 정확도를 높일 수 있습니다.
결론
생성형 AI의 멀티스텝 추론 기능이 고도화됨에 따라 일반적인 질의에서는 CoT 프롬프팅 없이도 충분한 성능을 기대할 수 있게 되었습니다. 다만 고난도의 전문 분야 질문에 대해서는 CoT 프롬프팅을 적절히 활용하는 것이 바람직해 보입니다. 앞으로도 생성형 AI 기술은 계속 발전할 것이므로, 상황에 맞게 프롬프트 엔지니어링 기법을 선택적으로 사용하는 유연한 자세가 필요할 것 같습니다.
멀티스텝 추론(multi-step reasoning) 은 복잡한 질문에 대해 여러 단계의 추론을 통해 정답을 찾아내는 AI 기술이다. 전통적인 검색 엔진은 키워드 매칭을 통해 관련 문서를 찾아주지만, 복잡한 질문의 경우 단순 키워드 검색만으로는 정확한 답을 찾기 어렵다[1]. 이를 해결하기 위해 AI 기반의 멀티스텝 추론 기술이 개발되었다.
멀티스텝 추론은 자연어 질의를 이해하고, 이를 해결하기 위해 필요한 정보를 단계적으로 찾아가는 과정을 거친다. 예를 들어 "아이슬란드와 핀란드에서 오로라를 보기 좋은 시기와 장소는 언제 어디인가?"라는 질문에 답하기 위해서는 오로라 발생 시기, 관측 포인트, 기상 조건 등 다양한 정보를 종합해야 한다. 멀티스텝 추론 모델은 이런 복합적인 질의에 대해 체계적으로 정보를 수집하고 추론하는 것이 가능하다[5].
구글과 퍼플렉서티 프로 서치(이하 PP)는 멀티스텝 추론 기술을 각기 다른 방식으로 적용하고 있다. 구글의 경우 자사의 방대한 검색 데이터와 나우리지 그래프를 활용한 추론에 집중하는 반면, PP는 외부 정보원을 폭넓게 활용하는 것이 특징이다. 예컨대 PP의 경우 수학 문제 풀이를 위해 울프럼 알파 엔진과 연동하는 등 다양한 외부 리소스와 협업한다[4]. 반면 구글은 자체 데이터에 최적화된 멀티스텝 추론에 강점이 있다.
한편 최근에는 ChatGPT 등 생성형 AI에도 멀티스텝 추론 기술이 적용되고 있다. 생성형 AI는 방대한 학습 데이터를 바탕으로 사용자 질의에 대해 문장을 생성하는데, 복잡한 질문에 답하기 위해서는 멀티스텝 추론이 필수적이다. 실제로 ChatGPT에 "양자 컴퓨터의 원리와 한계에 대해 설명해 달라"고 요청하면, 양자 컴퓨터의 개념부터 큐비트, 양자 얽힘 등 핵심 개념을 단계적으로 설명한 후 한계점을 지적하는 식으로 답변을 생성한다. 이는 대화형 AI가 단순한 패턴 매칭이 아닌 인과관계 추론이 가능함을 보여준다.
멀티스텝 추론 기술은 아직 초기 단계지만, 향후 검색 및 AI 기술 발전에 중요한 역할을 할 것으로 기대된다. 단순 정보 검색을 넘어 사용자의 의도를 파악하고 맥락에 맞는 답변을 제시하는 것은 궁극적인 목표다. 이를 위해 자연어 이해, 지식 표현, 추론 기술 등이 종합적으로 발전해야 할 것이다. 아울러 멀티스텝 추론의 과정을 설명 가능한 형태로 제시함으로써 AI에 대한 신뢰도를 높이는 것도 중요한 과제다. 멀티스텝 추론은 미래 AI가 나아가야 할 방향을 제시하는 중요한 이정표가 될 것이다.
Citations:
[1] https://aclanthology.org/2020.emnlp-main.245.pdf
[2] https://www.perplexity.ai/hub/blog/introducing-pplx-api
[3] https://www.perplexity.ai/hub/blog/pro-search-upgraded-for-more-advanced-problem-solving
[4] https://www.androidauthority.com/perplexity-pro-search-upgrade-3456870/
강연/교육 요청:
생성형AI (ChatGPT, Claude AI, Perpelexity AI, Genspark AI) 비즈니스 활용, 글쓰기
연락처:hsikchoi@gmail.com, T:010-8408-2363
댓글
댓글 쓰기