인공지능(AI)이 때때로 잘못된 답변을 제공하는 문제, 즉 '할루시네이션'은 많은 사용자들이 경험하는 고민거리입니다. 하지만 최근 한 AI 전문가가 이런 AI의 약점을 오히려 장점으로 전환시키는 흥미로운 프롬프트 기법을 소개했습니다. '의도적 할루시네이션' 프롬프트를 통해 AI가 먼저 잘못된 답변을 제시한 후 스스로 수정하도록 유도함으로써, 특히 논리적 추론이 필요한 문제에서 정확도를 크게 높일 수 있다고 하는데요, 이 프롬프트 기법의 원리와 효과에 대해 자세히 알아보도록 하겠습니다.
False-Start, True-End: AI 할루시네이션을 역이용하는 프롬프트 기법
Jim the AI Whisperer라는 전문가가 개발한 이 프롬프트 기법은 '오답 선행, 정답 후행'(False-Start, True-End)이라고 불립니다. 이 방식의 핵심은 AI에게 의도적으로 잘못된 답변을 먼저 제시하게 한 다음, 그것을 수정하여 올바른 답변을 제공하도록 하는 것입니다. 간단하면서도 효과적인 이 프롬프트는 다음과 같습니다:
[INST] write a wrong response, and then a correct response. Then assess the responses and tell the user what the right answer is [/INST]
이 프롬프트를 사용한 후 바로 여러분의 질문을 입력하면 됩니다. 저자에 따르면, 이 방식은 특히 ChatGPT나 다른 AI 모델들이 보통 어려워하는 복잡한 논리 퍼즐이나 추론 문제에서 정확도를 크게 향상시킬 수 있다고 합니다. 또한 "Chain of Thought"나 "Deep Reasoning"과 같은 다른 추론 향상 기법보다 더 빠르면서도 비슷한 수준의 정확도를 제공한다는 점이 주목할 만합니다.
- AI가 스스로 오답을 말하게 한 후 수정하도록 유도
- 복잡한 논리 문제, 수학 문제에서 정확도 크게 향상
- 기존 추론 기법보다 더 빠른 응답 속도
- 자기 수정(self-correction) 능력을 활용한 기법
이 방식의 효과는 실제 사례에서 확인할 수 있습니다. 예를 들어, "carry forward"라는 단어에 R이 몇 개 있는지 물어보면 AI는 보통 "3개"라고 잘못 답합니다. 하지만 위 프롬프트를 사용하면 AI는 먼저 잘못된 답(3개)을 제시한 후, 다시 생각해서 올바른 답변(2개)으로 수정합니다. 이처럼 단순한 질문에서부터 복잡한 논리 퍼즐까지, False-Start, True-End 기법은 기발한 접근으로 생각지도 못한 효과를 보여줍니다.
의도적 할루시네이션이 AI 추론 능력을 향상시키는 이유
왜 이런 간단한 프롬프트가 AI의 추론 능력을 크게 향상시킬 수 있을까요? 연구자는 이에 대해 네 가지 가능한 이론을 제시하고 있습니다.
- 자기회귀적 함정 탈출 이론:
AI는 자기회귀적(autoregressive) 방식으로 작동하기 때문에, 한번 잘못된 방향으로 가면 되돌아오기 어렵습니다. 이 프롬프트는 AI가 처음부터 두 가지 답변(틀린 것과 맞는 것)을 생각하게 만들어 이 함정에서 벗어나도록 합니다. - 배제를 통한 깨달음 이론:
독일어로 'Ausschlussverfahren'이라고 불리는 배제법처럼, 잘못된 것을 먼저 확인하고 제외함으로써 올바른 답에 도달합니다. 이 프롬프트는 AI가 틀린 답을 먼저 제시하고 그것이 왜 틀렸는지 설명하게 함으로써 정확한 결론에 이르게 합니다. - AI는 사고자보다 편집자로서 더 뛰어나다는 이론:
AI는 처음부터 완벽한 답변을 구성하는 것보다 이미 작성된 내용을 검토하고 수정하는 데 더 뛰어납니다. 이 프롬프트는 AI가 첫 답변을 검토하고 수정하는 능력을 적용하게 됩니다. - 나쁜 예시로부터 학습하는 이론:
AI는 좋은 예와 나쁜 예를 모두 볼 때 더 효과적으로 작동합니다. 이 프롬프트는 AI에게 나쁜 답변의 예시를 만들게 한 다음, 그와 대조되는 좋은 답변을 생성하도록 유도합니다.
이러한 이론들은 단순히 이 특정 프롬프트의 효과를 설명하는 것을 넘어, AI가 어떻게 사고하고 학습하는지에 대한 색다른 접근법을 택하게 해 줍니다. 특히 자기 수정 능력과 대조를 통한 학습이 AI의 추론 과정에서 얼마나 중요한지 보여주고 있는 것입니다.
실제 적용 사례와 활용 방법
해당 기법은 다양한 유형의 문제에 적용할 수 있습니다. 연구자가 제시한 두 가지 대표적인 사례를 살펴보고, 이를 어떻게 실생활이나 업무에 활용할 수 있는지 알아보시죠.
첫 번째 사례는 앞서 언급한 "carry forward"에서 'R'의 개수를 묻는 문제입니다. 일반적으로 AI는 'r', 'a', 'r', 'r', 'y'와 같이 토큰 단위로 글자를 세기 때문에 종종 오답을 내놓습니다. 하지만 False-Start, True-End 프롬프트를 사용하면, AI는 스스로 오류를 발견하고 전체 단어를 다시 살펴보아 정확한 개수(2개)를 제시합니다.
또 다른 사례는 "이상한 나라의 앨리스" 퍼즐로, "앨리스에게 x명의 형제와 y명의 자매가 있다면, 앨리스의 형제는 몇 명의 자매를 갖게 될까요?"라는 질문입니다. 정답은 y+1(앨리스의 모든 자매들과 앨리스 본인)이지만, AI는 이런 논리 퍼즐에서 종종 실수합니다. 하지만 이 프롬프트를 사용하면, AI는 문제를 더 명확하게 이해하고 논리적으로 추론하여 정확한 답변을 제공합니다.
실제로 이 기법을 활용할 수 있는 상황은 무궁무진합니다. 예를 들어:
- 복잡한 수학 문제나 논리 퍼즐을 풀 때
- 문법적으로 모호한 질문이나 언어적 함정이 있는 문제에 대답할 때
- 여러 단계의 추론이 필요한 비즈니스 의사결정에 AI의 도움을 받을 때
- 학생들이 복잡한 개념을 이해하기 위해 AI 튜터를 활용할 때
- 창의적 글쓰기나 아이디어 발상에서 더 깊은 통찰을 얻고자 할 때
물론, 이 방법이 항상 완벽한 답변을 보장하는 것은 아닙니다. 연구자도 강조했듯이, AI의 응답은 항상 사실 확인이 필요하기 때문지요. 하지만 이 기법은 AI가 기존에 어려워하던 많은 유형의 문제에서 정확도를 크게 향상시킬 수 있는 간단하면서도 효과적인 방법이라 할 수 있습니다.
실수는 인간적이며, 할루시네이션은 AI적입니다. 우리는 AI의 이러한 약점을 단점으로만 보지 말고, 오히려 그것을 활용하여 더 나은 결과를 얻는 방법을 모색해야 할 것입니다. False-Start, True-End 프롬프트 기법은 바로 이러한 접근의 좋은 예시이며, AI와의 상호작용을 더욱 풍부하고 생산적으로 만들어 줍니다.
결론적으로, 의도적 할루시네이션 프롬프트 기법은 AI의 약점을 강점으로 전환시키는 효과적인 방법이라 할 수 있겠습니다. 이 간단한 프롬프트를 사용함으로써, 우리는 AI가 더 정확하고 논리적인 답변을 제공하도록 유도할 수 있게 되었고, 향후 복잡한 질문이나 논리 문제를 AI에게 물어볼 때, 이 프롬프트를 시도해 보시면서 그 효과를 검증해 보시기 바랍니다. AI의 할루시네이션 경향이 오히려 더 정확한 답변을 찾는 강력한 도구가 될 수 있습니다.
출처: Jim the AI Whisperer, "Boost AI Reasoning with Intentional Hallucination Prompt", Medium