인터넷에는 매일 엄청난 양의 정보가 쏟아지고 있습니다. 그중에는 유용한 정보도 있지만, 장난스러운 농담이나 심지어 의도적인 허위 정보도 섞여 있죠. 이런 복잡한 디지털 환경에서 진실과 거짓을 구분하는 것은 점점 더 어려워지고 있습니다. 게다가 생성형 AI의 등장으로 인해 진짜인지 가짜인지 구분이 되지 않는 기사나 이미지, 동영상들일 기하급수적으로 늘어나고 있는 상황입니다. 며칠 전 Medium에서 재미있는 글을 읽었는데요, 만우절 관련된 경험을 통해 전통적인 검색 엔진과 새로운 생성형 AI기반 검색 엔진의 중요한 차이점에 대한 내용을 다루고 있었서 소개하고자 합니다.
농담을 진지하게 받아들인 구글의 사례
저자에 따르면, 4월 2일 구글을 스크롤하던 중 존스 홉킨스 뉴스레터에서 발행한 "존스 홉킨스가 2026년에 아이비리그에 가입한다"는 기사를 발견했다고 하네요. 자신의 모교가 명문 아이비리그에 합류한다는 소식에 처음에는 기쁘게 받아들였지만, 자세히 살펴보니 이는 4월 1일 만우절을 맞아 출간된 장난 기사였다고 합니다.
그런데 흥미로운 점은 구글이 이 가짜 뉴스를 저자의 피드에 진짜 뉴스처럼 노출시켰다는 것이죠. 더 놀라운 것은 "존스 홉킨스 아이비리그" 또는 단순히 "존스 홉킨스 뉴스"를 검색해도 이 장난 기사가 구글 검색 결과 최상단에 표시되었다는 사실입니다. 심지어 다른 매체들이 이 내용을 인용한 기사들과 레딧 게시물까지 검색 결과에 나타났다고 하네요. 이 정도 되면 문제가 장난을 좀 넘어섰다고도 볼 수 있겠습니다.
저자는 이런 현상이 발생하는 이유를 구글의 작동 방식에서 찾고 있었습니다. 구글은 사이트의 평판, 링크 수, 사용자 상호작용 등을 기준으로 웹 콘텐츠를 처리하는데요, 신뢰할 수 있는 사이트에서 진짜처럼 보이는 기사를 게시하고 많은 사람들이 그 기사를 클릭한다면, 구글은 그 내용이 사실이라고 판단하는 경향이 있습니다. 하지만 이번에는 구글이 명백히 틀렸습니다. 구글은 실제로 기사를 읽고 이해하지 않기 때문에, 그 내용이 풍자라는 것을 알아채지 못한 것이죠.
ChatGPT는 농담을 이해했다
반면, 저자가 ChatGPT 검색 기능을 통해 "존스 홉킨스 뉴스"를 검색했을 때는 가짜 기사가 전혀 나타나지 않았다고 합니다. 구체적으로 "존스 홉킨스가 아이비리그에 가입하나요?"라고 물었더니, ChatGPT는 명확하고 정확한 답변을 제공했다고 밝혔습니다.
"이는 4월 1일 만우절을 맞아 존스 홉킨스 뉴스레터에서 발행한 풍자 기사입니다. 실제로 존스 홉킨스는 아이비리그에 가입하지 않으며, 이는 단지 유머러스한 장난 기사입니다."
ChatGPT가 이 농담을 알아차릴 수 있었던 이유는 무엇일까요? 저자의 설명에 따르면, ChatGPT는 단순히 링크와 도메인 신뢰도를 기반으로 결과를 제시하는 것이 아니라, 실제로 기사를 읽고 이해했기 때문입니다. 즉, 기사 내용을 단순히 재생산하는 것이 아니라 그 맥락을 파악하고 의미를 이해했기 때문에 이런 판별이 가능하는 것입니다.
생성형 검색과 전통적 검색의 근본적 차이
저자는 이 사례가 비록 단순하고 무해한 오보 사례였지만, 생성형 검색 엔진의 중요한 부분을 잘 보여준 경우라고 역설합니다. ChatGPT Search나 Perplexity와 같은 생성형 검색 엔진은 단순히 콘텐츠를 색인화하고 표시하는 것이 아니라, 그 내용을 실제로 읽고 이해합니다. 또한 이러한 시스템은 존스 홉킨스가 매년 이런 유형의 장난 기사를 발행한다는 배경 지식도 갖고 있어, 풍자 기사를 더 넓은 맥락에서 이해하고 그것이 농담이라는 것을 인식할 수 있어, 단순 검색 이상의 결과물을 제공하는 것입니다.
이 차이는 우리가 매일같이 활용하는 정보 검색 행위에 또다른 관점을 갖도록 해줍니다. 구글과 같은 전통적 검색 엔진을 사용할 때는 가짜 뉴스인지 진짜 뉴스인지 알아보려면 독자 스스로가 고민하고 판단해야 하지만, AI 검색 엔진은 그런 부분을 AI가 알아서 분석하고, 정보의 맥락과 신뢰성을 평가해 준다는 이야기이기 때문이죠.
저자는 이로 인해 생성형 검색 엔진이 전통적인 검색 엔진보다 콘텐츠 스팸, 불량 SEO 기법에 의한 조작, 실생활의 허위 정보에 더 강한 저항력을 갖게 된다고 주장합니다. 즉, 생성형 검색은 현대 인터넷이 빠르게 변해가는 혼란스러운 정보의 바다에서 진정으로 유용한 정보를 찾아내는 데 더 뛰어난 능력을 보여주고 있다는 믿게된 것입니다.
생성형 AI 검색과 전통적 검색의 주요 차이점
앞서 저자가 설명한 사례를 통해 알 수 있듯이, 생성형 AI 검색 엔진과 전통적인 검색 엔진 사이에는 몇 가지 근본적인 차이점이 있습니다:
1. 콘텐츠 이해 방식
- 전통적 검색 엔진: 키워드 일치, 링크 수, 도메인 권위 등의 외부 신호에 의존합니다.
- 생성형 AI 검색: 실제로 콘텐츠를 읽고 문맥을 이해하며 의미론적 관계를 파악합니다.
2. 정보 처리 깊이
- 전통적 검색 엔진: 콘텐츠를 색인화하고 관련성에 따라 순위를 매깁니다.
- 생성형 AI 검색: 콘텐츠를 분석하고, 맥락을 파악하며, 배경 지식과 연결하여 정보의 신뢰성을 평가합니다.
3. 결과 제시 방식
- 전통적 검색 엔진: 관련 링크 목록을 제공하며, 사용자가 직접 각 결과를 평가해야 합니다.
- 생성형 AI 검색: 다양한 소스에서 정보를 종합하고 분석하여 직접적인 응답을 제공합니다.
4. 허위 정보 대응
- 전통적 검색 엔진: 기본적으로 인기도와 링크 수에 의존하므로 널리 공유된 가짜 뉴스에 취약합니다.
- 생성형 AI 검색: 콘텐츠 내용을 직접 이해하므로 풍자, 농담, 허위 정보를 더 잘 식별할 수 있습니다.
5. 사용자 경험
- 전통적 검색 엔진: 사용자가 여러 결과를 직접 탐색하고 정보의 진위를 판단해야 합니다.
- 생성형 AI 검색: 보다 직접적인 답변을 제공하며, 정보의 맥락과 신뢰성에 대한 평가를 도와줍니다.
미래는 생성형 검색으로 향하고 있다
저자는 해당 경험을 통해 생성형 AI 검색이 어쩌면 검색의 미래라는 확신을 갖게 되었다고 합니다. 구글도 최근 AI 모드를 통해 검색 페이지 상단에 생성형 경험을 제공하는 것 또한 이런 추세를 반영하는, 즉 "이길 수 없다면 합류하라" 접근법으로 볼 수 있죠. 이전에는 저도 회의적이었고, 저자 역시 회의적이었지만, 이제 "생성형 검색이 미래다. 우리 모두 이러한 현실에 맞춰 우리의 사이트와 콘텐츠를 준비해야 한다"고 주장하게 되었습니다.
결론: AI가 정보 소비 방식을 변화시키고 있다
인터넷 정보의 홍수 속에서 진실과 거짓을 구분하는 것은 점점 더 중요한 과제가 되고 있습니다. 전통적인 검색 엔진이 여전히 유용하지만, 생성형 AI 검색 엔진의 등장은 우리가 정보를 찾고, 평가하고, 소비하는 방식에 가져오는 근본적인 거대한 흐름을 거스를 수 없게 되었기 때문입니다.
이제 사용자들은 단순히 키워드를 입력하는 것을 넘어, 보다 자연스러운 대화 방식으로 질문을 던지고, AI가 다양한 소스에서 정보를 수집하고 분석하여 맥락화된 답변을 제공받을 수 있게 되었습니다. 이러한 변화는 정보의 정확성과 신뢰성을 높이는 데 도움이 될 뿐만 아니라, 사용자 경험 자체를 더욱 효율적이고 풍부하게 만들어주고 있습니다. 당연히 앞으로 우리가 디지털 정보를 탐색하는 방식은 계속해서 진화할 것입니다. 그리고 그 핵심에는 단순히 키워드가 아닌 의미와 맥락을 이해하는 AI의 능력이 자리 잡게 되는 변화가 어느새 문 앞에 당도한 느낌입니다.
출처: Thomas Smith, "ChatGPT Just Showed Me Why Generative Search is the Future"