추천과 생성이 자꾸 실패하는 진짜 이유

이번 내용은 기존 추천 시스템과 생성형 AI가 왜 계속 비슷한 한계에 부딪히는지를 구조적으로 풀어보는 이야기입니다. 기술이 부족해서가 아니라, 애초에 문제를 바라보는 관점 자체가 어긋나 있었기 때문이라는 점을 설명하는 내용입니다.

요즘의 추천 시스템과 생성형 AI는 데이터도 충분하고 모델도 강력합니다. 그럼에도 불구하고 사용자 경험은 쉽게 좋아지지 않습니다. 추천은 점점 뻔해지고, 생성물은 넘쳐나며, 사용자는 시스템을 신뢰하지 않게 됩니다. 이는 운영이나 튜닝의 문제가 아니라 구조적인 결과입니다.


추천과 생성은 사실 같은 문제

이번 내용에서 가장 먼저 짚고 싶은 점은 추천과 생성이 전혀 다른 문제가 아니라는 사실입니다. 추천은 다음에 무엇을 보여줄지를 결정하는 기술이고, 생성은 무엇을 만들어 보여줄지를 결정하는 기술입니다. 겉보기에는 다르지만, 두 시스템은 모두 과거의 입력이나 행동을 바탕으로 미래의 반응을 유도하려는 구조를 가지고 있습니다.

문제는 대부분의 시스템이 이 과정을 사람의 상태 변화가 아니라, 즉각적인 반응의 확률 문제로 다뤄왔다는 점입니다. 클릭할 확률, 머무를 확률, 반응할 확률이 판단 기준이 됩니다. 이 방식은 단기 성과를 빠르게 끌어올리는 데에는 효과적입니다. 그러나 시간이 지나면 시스템은 점점 스스로를 망가뜨리기 시작합니다.


반응은 잘 맞히는데, 경험은 나빠지는 이유

이번 내용의 핵심은 여기입니다. 기존 시스템은 반응을 잘 맞히는 데는 성공했지만, 경험을 설계하는 데는 실패했습니다. 클릭률과 체류 시간은 좋아지는데, 사용자는 점점 피로해집니다. 콘텐츠는 많아지는데, 신뢰는 떨어집니다.

이는 우연이 아닙니다. 시스템이 사람을 상태를 가진 존재가 아니라, 반응을 만들어내는 객체로 취급해 왔기 때문입니다. 입력이 주어지면 출력이 나오고, 그 출력에 대한 반응이 다시 입력으로 돌아오는 구조입니다. 이 안에서는 사람의 내적 상태나 변화의 방향, 장기적인 맥락이 고려되기 어렵습니다.

추천 시스템은 다음 클릭을 예측하는 데에는 능숙합니다. 하지만 그 클릭이 어떤 상태에서 발생했는지, 그리고 그 클릭이 이후의 상태를 어떻게 바꾸는지는 알지 못합니다. 생성형 AI 역시 그럴듯한 결과물을 만드는 데에는 뛰어나지만, 그 결과물이 사용자에게 어떤 영향을 미칠지는 구조적으로 다루지 않습니다.


CTR 중심 사고가 만든 구조적 왜곡

이번 내용에서 빼놓을 수 없는 부분이 CTR 중심 사고입니다. CTR은 계산이 쉽고, 빠르게 측정 가능하며, 실험 결과를 비교하기 좋기 때문에 추천 시스템의 핵심 지표로 사용되어 왔습니다. 하지만 CTR 중심 사고는 추천을 지나치게 단순한 반응 예측 문제로 환원합니다.

이 구조에서 추천의 목적은 사용자가 지금 이 순간 클릭할 가능성이 가장 높은 것을 고르는 일이 됩니다. 클릭이 왜 발생했는지, 클릭 이후 사용자가 어떤 감정을 느꼈는지는 고려되지 않습니다. 호기심, 자극, 불편함, 분노로 인한 클릭도 모두 동일한 성공 신호로 처리됩니다.

그 결과 시스템은 점점 더 자극적인 방향으로 진화합니다. 강한 제목과 극단적인 표현이 유리해지고, 맥락과 시간이 필요한 콘텐츠는 밀려납니다. 시스템은 사용자에게 도움이 되는지를 학습하는 것이 아니라, 더 빨리 반응을 끌어내는 법을 학습하게 됩니다.


단기 지표 최적화가 남긴 독성

이번 내용에서 다루는 또 하나의 핵심은 단기 지표 최적화의 문제입니다. 클릭률, 체류 시간, 전환율과 같은 지표는 관리하기 쉽고 성과를 설명하기 좋습니다. 하지만 이 지표들은 본질적으로 단기 반응만을 측정합니다.

이 지표들이 목적 함수가 되는 순간, 추천은 경험 설계가 아니라 숫자 개선 작업으로 바뀝니다. 사용자가 클릭 이후 실망했는지, 신뢰가 떨어졌는지, 피로를 느꼈는지는 보상 신호에 포함되지 않습니다. 시스템은 반응이 있었다는 사실만을 강화합니다.

이 왜곡은 시간이 지날수록 누적됩니다. 추천은 점점 더 공격적으로 변하고, 사용자는 점점 더 소극적으로 반응합니다. 하지만 이 피로는 단기 지표로 잘 드러나지 않기 때문에, 시스템은 문제를 인식하지 못합니다.


필터 버블은 설계의 결과입니다

이번 내용에서 필터 버블은 부작용이 아니라 필연적인 결과로 설명됩니다. 추천 시스템은 과거 반응을 기준으로 선택지를 좁혀 갑니다. 반응이 있었던 콘텐츠는 더 자주 노출되고, 반응이 없었던 영역은 빠르게 사라집니다.

중요한 점은 추천이 중립적인 정보 제공이 아니라, 경험의 경로를 설계하는 행위라는 사실입니다. 사용자는 스스로 선택한다고 느끼지만, 실제로는 시스템이 허용한 범위 안에서만 선택합니다. 이 제한된 경험은 다시 제한된 행동 로그를 만들고, 이는 다시 같은 추천을 강화합니다.

이 과정에서 편향은 자연스럽게 고착됩니다. 그리고 시스템은 스스로 균형을 회복할 기회를 잃습니다. 단기적으로는 반응률이 유지되거나 올라갈 수 있지만, 장기적으로는 피로와 무관심이 누적됩니다.


다음 클릭은 맞히지만, 다음 상태는 모른다

이번 내용의 결론은 명확합니다. 기존 추천 시스템은 다음 클릭은 예측할 수 있지만, 다음 상태는 알지 못합니다. 클릭은 관측 가능한 사건이지만, 추천의 진짜 효과는 상태의 이동으로 나타납니다.

상태가 모델링되지 않으면 변화는 누적되지 않습니다. 사용자가 만족에서 피로로 이동해도, 시스템은 이를 같은 클릭 신호로 해석합니다. 상태를 알지 못하면 방향을 설계할 수 없습니다. 추천은 목표를 향한 이동이 아니라, 반응을 수집하는 과정으로 남게 됩니다.

이 지점이 추천과 생성이 동시에 실패해 온 출발점입니다. 반응을 맞히는 기술은 충분히 발전했지만, 사람의 상태를 이해하는 구조는 부재했습니다. 다음 단계에서 필요한 것은 더 높은 정확도가 아니라, 상태를 중심에 둔 사고 방식입니다.

Leave a comment

ADDEEP

애딥(Addeep)은 차세대 증강 AI 엔진 ‘GPR(Generative Pre-trained Recommender)’을 중심으로, 사람의 마음을 읽고 콘텐츠를 자동으로 만드는 Web3 기반 S2E(Social to Earn) 소셜 플랫폼입니다.

사용자의 의도와 관심사를 이해하고, 콘텐츠·광고·커머스를 자동으로 결합하여 개인 맞춤형 스마트 콘텐츠를 생성합니다.

이 블로그에서는

  • 애딥의 핵심 기술(GPR·LMM·ACT) 인사이트
  • ZαLPHA세대 트렌드와 크리에이터 문화 연구
  • 스마트 콘텐츠 및 S2E 생태계 분석
  • 애딥 서비스 업데이트 및 운영 스토리
    를 가장 빠르게 전달합니다.


사람과 사람,
그리고 가치가 연결되는 새로운 소셜 시대.
그 중심에 애딥이 있습니다.