왜 RSSM인가?

대부분의 AI 기반 추천 시스템은 Transformer만으로 작동하지만, 이 방식은 사용자가 늘어날수록 연산량이 기하급수적으로 증가하여 비용이 폭발하는 구조입니다. Addeep이 추구하는 실시간 개인화·대규모 사용자 처리·커머스 전환 최적화를 Transformer만으로 구현하면 서비스가 성장할수록 GPU 비용이 과도하게 증가하게 됩니다.

RSSM(Recurrent State Space Model)은 이 문제를 해결하기 위한 구조적 대안입니다. RSSM은 매 이벤트마다 전체 기록을 다시 해석하지 않고, 현재 상태(state)만 업데이트하는 방식으로 작동합니다. 이 방식은 연산 복잡도가 O(1)이며, 유저 수나 세션 길이에 따라 비용이 폭증하지 않는 구조입니다.

그 결과, 기존 MMR(LMM-only) 구조와 비교했을 때 GPU 비용이 80~90% 절감되고, 동시 처리량은 5~10배 증가하며, 실시간 반응 속도는 300ms → 10ms 수준으로 크게 향상됩니다. 이는 Addeep의 비즈니스 모델에서 매우 중요한 가치인 수익성 있는 대규모 플랫폼 운영을 가능하게 하는 핵심 기반입니다.

이제 Addeep은 RSSM 기반 구조를 통해 “유저 증가가 곧 비용 증가를 의미하는 구조”에서 벗어나, “유저 증가가 곧 수익 증가로 이어지는 구조”로 진화할 수 있게 됩니다.


RSSM의 세 가지 축

Addeep의 Mindset Engine은 단일 RSSM이 아니라, 서로 다른 시간 규모와 목적을 가진 세 개의 RSSM으로 구성됩니다. 이 세 축은 각각 사람의 장기 기억, 단기 의도, 커머스 인과관계를 모델링합니다.

구조는 다음 세 가지입니다.

  • Long-horizon Preference RSSM
  • Session-level Mindset RSSM
  • ACT / Commerce Control RSSM

각각의 역할을 아래에 상세히 설명합니다.


Long-horizon Preference RSSM

Long-horizon RSSM은 사용자의 장기 취향과 패턴을 표현하는 느린 엔진입니다. RocksDB·Neo4j 등에 저장된 오랜 로그를 SSM(Mamba, S4)과 GNN(GraphSAGE, GAT)으로 분석하여 **해석 가능한 잠재 벡터(z_long)**를 만듭니다.

z_long은 사용자의 평소 성향을 나타내는 벡터이며 다음과 같은 역할을 합니다.

  • 세션 시작 시 Session RSSM의 초기값으로 사용됩니다
  • 세션 중 사용자의 임시 행동이 튈 때 Regularizer로 작동합니다
  • 데이터가 부족한 상황에서는 Prior로 사용되어 안정적인 추론을 가능하게 합니다

또한 Long RSSM은 Batch 학습 기반의 비동기 업데이트로 돌아가기 때문에, 실시간 비용을 거의 발생시키지 않습니다. 대신 매일 혹은 매주 새 데이터를 기반으로 사용자의 장기 특성을 갱신하여 더욱 정교한 장기 Mindset을 제공합니다.

Long-horizon RSSM은 Addeep에 콜드스타트 없는 개인화를 가능하게 해주는 핵심 구성 요소입니다.


Session-level Mindset RSSM

Session-level Mindset RSSM은 사용자가 지금 이 순간 어떤 마음인지 실시간으로 추적하는 엔진입니다. 클릭, 스크롤, 시청, 구매 등 방금 일어난 이벤트를 기반으로 z_t 상태를 업데이트하며, 인퍼런스 속도가 매우 빠릅니다.

핵심 원리는 다음과 같습니다.

  • 실시간 변화는 **상태(state)**만 업데이트합니다
  • 모델의 **가중치(weight)**는 실시간으로 변경하지 않습니다
  • 오프라인 학습으로 모델 안정성을 유지합니다

이 구조 덕분에 세션 내에서 빠른 반응성과 정확한 의도 추적이 가능합니다. 또한 엔트로피 기반 Gate를 통해 사용자의 행동 불확실성이 높을수록 z_long의 비중을 높여 판단의 안정성을 확보합니다.

또한 RSSM은 부정적 피드백(빠른 스킵, 뒤로가기 등)을 강한 Penalty 신호로 해석하여 즉각적으로 상태를 수정합니다. 이를 통해 “고집스러운 추천”을 방지하고 빠르게 방향을 전환하는 능력을 가집니다.

Session RSSM은 Addeep의 실시간 추천 품질을 좌우하는 핵심 엔진입니다.


ACT / Commerce Control RSSM

ACT RSSM은 커머스·광고·콘텐츠 생성의 성과를 인과적으로 이해하기 위해 설계된 도메인 특화 엔진입니다. 이 엔진은 콘텐츠의 성능을 다음 두 요소로 분리해 해석합니다.

  • z_content: 콘텐츠 자체의 매력
  • z_match: 특정 유저와의 궁합

이 두 요소를 구분하는 이유는 다음과 같습니다.

  • A 콘텐츠가 인기 있는 이유가 유저 취향 때문인지
  • 아니면 콘텐츠 자체의 퀄리티 때문인지

이 두 가지를 분리하지 않으면 개인화 모델이 왜곡되고, 결국 특정 스타일만 반복적으로 과도하게 노출되는 문제가 발생합니다.

ACT RSSM은 Counterfactual 학습을 통해 이 인과적 분리를 더욱 강화하며, Policy Head는 다음 생성에 필요한 Condition Pack을 결정합니다. 이를 기반으로 ACT 엔진은 커머스 전환에 최적화된 콘텐츠를 생성하게 됩니다.


RSSM과 MMR의 통합 구조

RSSM은 LMM과 UMM 사이에서 작동하며, 시간에 따라 변하는 Mindset을 안정적으로 추론하는 역할을 합니다. 통합 구조는 다음과 같이 구성됩니다.

  1. Kafka가 모든 행동 로그를 수집합니다
  2. LMM이 텍스트·이미지·영상의 의미를 해석합니다
  3. Connector가 LMM의 고차원 벡터를 RSSM이 처리 가능한 저차원 상태로 압축합니다
  4. Session RSSM이 실시간 상태를 업데이트합니다
  5. Long RSSM이 초기화 Prior를 제공합니다
  6. ACT RSSM이 생성 의사결정을 합니다
  7. ACT 엔진이 Condition Pack 기반으로 콘텐츠를 생성합니다
  8. 생성물에 대한 유저 반응은 다시 로그로 수집되어 RSSM 상태에 반영됩니다

이 아키텍처는 유저별로 완전히 다른 앱 경험을 만드는 데 최적화되어 있습니다.


RSSM 도입 시 발생 가능한 문제와 대응 전략

RSSM은 강력한 구조이지만, 처음부터 Long·Session·ACT RSSM을 동시에 도입하면 복잡성이 매우 커집니다. 따라서 아래와 같은 리스크가 존재합니다.

  • 상태 불일치 문제
  • 모델 간 목적 충돌
  • 시계열 정렬 오류
  • 데이터 스파스 문제
  • Negative Feedback 과도 반영
  • Explainability 감소

이에 대한 대응 전략으로 다음을 적용합니다.

  • 초기에는 Session RSSM 단독 적용 후 안정화
  • 이후 Long RSSM을 적용하여 장기 priors 반영
  • 마지막으로 ACT RSSM을 적용해 커머스·광고 인과 관계 모델링
  • UMM 미갱신 시 Stale State Serving, Cohort Fallback, DLQ Replay로 안전 복원
  • ACT 생성 타임아웃 시 Pre-generated 캐시 제공
  • Connector 병목 발생 시 Heuristic Bypass 사용

이를 통해 시스템은 다양한 장애 상황에서도 끊김 없이 안정적으로 동작합니다.


GPU·클라우드·저장·네트워크 비용 분석

RSSM 통합 MMR 구조는 기존 LMM-only 구조 대비 비용을 크게 절감합니다.
분석 결과는 아래와 같습니다.

트래픽 규모 가정

  • 월간 활성 사용자(MAU) : 약 10만 명
  • 일간 활성 사용자(DAU) : MAU의 20% 수준인 2만 명
  • 1인당 하루 평균 상호작용(클릭/스크롤/뷰/액션) : 약 50회
  • 하루 총 이벤트 수 : 2만 × 50 ≈ 100만 이벤트/일
항목기존 LMM-only MMRRSSM 통합 MMR효과
GPU 인퍼런스 비용매우 높음매우 낮음90% 절감
저장소 비용낮음중간 수준일부 증가
네트워크 비용높음중간캐싱 & 압축으로 감소
동시접속 처리량낮음매우 높음5~10배 증가
  • GPU 비용: 7,000만 원 → 700만 원 (90% 절감)
  • 네트워크 비용: 75% 절감
  • 데이터 저장비용: 증가
  • Kafka 파이프라인 비용: 소폭 증가

전체적으로 월 비용은 1억 500만 원 → 4,000만 원으로 약 62% 절감됩니다.
유저당 Cost 또한 약 2.5배 개선됩니다.

이는 Addeep이 대규모 사용자 기반을 확보하더라도 수익성을 유지할 수 있게 해주는 결정적인 구조입니다.


결론

Addeep이 RSSM을 선택한 이유는 단순히 기술적 선진성을 위한 선택이 아니라, 서비스의 수익성·확장성·비용 경쟁력·콘텐츠 생성 효율 모두를 동시에 해결하기 위한 전략적 선택입니다. Long·Session·ACT RSSM으로 구성된 Mindset Engine은 사용자 행동의 단기·중기·장기 패턴을 모두 해석하며, ACT 생성 엔진과 결합하여 지금 이 유저에게 가장 적합한 경험을 실시간으로 제공하는 AI 시스템을 완성합니다.

이제 Addeep은 단순 추천을 넘어, “사용자의 마음을 구성하고 이해하며 예측하는 AI 플랫폼”으로 진화하고 있습니다.

Leave a comment

ADDEEP

애딥(Addeep)은 차세대 증강 AI 엔진 ‘GPR(Generative Pre-trained Recommender)’을 중심으로, 사람의 마음을 읽고 콘텐츠를 자동으로 만드는 Web3 기반 S2E(Social to Earn) 소셜 플랫폼입니다.

사용자의 의도와 관심사를 이해하고, 콘텐츠·광고·커머스를 자동으로 결합하여 개인 맞춤형 스마트 콘텐츠를 생성합니다.

이 블로그에서는

  • 애딥의 핵심 기술(GPR·LMM·ACT) 인사이트
  • ZαLPHA세대 트렌드와 크리에이터 문화 연구
  • 스마트 콘텐츠 및 S2E 생태계 분석
  • 애딥 서비스 업데이트 및 운영 스토리
    를 가장 빠르게 전달합니다.


사람과 사람,
그리고 가치가 연결되는 새로운 소셜 시대.
그 중심에 애딥이 있습니다.