본문 바로가기
● Data Processing

RFM으로 고객 가치를 분석하는 데이터 모델링

by DataFolio.lab 2026. 6. 12.
반응형

고객 데이터를 활용한 분석에서 가장 먼저 부딪히는 문제는 “누가 중요한 고객인가”를 정의하는 일입니다. 단순히 매출이 높은 고객만 중요한 것은 아니고, 최근에 활발히 활동하는 고객인지, 반복적으로 구매하는지까지 함께 봐야 실제 비즈니스에 도움이 되는 인사이트가 나옵니다. 이런 맥락에서 RFM(Recency, Frequency, Monetary) 모델은 비교적 단순한 구조로 고객 가치를 정량화할 수 있는 대표적인 Customer Segmentation 방법입니다.

 

이 모델은 복잡한 Machine Learning 없이도 빠르게 적용할 수 있으며, 마케팅, 영업, CRM 전략 전반에 직접 연결된다는 점에서 여전히 많은 조직에서 사용되고 있습니다.

RFM으로 고객 가치를 분석하는 데이터 모델링

반응형

RFM 지표의 본질과 해석 방식

RFM은 단순한 지표 조합이 아니라 고객 행동을 시간과 빈도, 그리고 금액이라는 세 가지 축으로 해석하는 구조입니다.

  • Recency: 고객이 얼마나 최근에 구매했는가
  • Frequency: 고객이 얼마나 자주 구매하는가
  • Monetary: 고객이 얼마나 많은 금액을 지출했는가

이 세 가지를 함께 보면 고객의 현재 상태와 미래 행동 가능성을 어느 정도 예측할 수 있습니다.

 

예를 들어 다음과 같은 해석이 가능합니다.

  • Recency가 높고 Frequency가 높은 고객 → 현재 활발한 핵심 고객
  • Recency는 높지만 Frequency가 낮은 고객 → 신규 또는 체험 단계 고객
  • Recency가 낮고 과거 Frequency가 높았던 고객 → 이탈 위험 고객

이처럼 RFM은 단순 수치 이상의 의미를 가지며, Customer Lifecycle을 이해하는 데 중요한 기준이 됩니다.


데이터 모델링 구조 설계의 핵심

RFM 분석에서 가장 중요한 것은 지표 계산보다 데이터 구조입니다. 데이터 모델링이 잘못되면 계산 자체가 왜곡되거나 성능 문제가 발생할 수 있습니다. 기본적으로는 트랜잭션 중심 구조를 가져가야 합니다.

 

핵심 테이블 구성은 다음과 같습니다.

  • Transaction Table: 고객ID, 주문ID, 주문일자, 구매금액
  • Customer Table: 고객ID, 가입일, 고객 속성
  • Date Table: 날짜, 주차, 월, 연도 등

여기서 가장 중요한 포인트는 “거래 단위 데이터”를 기준으로 집계를 해야 한다는 점입니다. 이미 집계된 데이터를 사용하면 Frequency나 Recency 계산이 부정확해질 수 있습니다.


RFM 지표 계산 로직 상세

RFM은 단순해 보이지만 계산 기준을 어떻게 잡느냐에 따라 결과가 크게 달라집니다.

Recency 계산

Recency는 기준일을 중심으로 마지막 구매 시점을 계산합니다. ( Recency = 기준일 - 마지막 구매일 )

 

기준일은 보통 다음 중 하나를 사용합니다.

  • 분석 실행일
  • 데이터 기준 마지막 날짜
  • 특정 캠페인 기준일

예를 들어 기준일이 2026-05-01이고 마지막 구매일이 2026-04-20이라면 Recency는 11일입니다.


Frequency 계산

Frequency는 특정 기간 동안의 구매 횟수입니다. ( Frequency = 기간 내 주문 수 )

 

여기서 중요한 것은 “기간 정의”입니다.

  • 최근 3개월
  • 최근 6개월
  • 최근 1년

비즈니스 특성에 따라 기간을 다르게 설정해야 합니다. 예를 들어 이커머스는 짧은 기간, 보험이나 자동차는 긴 기간이 더 적합합니다.


Monetary 계산

Monetary는 고객의 소비 규모를 나타냅니다. ( Monetary = 기간 내 총 구매 금액 )

 

또는 다음과 같이 변형할 수도 있습니다.

  • 평균 구매 금액
  • 1회당 구매 금액
  • 순이익 기반 금액

특히 할인이나 환불이 많은 비즈니스에서는 단순 매출보다 실제 이익 기준이 더 유효할 수 있습니다.


점수화 Scoring 전략과 구간 설정

RFM의 핵심은 “정규화”입니다. 서로 다른 단위의 값을 동일한 기준으로 비교하기 위해 점수화를 진행합니다. 가장 일반적인 방식은 Quantile 기반입니다.

  • 전체 고객을 기준으로 상위 20% 단위로 구간 나누기
  • 각 구간에 1~5 점 부여

예시:

  • Recency: 최근일수록 높은 점수
  • Frequency: 많을수록 높은 점수
  • Monetary: 클수록 높은 점수

이렇게 하면 모든 고객이 3자리 점수 조합을 가지게 됩니다.

 

예시 :

  • 555: 최상위 고객
  • 155: 신규 고가 고객
  • 511: 최근 구매했지만 금액 낮은 고객

이 조합은 단순하지만 매우 강력한 세그먼트 기준이 됩니다.


고객 세그먼트 정의와 비즈니스 연결

RFM 점수는 그 자체로 끝나는 것이 아니라 반드시 전략으로 연결되어야 합니다. 대표적인 세그먼트는 다음과 같이 정의할 수 있습니다.

  • High Value: R, F, M 모두 높은 고객
  • Loyal: Frequency 중심으로 높은 고객
  • Big Spenders: Monetary 중심 고객
  • New Customers: Recency만 높은 고객
  • At Risk: 과거 우수 고객이지만 최근 활동 없음
  • Churned: 장기간 미구매 고객

이 세그먼트는 실제로 다음과 같은 전략으로 이어집니다.

  • High Value → VIP 프로그램, 전용 혜택
  • At Risk → 리텐션 캠페인, 할인 쿠폰
  • New → 온보딩 메시지, 첫 구매 유도
  • Loyal → 업셀링, 교차 판매

즉, RFM은 단순 분석이 아니라 Actionable Insight를 만드는 도구입니다.


모델 고도화를 위한 확장 방법

RFM은 기본 구조지만 다양한 방식으로 확장할 수 있습니다.

  • 가중치 적용: 특정 지표에 더 높은 중요도 부여
  • 시간 감쇠 적용: 오래된 구매 데이터에 낮은 가중치
  • CLV(Customer Lifetime Value)와 결합
  • Behavioral Data 추가: 클릭, 방문, 장바구니 등

또한 K-means 같은 Clustering 알고리즘과 결합하면 더 정교한 세그먼트를 만들 수도 있습니다.


실무에서 자주 발생하는 문제

RFM을 실제로 적용할 때는 몇 가지 흔한 문제가 있습니다.

  • 기준 기간이 비즈니스와 맞지 않는 경우
  • 이상치 고객이 점수 분포를 왜곡하는 경우
  • 환불, 취소 데이터 반영 누락
  • 고객 ID 정합성 문제

특히 Data Quality가 낮으면 RFM 결과는 신뢰할 수 없게 됩니다. 따라서 데이터 정제 단계가 매우 중요합니다.


데이터 기반 고객 전략의 출발점

RFM 모델은 복잡한 알고리즘 없이도 고객 가치를 빠르게 파악할 수 있는 구조입니다. 단순하지만 해석력이 높고, 다양한 시스템과 쉽게 연결된다는 점에서 여전히 강력한 분석 도구로 활용됩니다.

 

특히 초기 단계에서는 RFM만으로도 충분히 의미 있는 인사이트를 도출할 수 있으며, 이후 CLV, Predictive Analytics, Personalization으로 확장하는 기반이 됩니다.

 

결국 중요한 것은 지표 자체보다, 이를 어떻게 해석하고 실제 전략으로 연결하느냐입니다. RFM은 그 출발점이 되는 가장 현실적인 방법입니다.

반응형

놓치면 아쉬운 추천 글, 함께 읽어보세요!

  • 추천 글을 불러오는 중입니다...