코드잇 스프린트/미션 & 프로젝트

신용카드 고객 세분화 및 마케팅 전략 수립

JOHAWK 2024. 11. 28. 17:27

캐글의 Credit Card Dataset for Clustering  데이터를 사용해 주성분 분석과 Kmeans 클러스터링으로 신용카드 고객 세그먼트를 진행하고 마케팅 전략을 수립했습니다.

신용카드 고객 세분화 및 마케팅 전략 수립

목차

1. 목표

2. EDA 및 데이터 전처리

3. 고객 유형 세분화

4. 고객 유형별 마케팅 전략

5. 후기

1. 목표

본 분석에서는 고객의 신용카드 사용 패턴을 분석해 고객 유형을 세분화하고 그에 맞는 마케팅 전략을 제시하는 것이 목표입니다.

그래서 고객 유형을 세분화할 변인을 설정하고, 고객 유형을 세분화하는 단계를 거쳐 고객 유형에 맞는 마케팅 전략을 제시합니다.


2. EDA 및 데이터 전처리


데이터는 고객 ID부터 카드 소지 기간까지 총 18개의 변인이 있습니다. 그 중 양 극단에서 쌍봉 분포가 강하게 나타나는 구매 빈도를 고객 유형을 구별하는 변인으로 설정했습니다.

데이터 전처리를 하기 위해 결측치를 살펴봤습니다. 신용 한도에 1개, 최소 결제 금액에 313개의 결측치가 있었습니다.

그 중 최소 결제 금액의 데이터가 없는 사람들을 모아 최소 결제 금액 데이터가 있는 사람들과 비교해봤을 때 카드 소지 기간을 제외하고 큰 차이가 있었습니다. 그렇기 때문에 최소 결제 금액의 결측치 여부도 고객 유형을 구별할 수 있는 변인으로 판단하고 새로 인코딩을 했습니다.

 

이상치에 해당하는 고객들은 VIP, 신용불량자 등 카드사가 관심을 가져야 하는 대상이 될 수 있으므로 제거하지 않고 보존했습니다.

 

추후 진행될 PCA와 Kmeans 클러스터링을 위해 Scikit-learn의 MinMaxScaler를 사용해 정규화를 진행했습니다.


3. 고객 유형 세분화

결측치가 있는 집단이 결측치가 없는 집단보다 전반적으로 변인들의 값이 낮았습니다.

특히, 전액 결제 비율의 차이가 컸습니다. 전액 결제 비율은 신용카드 결제 금액 중 전액을 지불한 비율로 해당 값이 높을수록 건전한 카드 사용자에 해당합니다. 최소 결제 금액에 결측치가 있는 집단은 전액 결제 비율도 매우 낮았습니다.

그렇기 때문에 이들은 카드를 잘 사용하지 않거나, 불량하게 사용하는 것을 알 수 있습니다.


다음으로, 구매 빈도로 고객 세그먼트를 나누어 살펴보았습니다. 양 극단에서 쌍봉을 보이는 분포였기 때문에 각 봉우리에 위치한 고객들을 각각 구매빈도 '하', 구매빈도 '상'으로 분류했고, 그 외 고객들은 구매빈도 '중'으로 분류했습니다.

 

그 후 각 집단의 특징을 살펴봤을 때, 구매 빈도 "하" 집단은 구매 빈도 "상" 집단보다 잔고, 현금서비스 관련 변인이 높았습니다. 여기서 잔고는 통장에 남은 금액이 아니라, 소비자가 신용카드 회사에 갚아야 할 금액을 의미합니다. 즉, 구매빈도 '하'집단이 신용카드 회사에 갚아야 할 금액이 더 크다는 뜻이죠. 집단별 잔고와 현금서비스의 산점도와 상관관계를 살펴봤을 때에도 하 집단이 두 변인 간 상관관계가 가장 컸습니다. 즉, 구매빈도가 낮은 집단은 갚아야 할 금액이 많으면서 동시에 현금 서비스를 많이 이용할 가능성이 높습니다.


이제부터는 다양한 변인들의 특성을 활용하기 위해 주성분분석(PCA)을 실시했습니다.

주성분의 수가 3개일 때 누적 기여율이 77%로, 정보 손실을 최소화할 수 있는 것으로 판단해 주성분의 수를 3개로 설정했습니다.

그리고 각 주성분에서 적재량이 0.3을 넘는 변인들을 종합해 주성분의 이름과 특징을 정했습니다.

  • 주성분 1은 "할부 구매 비중"입니다. 구매 빈도와 할부 구매 빈도의 적재량이 높습니다. 주성분 1의 값이 클수록 할부 구매를 자주 하는 사람들로 정의했습니다.
  • 주성분 2는 "할부 수수류 및 이자에 대한 부담"입니다. 일시불 구매빈도와 할부 구매빈도로 이루어져 있습니다. 주성분 2의 값이 클수록 할부 수수료 및 이자에 대한 부담이 커 일시불로 구매를 많이 합니다.
  • 주성분 3은 "신용카드에 대한 인식"입니다. 잔고 갱신 빈도와 전액 결제 비율로 이루어져 있습니다. 주성분 3의 값이 크면 신용카드에 대한 인식이 무겁습니다. 즉, 신용카드에 대해 보수적으로 생각해 카드 관련 서비스를 적게 사용하고 사용하더라도 바로 카드대금을 상환합니다. 반면, 주성분 3의 값이 낮으면 신용카드를 가볍게 여겨 카드 관련 서비스를 많이 사용하고 카드 대금을 천천히 상환합니다.

다음으로 Kmeans 클러스터링을 통해 군집을 나눴습니다. 엘보우 기법을 통해 군집의 개수를 4개로 고정하고 분석을 진행했습니다.

각 클러스터에 일반 사용자, 할부 매니아, 걱정이 많은 사용자, 신중한 사용자라고 이름을 붙였습니다.

  • 일반 사용자는 할부 수수료 및 이자에 대한 부담은 적으나 할부 구매를 많이 하지 않습니다. 그리고 신용카드의 위험성을 적절한 정도로 받아들입니다.
  • 할부 매니아는 할부 수수료 및 이자에 대한 부담감도 적고 할부 구매를 많이 하는 소비자들입니다. 신용카드의 위험성을 가볍게 받아들이는 편입니다.
  • 걱정이 많은 사용자는 할부 수수료 및 이자에 대한 부담감은 있음에도 불구하고 할부 구매를 많이 합니다. 즉, 수수료 걱정을 하면서도 계속해서 할부 구매를 하는 사람들입니다.
  • 신중한 사용자는 할부 수수료 및 이자에 대한 부담은 적습니다. 하지만, 신용카드에 대한 인식이 보수적이라 카드 사용도 적고 카드 대금도 빨리 갚습니다.

4. 고객 유형별 마케팅 전략

지금까지 단일  변인을 기준으로, 그리고 주성분을 기준으로 신용카드 고객을 세그먼트했습니다. 이 결과를 바탕으로 고객 유형에 맞는 마케팅 전략을 구성해봤습니다.

 

먼저, 단일변인인 구매 빈도를 기준으로 카드를 적게 사용하는 집단과 신용카드를 많이 사용하는 집단으로 나눌 수 있습니다.

  • 구매 빈도가 적은 집단은 현금 유동성이 부족하며, 카드 대금이 많이 누적된 집단으로 볼 수 있습니다. 그렇기 때문에 카드사에서는 신용 회복을 도와줄 수 있는 캠페인을 진행하거나 카드 대금을 상환했을 때 리워드를 제공하는 이벤트를 고려해볼 수 있습니다.
  • 구매 빈도가 높은 집단은 건전한 카드 사용자로 볼 수 있습니다. 그렇기 때문에 신용 등급에 기반한 유연한 대출 서비스를 제공하거나, 사용자 이탈을 막기 위해 사용 기간에 따른 혜택을 제공할 수 있습니다.

 

Kmeans클러스터링을 기준으로 나눈 4개 집단에 대한 마케팅 전략은 다음과 같습니다.

  • 일반 사용자: 할부 수수료에 대한 부담은 적으나 할부 구매를 많이 하지 않습니다. 이들의 할부 구매를 이끌어내기 위해 구매액에 따라 리워드를 제공하는 방안이 필요합니다. 그리고 일반 사용자들의 이탈을 막기 위해 사용 기간에 따른 혜택을 제공하는 것이 좋습니다.
  • 할부 매니아: 할부 매니아는 카드 관련 서비스 사용 빈도에 비해 카드 대금 상환이 오래 걸리기 때문에 위험합니다. 이들의 카드 대금 상환을 유도하기 위해 일정 금액 이상을 상환하면 카드 대금 금리를 조금이라도 인하해주는 이벤트를 진행하는 방법이 있을 것 같습니다.
  • 걱정이 많은 사용자: 이들은 할부 구매를 많이 하면서도 할부 수수료에 부담을 느낍니다. 할부 수수료에 대한 부담감을 낮추기 위한 이벤트로 장기 할부 결제에 대한 무이자 캠페인을 실시하면 걱정이 많은 사용자들이 부담없이 카드를 더 많이 사용할 것으로 예상됩니다.
  • 신중한 사용자: 신용카드의 위험성을 과도하게 받아들여 카드 대금 상환 능력이 있어도 카드를 잘 사용하지 않습니다. 이런 분들을 위해서는 신용카드에 대한 두려움을 낮춰야 합니다. 이럴 때 적절한 게 foot-in-the-door 전략입니다. 열린 문 사이로 발을 슬금슬금 집어넣는 것처럼 가벼운 일부터 적응시키는 것입니다. 예를 들어 이자 없는 단기 소액 대출 서비스로 신중한 사용자들이 무리 없이 카드 대금을 상환하는 경험을 하면서 신용카드에 대한 두려움을 낮추는 방안이 있습니다.

5. 후기

주성분 분석과 Kmeans 군집은 이론적으로만 알고 있었는데 이번 분석을 통해 직접 사용해 볼 수 있었습니다. 실제로 주성분 분석과 Kmeans 군집을 적용하고 거기에 맞는 해석을 하는 과정이 재미있었습니다. 그리고 데이터의 잔고 개념에 대해 헷갈렸고 그 의미를 찾기 위해 많은 시간을 사용했습니다. 도메인 지식이 중요하다는 것을 체감했던 미션이었습니다.