데이터 분석

가장 간단한 방법으로 문제 해결하기: 결제일 예측 프로세스 개선

JOHAWK 2025. 10. 29. 16:53

이번에는 제가 처음으로 맡았던 업무인 결제일 예측 프로세스 개선 사례에 대해 알려드리려고 합니다. 결제일 예측을 개선하기 위해 다양한 방법을 고민했다가 가장 간단한 방법인 결제일을 기반으로 예측해서 정확도를 높였습니다.

 

가장 간단한 방법으로 문제 해결하기: 결제일 예측 프로세스 개선

목차

1. 문제 및 현황

2. EDA

1) 결제일 간격

2) 결제일 빈도

3) 인사이트

3. 가설 검증

1) 가설

2) 결제일 빈도 기반 예측 로직

3) 가설 검증

4) 결과

 

1. 문제 및 현황

1) 문제

제가 다니는 회사에서는 주간 리포트를 통해 고객사의 지난 주 소프트웨어 결제 내역과 주요 포인트를 제공하고 이번 주에 발생할 결제를 예측해서 안내하고 있습니다. 그런데 이번 주 결제일 예측의 정확도가 낮다는 피드백을 받고 확인을 해보니 정확도가 낮았고 예측 자체도 많지 않았습니다.

 

2025년 6월 2주차 기준 결제일 예측

항목
실제 결제 내역 수 287
예측한 결제 수 85
맞춘 결제 예측 수 5

 

1) 현황

 제가 들어오기 전까지 고객사의 각 소프트웨어의 결제일의 평균 간격을 계산해 예측하는 방식으로 다가오는 결제일을 예측했습니다. 하지만 이 방식은 크게 두 가지 문제점이 있습니다.

 - 달마다 일 수가 다릅니다. 1년 중 7개월은 31일이 있으며, 4개월은 30일입니다. 그리고 2월은 28일이며, 윤달인 경우 29일입니다. 이 상황에서 결제일의 간격을 기반으로 하루, 이틀의 차이가 발생할 수 있습니다.

 - 고객사의 결제 패턴이 매우 다양합니다. 고객사와 소프트웨어의 유형에 따라 결제하는 방식이 다릅니다. 예를 들어, 어떤 기업은 ChatGPT 팀 요금제를 사용해 매 월 1회만 결제합니다. 반면, 구성원 별로 ChatGPT를 결제해 매 월 n회 이상 결제가 발생합니다.

 

 


2. EDA

64개 고객사의 결제내역 55,210건을 수집했고, 모든 결제 내역에 반드시 포함되는 결제 승인 시각을 KST로 변환했습니다. 그리고 결제 금액도 

1) 결제일 간격

고객사들의 평균 소프트웨어 결제일 간격은 38.7일이었습니다. 1개월 + 7일 정도의 차이였습니다.

결제일 간격의 범위는 0일 ~ 412.5일이었습니다. 0일인 경우는 같은 날에 다른 구성원들의 소프트웨어를 결제한 케이스입니다.

 

2) 결제일 빈도

전체 데이터를 비교해봤을 때, 각 기업에서 결제일이 같은 소프트웨어의 수는 2,377개였습니다. 총 소프트웨어 수가 2,879개인 것을 고려하면 대부분의 소프트웨어가 결제일이 같다는 것을 확인할 수 있습니다.

 

결제일이 달랐던 케이스를 살펴보면 매입만 기록되는 카드사에서 주말에 결제 승인이 되면 다음 영업일에 매입이 발생하는 경우, 매월 말일에 결제가 발생하는 경우가 있었습니다.

 

 

3) 인사이트

EDA를 통해 대부분의 소프트웨어가 지정된 날짜를 기준으로 결제가 발생한다는 것을 확인했습니다.

 


3. 가설 검증

1) 가설

EDA를 통해 대부분의 소프트웨어가 특정 날짜를 지정해서 결제가 발생한다는 것을 확인했고, 이에 기반해 다음과 같은 가설을 세웠습니다.

결제일 간격 기반 예측보다 결제일 빈도 기반 예측의 정확도가 더 높을 것이다.

 

 

2) 결제일 빈도 기반 예측 로직

결제일 빈도 기반 예측은 다음과 같은 전개를 통해 이루어집니다.  먼저, 신규 고객이 가져올 수 있는 최소 단위가 3개월이기 때문에 최근 3개월 결제 내역 데이터를 가져옵니다. 그 다음, 최근 2개월 내 같은 날짜에 트랜잭션이 발생한 경우와 3개월 동안 매 월 1회 결제가 발생하는데 결제일들의 범위(가장 빠른 날과 가장 느린 날)가 3일 이하면 결제일 목록에 추가했습니다.

 

3) 가설 검증

6월 2주차 데이터를 가지고 두 예측 방식 결과를 비교했습니다.

기존 결제일 간격 기반 예측은 85건을 예측한 반면, 결제일 빈도 기반 예측은 242건을 예측해 실제 결제 내역 수(287건)와 비슷해졌습니다.

정밀도, 재현율, F1 점수 모두 이전에 비해 10배 이상 상승했습니다.

 

4) 결과

위 분석 결과를 근거로 결제일 예측 프로세스를 결제일 빈도 기반으로 바꿨습니다. 그리고 고객으로부터 이전보다 결제일 예측 정확도가 높아졌다는 긍정적인 피드백을 받았습니다.


위 프로젝트를 하면서 처음에는 정확한 결제일 예측을 위해 머신러닝과 같은 고도화된 분석 방법들을 생각했으나 EDA를 통해 결제일 간격을 결제일 빈도로 바꾸는 가장 간단한 방법으로 결제일 예측의 정확도를 10배 이상 높일 수 있었습니다.

 

최신 분석 방법이 무조건적인 정답이 아니고 EDA를 통해 데이터가 가지는 특성을 확인하는 것이 중요하다는 것을 실제 데이터로 확인할 수 있던 좋은 기회였습니다.