코드잇 스프린트/미션 & 프로젝트

호텔 예약 취소 요인 탐색

JOHAWK 2024. 11. 28. 14:46

코드잇 스프린트에서 제공하는 호텔 예약 데이터(캐글의 Hotel booking demand 에서 일부 수정)를 활용해 호텔 예약을 취소하는 요인이 무엇인지 EDA로 탐색하고 Tableau로 시각화했습니다.

호텔 예약 취소 요인 탐색

목차

1. 가설 설정 & 데이터 전처리

2. EDA

3. 후기

 

1. 가설 설정

본 분석은 호텔의 예약 취소에 영향을 주는 변인을 EDA로 탐색해보고자 진행되었습니다.

메인 가설을 '예약을 하는 데 노력을 많이 들이면 취소를 덜 한다'로 설정했습니다. 캐글의 데이터 설명을 바탕으로 '노력'을 조작적으로 정의하기 위해 호텔 위치, 예약 채널, 특별 요청 수를 변인으로 설정했고 그에 따른 세부 가설을 설정했습니다.

1) 호텔 위치

  • 호텔 위치는 두 곳이 있었는데, 저는 도심과 리조트로 나누었습니다. 도심은 주로 호캉스를 위해 사용한다고 가정했습니다. 리조트는 휴양지에 위치해 있어 여행을 위해 방문하는 곳으로 가정했습니다. 
  • 일반적으로 여행이 출장보다 더 많은 준비가 필요하기 때문에 리조트가 도심 호텔보다 더 많은 노력이 들어갔을 것이고, 호텔 위치에 따라 예약 취소율이 다를 것이라는 가설을 세웠습니다.

2) 예약 채널

  • 예약 채널은 Direct와 TA/TO(여행사)에 중점을 뒀습니다. 패키지 여행처럼 여행사가 대신 예약을 해줄 경우 고객의 노력이 들어가지 않지만, 개인이 직접 예약을 하게 되면 호텔에 대한 정보를 얻기 위해 많은 노력이 필요합니다.
  • 그런 이유에서 예약 채널에 따라 예약 취소율이 다를 것이라는 가설을 세웠습니다.

3) 특별 요청 수

  • 특별 요청 수는 예약을 할 때 호텔에 언급한 특별한 요청의 수입니다. 예를 들어, 아이가 있으니 아기, 반려동물도 같이 들어가니 따로 준비해달라 등의 요청이 있습니다.
  • 특별 요청을 모두 들어줄 수 있는 호텔을 찾기 위해 노력을 했을 것으로 예상되어 특별 요청 개수에 따라 예약 취소율이 다를 것이라는 가설을 세웠습니다.

전체 데이터는 119,380개가 있었는데 거기서 결측치 492개를 제거해 총 85,768개 데이터를 분석했습니다.


2. EDA

1) 호텔 위치에 따라 예약 취소율이 다를 것이다.

EDA 결과 도심 호텔의 예약 취소율은 42%, 리조트 호텔의 예약 취소율은 28% 입니다. EDA만 실시했기 때문에 해당 차이가 통계적으로 유의한 지 알 수 없으나 약 14% 정도의 차이가 있습니다.

 

2) 예약 채널에 따라 예약 취소율이 다를 것이다.

EDA를 통해 살펴봤을 때 여행사를 통해 예약을 했다가 취소한 비율이 41%로 가장 높았고, 직접 예약한 케이스에서는 예약 취소율이18%로 가장 낮았습니다.

 

3) 특별 요청 수에 따라 예약 취소율이 다를 것이다.특별 요청이 없었을 때는 예약 취소율이 48%에 달했습니다. 하지만 특별 요청이 1개 있으면 22%, 그보다 많으면 더 감소하는 모습을 보여줬습니다.

 

4) 종합 및 인사이트

EDA를 통해 살펴봤을 때 3개의 가설이 모두 지지되었습니다. 즉, 호텔을 예약하기 위해 노력이 들어가면 그렇지 않을 때보다 예약 취소율이 낮다고 볼 수 있습니다. 그렇기 때문에 호텔 입장에서는 고객들이 관심을 가지고 자신의 호텔에 예약을 해야 하는 것이 중요할 것입니다.

 

고객들이 호텔에 직접 관심을 가지고 예약할 수 있도록 제시할 수 있는 방법은 두 가지가 있습니다.

먼저, 사람들이 여행을 준비할 때 먼저 하는 단계인 목적지 탐색에서 인터넷으로 관광지를 검색할 때 호텔이 먼저 나올 수 있도록 광고를 게시하는 것입니다.

그리고, 고객들이 특별 요청을 부담없이 할 수 있도록 호텔에서 수용할 수 있는 특별 요청들을 강력하게 어필하는 것입니다. 예를 들어 반려동물 동반 입장할 수 있는 호텔은 이 점을 적극적으로 광고해야 합니다.

 


3. 후기

시각화 도구인 Tableau를 처음 써봤는데 매우 강력한 GUI 기반 시각화 도구임을 느꼈다. 현재 퍼블릭 버전을 쓰고 있어 보안 상의 이유로 모든 데이터를 시각화할 수 없지만 보고서에 넣을 그래프와 대시보드를 만들 새로운 툴을 알게 되어 유익했다.