오늘은 보험회사의 보험 상품을 구매한 고객들이 이탈하는 (보험을 해지하는) case 를 가지고 워크플로우를 이해하기 위한 전반적인 공부를 해보겠다 !
1. 비즈니스 이해
일단 보험사에 대한 아주 간단한 이해부터 해보자
흔히들 보험에 대한 이미지가 어떠한가? 일단 "팔고 보자" 라는 영업관행 때문에 우선 영업해 가입을 독려하는 업계라는 이미지가 꽤나 있는 듯 하다. 그러나 아래 뉴스를 보니 이와 관련한 해지율이 꽤나 높아 보험사의 주요 성과지표는 이제 "유지율" , 마케팅 용어로는 리텐션이라고 불리는 그것을 따지게 되기 시작한 것 같다
보험사 입장에서는 리텐션과 관련한 어떤 것들이 가장 궁금할까?
나는 보험사의 대표다.. 우리 회사의 보험 가입 해지율이 쑥쑥 늘고 있다면...
왜 고객들이 가입한 보험을 해지하는지
보험을 해지한 고객은 어떤 특징이 있는지
해지 시점에 따른 원인이 다를지
이탈을 언제 감지할 수 있을지
등이 궁금할 것이다.
그리고 데이터 분석을 하는 목적은 결국은 비즈니스 인과관계를 이해해 더 나은 전략을 제시하는것이기 때문에, 우리는 "왜" 해지율이 낮아지는지를 파악하는게 중요한 목표가 될거다.
또, 금융업계에서는 숫자에 훨씬 더 민감하게 반응하는게, 1% 차이 2% 차이가 엄청나게 거대한 수익과 손실을 만들어낼 수 있어서, 정확도가 높은 모델을 잘 만들어 서빙하는게 중요하다고 한다.
2. 프로젝트 계획
해당 프로젝트는 실제 보험사에서 5주에 걸쳐 진행된 프로젝트로,
7회차, 13회차, 25회차 유지율을 예측하는 모델을 만들어서 신 계약의 유지율을 예측하는 프로젝트를 진행했다고 한다. 그래서, "유지율이 높은 게약인지", "유지율이 위험한 수준의 계약인지" 를 판단해 해피콜에서 차별화, 적부심사 강화 등의 수를 두는 마케팅 전략을 이용했다고 한다.
3. ML 관점 & 마케팅 관점에서의 체크리스트
1. 성과는얼마나 되어야 만족할수있을까?
2. 얼마 동안의 데이터를 사용할 것인가?
3. Target은 어떻게 정할것인가?
4. 어떤 변수를 수집하여 사용할것인가?
5. 정확도는 어떤 기준으로 평가할것인가?
6. 모델을 만들 때 제약사항이있는가?
7. 모형을 단일모형으로 만들것인가 or 세분화하여 모델을 각각 만들것인가?
8. 예측된 정보를 누가 본다면 가장 잘 활용할 수 있을까?
9. 어떠한 형태로 제공되었을 때 가장 효과적일것인가?
10. 어떤 정보를 같이 제공해 주어야 시너지를 낼 수있을까?
11. 얼마의 주기로 정보를 제공해 주어야할까?
4. 학습데이터/ 테스트데이터 분리 방안 고민
시계열 데이터의 경우 두가지 방법으로 데이터를 분류할 수 있다. 전자의 경우 이탈고객과 유지고객이 한쪽으로 편중될 우려가 있으나, 전반적인 기간에서 전략의 변동이 있었던 경우를 고려해 예측모델을 만들 수 있고, 후자의 경우는 이탈고객과 유지고객 모두를 균일히 학습시킬 수 있으나 시간에 따라 생긴 다양한 변수를 모두 학습에 넣기 어렵다는 단점이 있는 것 같다.
5. 전처리에서 유의할 점
이탈 모델을 생성할 때 가장 중요한 것은 "이탈 직전의 행동패턴" 이다. 모든 유저 또는 계약의 이탈 데이터는 이탈 시점이 제각각이기 때문에 학습용 데이터를 생각할 때는 각각의 이탈 시점을 기준으로 데이터를 생성해야 한다.
예를 들어 내가 학습시키려는 데이터가 왼쪽 모양으로 생겼다면, 오른쪽의 형태로 데이터를 맞춰 주어야 원활한 시계열 분석이 가능해지는 것이다.
6. 가설 설정 및 데이터 정의
이제 우리는 어떤 데이터를 이용해 분석을 할지를 결정내려야 한다!
-계약자의 나이, 성별, 소득, 직업, 가입일
-설계사의 경력, 직책, 성과
- 계약한 상품의 카테고리, 가격, 계약일시, 납입방법
- 특약조건
등등이 우리가 쓸 수 있는 데이터일 것이다.
그런데, 변수가 많다고 해서 무조건 좋은 것은 아니다. 모델 복잡도가 결국 올라가면 예측 정확도가 떨어지기 때문에, 우선 여러가지 변수를 넣어 모델을 돌려보고, 보통은 중요도가 높은 변수들을 남기고 나머지를 제거하게 된다.
우선 모델링을 위해서는 사용가능한 (영향력이 있을거라고 예측하는) 대부분의 데이터를 하나의 table 로 (tidy data 형태로) 만든다.
그럼 다음 포스팅에서 모델 선택, 모델링 결과와 관련된 내용으로 돌아오겠다!
2편 보러 가기 ->
'마케팅 > CRM' 카테고리의 다른 글
[CRM] 기본적인 CRM (고객군집화) 워크플로우 (0) | 2022.11.14 |
---|