CRM 에서 우리는 고객의 특성을 반영해서 고객을 분류할 수 있다! 특히 이커머스 기업인 경우에 고객이 구매하는 상품은 고객의 니즈와 취향의 결과물로 볼 수 있다. 그 수가 쌓일 수록 취향이 극명하게 드러나고, 이 상품별 특성을 피쳐로 만들어 활용하면 고객 세분화를 가장 쉽게 할 수 있다!
예를 들어.. 많은 카드사는 그들 고객의 카드 데이터를 이용해 고객을 분류한다. 아애 예시는 신한카드 사례이다.
그림에서 보는 것 처럼 여성과 남성 각각 9개식 총 18개로 분류된 하위 집단들은 모두 "구매 품목" 에서 뚜렷한 차이를 보인다. 그리고 이름도 뭔가 딱 특징을 알 수 있게끔 붙인 사례였다.
이번 게시글에는 이전에 이 사레를 보고 영감을 얻어 진행했던 고객세분화 워크플로우의 전반적인 프로세스를 기입해 보겠다. 우리가 만약 이커머스 기업의 고객 데이터를 기반으로 고객의 등급을 분류한다면? 을 가정하고 워크플로우를 살펴보자
1. 어떤 군집을 만들 것인가?
-먼저 어떤 군집을 왜 만들것인지에 대해 군집화 목적을 정의내리자
2. 어떤 데이터를 기반으로 접근할까?
또 사용할 수 있는 데이터는 여러가지가 있을 수 있다. 데이터의 카디널리티와 결측치를 참고해 결정하자
-구매 상품 데이터
-구매 상품의 카테고리
-상품의 태그
-장바구니 상품, 좋아요 상품
-유저의 검색 상품
-구매 횟수
-성별
-연령대
-결혼여부
-가족 구성원의 수
-소득 수준
-거주지
등등등....
3. 변수 선택과 가공
변수의 카디널리티가 너무 높으면 모델 복잡도가 올라가기 때문에, 대표할 수 있는 변수를 "해석 가능 여부" 를 척도로 두고 선택하는 것도 좋은 방법이다. 군집분석에서의 차원의 저주 = 응집도가 낮아짐 을 의미한다. 아래 그림을 참고하자
4. 군집 분석
군집 분석의 본질은 각 데이터 포인트들의 거리가 가깝게끔, 즉, 분산이 낮게끔 잡아주는것이다. k-means 에서 시작해서 여러가지 알고리즘을 이용할 수 있다.
대표적으로 k-menas 외에는 DBscan 이나 Mean-shift 를 쓰는 것 같다. 필자의 블로그에도 해당 알고리즘의 작동 원리와 코드를 담은 게시글이 있으니 참조하시길!
여기로 가면 볼 수 있다
2022.09.18 - [데이터 과학 Data Science/비지도학습] - k-means 알고리즘으로 패턴 찾고 평가까지
2022.09.19 - [데이터 과학 Data Science/비지도학습] - 평균 이동 알고리즘으로 데이터 클러스터링
2022.09.19 - [데이터 과학 Data Science/비지도학습] - 가우시안 혼합 모델로 클러스터링
2022.09.20 - [데이터 과학 Data Science/비지도학습] - 유사도 전파 Affinity Propagation 모델로 클러스터링
2022.10.04 - [데이터 과학 Data Science/비지도학습] - DBSCAN으로 클러스터링
DBSCAN으로 클러스터링
1. 개요 DBSCAN 은 아주 강력한 클러스터링 방식으로 알려져있다! 제일 대표적으로 거론되는 k-means clustering 과의 차이를 먼저 언급해보자면, 클러스터의 개수를 정해야 할 필요가 없고, 이상치 탐
datasciencefromsebi.tistory.com
좋은 군집이란, 위에서 설명했듯 군집 내 유사성은 높고 집단 간의 거리는 큰 집단이다.
5. 파라미터 조정 및 반복
수학적으로 이 거리를 계산하기 위해 쓸 수 있는 평가 지표로는모든 군집 분석이 그러하듯, Elbow method 랑 실루엣 스코어를 볼 수 있고, 정성적인 방법으로는 주요 변수들을 프로파일링 해 보며 눈으로 확인해 볼 수도 있다.
6. 군집별 프로파일링 및 의미 부여
잘 만든 군집은 의미가 명확한 군집이며, 액션 가능한 유저수를 가져야 한다. 또, 환경의 변화에도 유지되고, 측정 변수가 단순할 수록 좋다.
사실 사수 없이 혼자 하는 CRM 을 위해 여러가지 자료와 강의를 참고했지만, 해외 아티클이나 무료로 오픈된 소스코드에서도 대부분 이 워크플로우를 따르는 것 같다. 가장 핵심적으로 봐야 하는 부분은 개인적인 생각으로 "데이터 선택" 그리고 "가중치", 마지막으로 "알고리즘 선정" 인 것 같은데, 그건 어떻게 하는 게 좋은 것이다! 라는 딱 답이 정해진 문제가 아니라, 산업 별로, 데이터 분포 별로 달라질 문제 같다. 결국 다양한 데이터를 만져보면서 상황판단을 잘 하는 능력을 기르는게 CRM 을 잘 하는 DA 가 될 수 있는 방법이 아닐까..!! 싶은
'마케팅 > CRM' 카테고리의 다른 글
[CRM] 보험 상품 이탈 예측 모델 개발 사례 case study - 1 (0) | 2022.12.16 |
---|