Growth Vibes Only

[Analytics] 우리 회사만의 KPI 를 만들어 보려고 합니다

2023.04.30·

데이터 분석 Data Analysis

나는 스타트업에서 일하는 데이터 분석가와 데이터 사이언티스트 그 사이의 일을 하고 있다. 최근에 회사 내외부용으로 쓸 수 있는 중요한 지수인 KPI (Key Performance Indicator, KPI) 를 만드는 것을 고민하다가 내가 발견하고 테스트해본 방법들을 기록하기 위해 이 포스팅을 써보려고 한다 우선 당연히 지수를 만드는데 딱 어떻다할 정해진 방법은 없다. 너무나 당연히. 비즈니스에서 어떤 가치에 초점을 둘 것이냐는 문제로 직결되기 때문에 지수를 활용할 주체의 사람들과 다같이 이야기해봐야 좋은 결론이 날 수 있다. 이번 시즌에 이 프로젝트에서 분석가인 나의 role 은 수학적으로 어떻게 하면 좀 더 안정적인 지수를 만들지 연구하고 테스트해서 합의점을 찾는 부분이었음. 1.항목별 가중치에 대해..

[시계열] 시계열 모델 기초(3) - 다변량 시계열 ARCH, GARCH 모델

2023.04.17·

카테고리 없음

*실무에서 많이 쓰는 모델은 아니나 개념적으로 알고 있어야 하는 모델 변동성 시계열 모델은 불안정 시계열 모델들과 기본적으로 가지는 가정 자체가 다르다. 다변량 시계열 모델은 기본적으로 훨씬 더 제한적인 통계적 속성 하의 제한들을 가지고 있다. 따라서 범용성이 낮은 모델이며, 이 모델을 쓸 수 있는 데이터 역시 제한적이라는 것을 알고 가자. 복잡도가 높은 모델일수록 그러함. 지금까지 봤던 모형들은 (ARIMA 이하) 기본적인 가정이 정규분포를 따르고, 등분산성을 따른다는 것이었다. 하지만 변동성 모형의 기본 가정은 말그대로 "변동성이 존재하고" 그 변동성이 시간에 따라 크거나 작아질 수 있다는 것이다. (금융시계열 데이터에서 주로 나타나는 패턴이고, 거시경제 학자들이 이 데이터를 예측하기 위해 만든 모델..

[태블로] 태블로 API 이용해 자동화하기 (feat. pdf 추출 자동화)

2023.04.04·

데이터 분석 Data Analysis/Tableau

태블로 자동화 가능한가요 ! 네 가능합니다!! 유로 버젼만 가능하고 유료 버젼에서 쓸 수 있는 태블로 서버랑 파이썬 라이브러리를 API 로 연결해서 할 수 있어요! 이걸로 반복문을 돌릴 수 있게 되었습니다 우리는.. 데이터를 리프레쉬해서 만드는것도 되구요 저처럼 pdf 추출 자동화도 가능함! 그런데 한국어로 된 이걸 잘 설명해주는 문서가 없어서 제가 씁니다... 태블로 이시키들 한국 지사를 안 가지고 있어요 ㅠ ㅠ salesforce 한국쪽에다가 전화하면 영업팀만 받고 기술지원팀은 나몰라라야 뭔가 궁금한거 물어보려면 일본 지사 사람이랑 컨택해야돼 (근데 한국인 담당자가 있음) 저는 유료판 구매에서 라이선스부터 애를 먹고 태블로 측과 많은 멜을 주고 받았어요 하지만 도움이 되지는 않았답니다 ㅋㅋㅋㅋㅋㅋㅋㅋ..

[python][프로그래머스_lv1] 기사단원의 무기 (feat. 공약수)

2023.03.31·

카테고리 없음

오늘도 효율성은 개나 줘버린 나의 첫 코드 그냥 의식의 흐름대로 짰는데 파이썬 문법 연습한다 생각하고 ㅋㅋㅋ 효율성 테스트에서 실패 ~ 넌 왜그렇게 인내심이 없는거니? def solution(number, limit, power): #약수 개수 리스트 구하기 li = [] for j in range (1, number+1): count = 0 for i in range(1, j+1): if j%i == 0: count += 1 li.append(count) #제한보다 큰 것은 바꿔주고 합계 리턴 for i in range(len(li)): if li[i] > limit: li[i] = power return sum(li) 약수의 개수 구하는 부분에서 이중 포문을 쓰면서 시간초과가 된 것 같다 근데 아무리..

[python][프로그래머스_lv1] 숫자 짝꿍 (feat. sort 안 쓰기)

2023.03.23·

코딩테스트/python

나의 첫번째 풀이 아주 제너럴한 접근방식이었을 것 같다.. def number_of_love(X,Y): first = list(X) second = list(Y) common = [] for i in first: if i in second: common.append(i) second.remove(i) if len(common) == 0: return str(-1) elif int(''.join(map(str, common))) == 0: return str(0) else: common.sort(reverse=True) new_number = int(''.join(m..

[시계열] 시계열 모델 기초 (2) 불안정 시계열 - ARIMA (세상에서 제일 쉬운 설명)

2023.03.16·

카테고리 없음

우리가 지난 포스팅에서 살펴본 AR, MA, ARMA 모델은 안정 시계열이었으나, 대부분의 시계열 모델은 정상성 등을 파괴해버리는 특성을 가지는 불안정 시계열인 경우가 크다. 따라서 차분이나 로그 변환을 통해 해결할 수 있는 불안정 시계열 모델을 이용하는게 일반적이다. 게 중 ARIMA 모델은 가장 기본적이고도 유명한 시계열 모델인데,, 오늘은 이 ARIMA 모델의 내부를 들여다 보고 간단한 실습까지 해보도록 하겠다. 앞선 포스팅을 보지 않았다면 꼭 보고 와주시길! 1. ARIMA 모델 설명 ARIMA(p, d, q) : d차 차분한 데이터에 AR(p) 모형과 MA(q) 모형을 합친 모형 ARIMA 모델은 이름에서도 알 수 있듯 AR 모델의 파라미터 p 와 MA 모델의 파라미터 q 를 Inetegrate..

티스토리툴바