
데이터분석에서 로그를 취하는 경우 (세상에서 제일 쉬운 설명)
·
데이터 분석 Data Analysis/통계 Statistics
우리는 가끔.... (이 아니라 사실 자주) 괴이한 데이터를 만난다. 가령 우리의 데이터는 이렇게 생길 수도 있다 ....? 혹은 이럴지도 모른다 ............? 실로 괴이한 현상이 아닐 수가 없다. 이는 내가 이번 프로젝트를 하며 실제로 만났던 데이터들의 분포다. 이런 데이터들을 우리는 " 정규분포를 따르지 않는 데이터" 라고 부른다. 정규분포는 무엇이냐? 요렇게 데이터가 예쁜 종 모양! 한쪽으로 치우치지 않은 모양을 얼추 따르면 정규분포를 따른다고들 한다. 그러니 정규분포를 따르지 않는 데이터는 내가 보여준 예시마냥 극단적으로 치우치거나. 데이터가 연속적이지 않고 두세군데 듬성듬성 있다거나 하는 문제가 있는 그냥 생겨먹은게 이상하면 정규분포를 안 따르는 데이터인거다. 애석하게도... 데이터 ..