데이터사이언스1 [데이터 넥스트 레벨 챌린지] 새빨간 거짓말, 통계 (1) * 본 포스팅은 데이터리안에서 주관하는 데이터 넥스트 레벨 챌린지의 일환으로 작성된 독후감입니다. 처음 통계와 데이터를 접하고 이를 실생활과 업무에 적용할 때, 우리는 통계를 통한 분석 기법이 꽤 정확하다고, 항상 기존의 방식보다 더 나은 결론을 제시한다고 확신한다. 하지만 통계의 가장 기초적인 개념인 표본과 평균만 배우더라도 통계를 무비판적으로 맹신하는 것이 얼마나 위험한 것인지 깨닫게 된다. 가장 쉬운 개념이자, 통계의 가장 원초적인 오류가 드러나는 두 개념에 대해, 책에서는 잘못된 사용법을 사례와 함께 제시한다. 대용량의 데이터를 처리할 수 있는 빅데이터 시대에 '표본'은 조금 덜 사용하게 되는 개념이다. 하지만 '평균'은 나도 데이터 분석을 할 때마다 항상 사용하는 개념인 동시에 가장 무비판적으로.. 2024. 4. 8. 이전 1 다음