또한, 고객들이 한 번 방문하고 나면 2번 이상은 잘 방문하지 않는 것 같습니다. 좀 더 매력적으로 고객들을 끌기 위한 쿠폰 제도를 실시하고자 합니다.
위 이야기처럼 데이터를 분석하여 문제점 혹은 주요 패턴을 알아내고, 해결책을 찾는데 통계 지식이 매우 유용합니다. 혹시나 ‘하나하나 세보고 따져보면 되는 거 아니야?’ 생각하시는 분 계실지도 모르겠네요.
그런데 회사에서 다루는 데이터는 수백, 수천, 아니 그보다 훨씬 더 엄청난 양인 경우가 대부분입니다. 이렇듯 다양한 사용자 행위를 기반으로 대용량 데이터를 분석하고 비즈니스에 기여하는 인사이트를 도출해 내기 위해서는 통계 지식이 반드시 필요합니다.
머신러닝/딥러닝의 원천은 계산통계학입니다. 이 방법론들이 산업에 따라 미래 물류 수요량을 예측하거나, 고객의 행동 패턴을 분석하여 상품을 추천하거나, 신제품 개발에 있어 최신 트렌드를 분석하거나, 특이하거나 튀는 데이터를 통해 사기/고장을 발견하여 조치하는 데에도 활용되고 있는 것입니다. 따라서 데이터 사이언티스트가 되고자 한다면 다양한 통계학적인 지식을 갖추는 것이 중요합니다.