대표적인 데이터 분석 테크닉 30가지 (1/2)

올림픽은 아니지만 데이터 분석 분야에서도 자주 쓰이는 대표 선수(?)들이 있습니다. 오늘은 대표적으로 많이 사용되는 데이터 분석 방법론 에 대해 공유해 드리려고 합니다.

저도 실무에 많이 사용하는 다양한 기법들이기 때문에 실무자, 혹은 업계에 조인하기 위해 공부하는 분들께 실용적인 포스팅이 되지 않을까 생각해 봅니다.
(보다 자세히 공부하실 분들을 위해 명칭은 모두 영문으로 표기했습니다.)

대표적인 데이터 분석 테크닉 30가지 (1/2) 더보기

R을 사용한 K-means 군집분석 (K-means clustering in R)



소셜 커머스 싸이트 C사에서 물건을 구매하는 고객 A와 B가 있다고 가정해 봅시다. A는 물티슈, 기저귀, 레깅스 등을 오후에 방문하여 구매하는 전업주부이며 B는 기능성 화장품, 트렌드 패션의류 등을 주로 점심시간에 방문하여 구매하는 커리어 우먼입니다.

C사는 두 고객을 구분해서 스마트 폰의 앱 알림 시간과 보여주는 품목을 다르게 접근한다면 매출 발생 기회를 높일 수 있을 것입니다.

이렇게 구매 물품, 패턴 등 대상이 가지고 있는 정보의 유사성에 따라 대상을 분류하는 기법을 군집 분석(Cluster analysis)이라고 합니다.

by Andy Wilson
by Andy Wilson

군집분석이란?

군집 분석은 비지도학습(Unsupervised learning) 분석 기법 중 하나입니다. 쉽게 말해서, 사전 정보 없이 자료를 컴퓨터에게 주고, “유사한 대상끼리 묶어보아라!” 라고 명령을 내리는 분석 방법입니다.

R을 사용한 K-means 군집분석 (K-means clustering in R) 더보기