R 의사결정나무 깔끔하게 Plotting 하기 – (fancyRpartPlot in R)

지난 포스팅을 통해 R의 의사결정나무 분석 패키지 중 가장 자주 쓰이는 rpart, ctree, party 패키지로 의사결정나무를 만들고, 가지치기를 하고, 예측모델을 만들어 시각화 하는 방법을 정리해 보았습니다.

R의  의사결정나무 분석 패키지의 단점이 하나 있다면 시각화된 Plot의 낮은 가독성에 있습니다. ggplot2(대표적인 시각화 패키지), ggvis(interactive 그래프), rgl(3D 그래프) 등 많은 패키지에서 “fancy”한 그래프를 지원하는 반면 rpart, ctree, party에서 지원하는 그래프 기능은 사실 조금 실망스럽습니다.

그래서 이번 포스팅에서는 의사결정나무를 보다 깔끔하게 시각화 할 수 있게 도와주는 rattle 패키지의 fancyrpartplot 함수에 대해 간단히 소개드리려고 합니다.

또오해영
그냥 rpart 그래프 vs 예쁜 rpart 그래프

R 의사결정나무 깔끔하게 Plotting 하기 – (fancyRpartPlot in R) 더보기

R을 사용한 베이즈 분류/예측 모델 (Naive Bayes classification in R)

베이지언 확률 모델은 전통적인 피셔리언 확률 모델인 빈도주의와 함께 현대 확률 통계학의 중요한 축을 구성하고 있습니다.

빈도주의가 오차범위, 통계적 유의성 검증 등으로 불확실성을 객관적으로 제거해나갈 수 있다고 믿은 반면 베이지언 확률 모델에서는 주관적인 추론을 바탕으로 한 “사전확률”을 추가적인 관측으로 “사후확률”로 업데이트 해 나가는 방법으로 불확실성을 제거해 나가려는 접근 방법을 취합니다.

베이즈 추론을 기반으로 한 방법론의 정확도는 일반적으로 머신러닝의 대표적인 방법인 랜덤포레스트나 트리 분류 방법 보다도 높다고 평가받고 있습니다.

이번 포스팅에서는 베이즈 추론의 기본 개념에 대해 알아보고, R을 통해 나이브 베이지언 방법론에 기반한 분류/예측 모델을 만들어 보는 예제를 소개해 드리려고 합니다.

Bayes Classification R
몬티홀 문제 – 어떤 문을 선택해야 스포츠카를 받을 수 있을까?

R을 사용한 베이즈 분류/예측 모델 (Naive Bayes classification in R) 더보기

R을 사용한 영역형 그래프 그리기 – ggplot2 초급

영역형 그래프도 MS Office에서 많이 사용되는 그래프 중 하나죠.

특히 제품군 별로 매출에 기여하는 정도를 누적해서 시계열로 보여주는 그래프는 성과 분석을 위한 가장 기본적인 그래프라고 해도 과언이 아닙니다.

ggplot2에서는 geom_area라는 간단한 요소를 추가해서 선형 그래프를 만들 수 있습니다. 데이터 셋은 계속 기본 데이터인 airquality 셋을 사용하겠습니다.

R을 사용한 영역형 그래프 그리기 – ggplot2 초급 더보기

R을 사용한 꺽은선형 그래프 그리기 2/2 – ggplot2 초급

지난 포스트를 통해서 ggplot2를 사용해서 선형 그래프를 작성하는 기본 원리에 대해서 알아보았습니다.

이 번 포스트에서는 여러 개의 선형 그래프를 그리는 법,  선형 그래프의 색 및 모양을 조정하는 법, 점을 추가하는 법 등에 대해 알아보겠습니다. airquality 데이터셋을 계속 사용합니다.

R을 사용한 꺽은선형 그래프 그리기 2/2 – ggplot2 초급 더보기

R을 사용한 꺽은선형 그래프 그리기 1/2 – ggplot2 초급

지난 포스팅을 통해 ggplot2의 기본 문법과 MS Office에서 가장 자주 사용되는 막대 그래프를 작성하는 방법을 알아보았습니다. 오늘은 MS Office에서 제공하는 다른 그래프 기능인 꺽은선형 그래프를 R에서 만드는 방법을 알아보겠습니다.

선형 그래프는 시계열 자료를 표현할 때 많이 사용되기 때문에 사용 빈도가 높은 그래프 중 하나입니다. R에서 작성하는 법을 알아두면 두고두고 요긴하게 사용할 수 있겠죠?

R을 사용한 꺽은선형 그래프 그리기 1/2 – ggplot2 초급 더보기