평균으로의 회귀 – SKT T1! 롤드컵 우승 다음해에는 왜 포스가 줄어들까?

 

League_Of_Legends_World_Championship_2015_96267

리그오브레전드의 팬이라면 페이커 쎈빠이가 이끄는 SKT T1이
2013년 무서운 기세로 롤드컵을 우승한 바로 다음 해인 2014년도에 엄청난 암흑기를 맞이했던 사실을 기억할 것이다.

2016년 롤챔스 스프링 시즌에서도 진에어 에게 패배하며 왠지 불안한 조짐을 보이고 있는데,
이러한 현상을 설명할 수 있는 재미있는 이론이 있다.

 

사실 첫 해에 어마어마한 실적을 거둔 선수, 연예인 등이 다음 해에 상대적으로 부진한 현상은 사실 너무 흔한 현상이다.
너무나도 다방면에 일반적으로 일어나는 현상이기에 이를 가르키는 용어도 있는데,
이것이 바로 “2년차 증후군(2nd year syndrom)” 혹은 “소포모어 징크스(sophomore jinx)”이다.

5배기통 춤으로 “빠빠빠”를 히트시켰던 크래용 팝이나,
하니가 직캠으로 캐리했던 “위아래” EXID의 2집을 생각하면 이해가 더 쉬울 것 같기도 하다. (생각이 잘 안나니까…)

 

혹자는 이러한 2년차 증후군을 심리학적으로 “중압감에 의한 예견된 실패”라고 해석하기도 하지만,
이보다는 “평균으로의 회귀” 현상이 적용된 것으로 보는게 더 합리적이다.

“평균으로의 회귀(regression toward the mean)”는 19세기 후반 프랜시스 칼턴이 처음 생각해 낸 개념이다.
부모의 키와 자식의 키 사이의 관계를 분석하던 중
키가 극단적으로 큰 아버지를 가진 아들은, 키가 작은 아버지를 가진 아들보다는 키가 크지만, 평균적으로 자기 아버지 보다는 키가 크지 않고,
반대로 키가 극단적으로 작은 아버지의 아들은 대체적으로 키가 작은 편이지만, 자기 아버지 보다는 키가 크다는 현상에 착안한 것이다.

 

평균으로의 회귀
평균으로의 회귀

위 그래프는 아버지의 키(x)과 아들의 키(y)사이의 관계를 Plotting 한 것이다.
(x,y 모두 표준 점수화 하였기 때문에, x축은 아들 키의 평균 점을, y축은 아버지 키의 평균점을 지나는 그래프 이다.)

만약, 아버지의 키와 아들의 키 사이에 100%의 상관관계가 있다면(correlation이 1이라면),
x, y 간의 선형 회귀분석 상관 관계선을 그려보면 위 그래프의 A가 될 것이다.
하지만 여러가지 노이즈(어머니 키, 영양 섭취, 운동 등등)에 의해 아버지의 키와 아들의 키는 100% 정비례 할 수 없으며,
실제 x, y간의 상관관계는 0에서 1사이의 값을 가지게 된다. (= x축과 A선 사이의 어딘가에 그려지게 된다)

따라서 결과적으로는 위 그래프의 B처럼 나타나는 것이다.

조금 더 설명을 해 보자면
위 그래프의 B는 A보다는 x축에 더 가깝게 기울어져 있는데, x축은 바로 아들키의 평균을 의미한다.

x, y 사이에는 1보다 작은 상관관계가 존재하기 때문에 극단적으로 x대비 y가 큰 관측점이 하나 발견된다고 하더라도,
그 다음에 발견되는 관측점은 선 B와 가까운 어떤 점(선 A보다는 평균에 더 가까운 어떤 점)이 될 것이다.
(x, y 사이에 이미 존재하는 상관관계에 의해)

그렇기 때문에 극단적인 관측치 다음에 발견되는 점은 평균에 보다 더 가까운 점이 될 확률이 더 높아지는 것이다.

아버지와 아들 키, 혹은 실력과 시험 성적사이에 아무런 상관관계가 없다면 어떨까?

변별력이 0인, 순전히 운에 의해서만 결과가 좌우되는 시험이 있다고 가정해 보자.
예를 들어 외계어로 씌여져 있는 O, X 10문제를 외계어를 전혀 모르는 학생 100명이 풀게 되었다.
시험이 총 2번이라고 가정할 때, 평균적으로 기대할 수 있는 점수는 50점이 될 것이다.

지적 능력과는 아무런 관계 없이 기대 값이 50점이기 때문에,
첫번째 시험에서 극단적으로 높은 점수를 받은 학생의 다음 시험 결과는 자신의 첫 점수보다는 더 낮을 확률이 높아지는 것이다.

이렇게 평균으로의 회귀 현상은 x, y 사이에 상관관계가 낮을수록 보다 강하게 나타난다.
운이 보다 강하게 작용하는 축구, 야구 등의 스포츠에서 높은 승률을 유지하는 팀을 찾아볼 수 없는 것도 이 떄문이다.

인생지사 새옹지마라는 옛말은 회귀 현상을 예리하게 표현한 말이 아닐까.

참고 자료

1) Wikipedia, https://en.wikipedia.org/wiki/Regression_toward_the_mean
2) Coursera, regression analysis, Johns Hopkins University
3) 헝그리앱, http://www.hungryapp.co.kr/news/news_view.php?bcode=news&pid=39390&catecode=009
4) 네이버 지식백과, http://terms.naver.com/entry.nhn?docId=2176180&cid=51065&categoryId=51065