'2009/04/19'에 해당되는 글 1건

  1. 2009/04/19 Copula 함수를 시작하면서

2009년 4월, 서울의 사람들은 많은 수치들 위에서 살고 있습니다. 사람마다 민감하게 받아들이는 수치도 있고, 잘 알 수 없는 수치도 있습니다. 주식시세에 관심을 가지고 있는 저자는 주식시장이 만들어내는 다양한 수치들을 보게 됩니다. 또, 대중교통을 자주 이용하기에 기름값보다는 지하철요금 인상 뉴스에 민감합니다.


오랜만에 강남역 스타벅스에 왔습니다. 2층에서 강남대로가 내려다 보입니다. 상당히 많은 차들이 오고 가고 있습니다. 이 강남대로 안에 놓여있는 차들의 밀도는 휘발유 가격에 반응하겠지요? 기름값이 오르면 차를 이용하는 사람들이 대중교통을 이용하게 되고 영업을 하는 사람들도 가능한 움직임을 줄이려 할 것입니다. 한편, 강남역 스타벅스의 매출은 수치로써 표현됩니다. 얼마나 많은 커피가 팔리는지가 DB에 저장되고 스타벅스 경영자는 이 수치를 유심히 봐야 할 것입니다. 얼마전 미국에서는 스타벅스 매장의 상당수가 문을 닫았다고 합니다. 2008년부터 시작한 세계금융위기의 영향이라 합니다. 미국의 주요 경제 지표들이 악화되었고 결국 스타벅스 매장도 문을 닫고, 사람들은 실업자가 되었습니다. 실업자가400만을 넘어섰다는 뉴스도 나옵니다. 경제 지표와 스타벅스 매출은 어떤 관계에 있을까요? 그 관계를 수학으로 이야기할 수 있을까요?


미국의 경제위기에 왜 우리가 이렇게 신경을 써야 할까요? 왜 기름값과 환율에 이렇게 민감하게 반응해야 할까요? 경제는 수많은 수치들로 해석됩니다. 경제가 어렵다라는 말은 너무 무책임하기에 많은 수치들로 얼마나 어려운지, 어느 곳이 더 어려운지, 회생이 가능한지 등을 판단하려 합니다. 서울에서 함께 살고 있는 우리네들은 쏟아지는 경제 숫자들을 앞으로 계속해서 보게 되고 슬기롭게 판단해야 합니다.


세계경제 수치들은 서로간에 관계를 가지고 있습니다. 한국의 코스피와 코스닥에 투자하는 사람들은 미국의 다우(DOW)지수도 눈여겨 봅니다. 아래는 3월1일부터 4월까지 미국의 다우지수를 주시하면서 한국의 주식시장에 관한 기사 3개입니다.

다우 7000선 위협, 한국증시 어디로』, 『코스피, 미증시 급락 불구 수급 상황 호전에 '선방'』, 『세계 주목받는 한국증시… 월가도 아침에 코스피부터 본다?


이미 수학을 활용해서 서로 다른 분야에서 파생되는 수치들을 연결시켜 놓았습니다. 이러한 수학적 연결고리가 세상을 함께 움직이게 하고, 빠르게 효율적으로 발전시켜 왔습니다. 하지만, 사용하고 있는 연결고리의 기본 자재인 가우시안적인 시스템은 오래 되었고 교체가 필요하다는 의견을 가진 학자와 사람들이 늘어가고 있습니다. 엄청나게 정보가 빠르게 오고 가고, 계산속도와 정보 저장능력이 기하급수적으로 향상된 오늘날에도 가우시안의 지침을 따르고 있지만, 좀 더 발전적인 기본모델을 찾고자 하는 사람들의 욕심은 난공불락의 가우시안의 성벽을 해체하기 시작했고 새로운 세상으로 나아가려 합니다.


상관계수

코스피 지수, 상하이에 물어봐


위에 연결된 글은 매일경제의 2월 14일 기사입니다. 글 중에 "코스피 지수와 상하이 지수의 연관성을 말해주는 상관계수도 지난해 11월 이후 가장 높지만, 다우지수와의 상관계수는 낮아지고 있습니다." 라는 말이 있습니다. "상관계수가 높다", "상관계수가 낮다" 라는 말을 합니다. 통계적으로는 상관계수는 -1에서 1사이에 정의되어 있습니다. 그리고 상관계수의 절대값이 1에 가까울수록 상관계수가 높다라고 하고 0에 가까울수록 낮다라고 합니다. 코스피 지수와 상하이 지수의 상관계수가 1에 가깝다라는 말은 지수가 함께 올라가고 내려갔다라는 의미입니다. 좀더 1에 가까우려면 등락 비율이 같아져야 합니다. 상관계수가 -1에 가깝다라는 말은 서로 반비례한다고 할 수 있습니다. 기름값과 강남대로의 차들의 밀도의 상관계수가 -1에 가깝다고 한다면, 기름값이 오르면 밀도는 떨어지고 기름값이 내려가면 밀도는 높아진다는 관계가 있다고 해석할 수 있습니다. 다시 말해, 기름값과 밀도의 상관계수가 -1이라면 반대 방향으로 밀접하게 관련된 수치들이라고 합니다. 기름값이 오르면 강남대로의 오가는 차들의 수는 그만큼 줄어들고 기름값이 내려간다면 그만큼 차들의 수는 늘어난다고 말할 수 있겠지요. (주의: 현실에서는 상관계수가 1이나 -1이기는 어렵습니다.)


Gaussian함수를 밀어내는 Copula 함수

Copula 함수는 상관계수의 역할을 분담하고 다른 관점으로 데이터를 분석하도록 도와줍니다. 다변량의 상관관계를 해석하고, 여러 변량간의 관계를 가우시안 관점에서 벗어 날 수 있도록 합니다. 현재의 경제 구조는 가우시안의 룰을 따르고 있습니다. 주어진 데이터는 항상 평균과 분산으로 처리되고, 두 변량의 상관관계는 상관계수 정도 수준에서 다루어 집니다. 하지만, 우리에게 다가 오는 데이터들은 헤아리기 힘들 정도의 다양한 위상을 가진 다변량 데이터입니다. 이들을 가우시안의 정규분포만으로 해석한다면 다양한 가능성을 외면하는 결과를 초래하고 결국 큰 위험을 못보고 지나치게 되는 우를 범할 수 있습니다.

아직 우리의 세상은 평균과 분산으로 분석되고 있습니다. 인간이 만든 경제 구조가 낡은 통계 구조 울타리 안에서 벗어나는 데는 좀더 시간이 필요하고 사회구성원들의 합의와 이해가 요구됩니다. 하지만, 세계 경제 위기가 고착화된 가우시안 세상의 변화를 조금은 가속시킬 수 있으리라고 봅니다. 그리고 Gaussian함수를 밀어내는 선봉에 Copula 함수가 있습니다. 이 함수에 관해 플랜엠을 통해 실험과 공부를 해보겠습니다.


sbpyun.


크리에이티브 커먼즈 라이선스
Creative Commons License