16권통계정보시스템(KOSIS)을 활용한 경제뉴스
- 저자정남구
- 발행LG상남언론재단
- 발행일2003-05-01
- 머리말
- 제1장
통계정보시스템(KOSIS)이란 무엇인가?
- 제2장
KOSIS에서 자료 검색 및 다운받기
- 제3장
통계자료 분석의 실제-도시가계조사
- 제4장
다른 통계에의 응용
- 맺는말
통계정보시스템을 넘어서
머리말
인터넷의 발달은 언론의 취재보도 환경을 크게 바꿔놓고 있다.
정부기관을 비롯해 정보의 일차 생산자들이 각종 자료를 데이타베이스(DB)로 만들고, 이를 온라인을 통해 실시간으로 공개하면서 이제 인터넷의 활용은 취재보도에 필수 요소가 됐다.
인터넷을 활용한 취재는 단순히 정보를 온라인 망을 통해 획득하는 것으로 그치지 않는다.
각종 자료를 컴퓨터 프로그램을 활용해 분석하고, 그 결과를 기사로 작성하는 일도 얼마든지 가능해졌다.
흔히 CAR(컴퓨터를 활용한 취재보도, Computer-Assisted Reporting) 라고 부르는 이런 취재보도 기법은 여러 분야에 활용할 수 있지만, 특히 경제뉴스 분야에서 그 진가를 발휘할 수 있다.
경제 분야의 경우, 가공되지 않은 상태로 공개되는 각종 통계 원자료가 어느 분야보다 많기 때문이다.
그러나 아직까지는 경제기사 가운데 CAR를 활용한 보도는 그리 많지 않은 것이 현실이다.
기자가 직접 자료를 분석하기보다는 보도자료나, 전문가들의 분석결과에 의존해 기사를 작성하는 경우가 아직은 대부분이다.
여기에는 몇 가지 원인이 있는 것 같다. 우선 그날그날 기사 부담이 많은 기자들로서는 직접 원자료를 분석할 시간이 그리 충분하지 못한 것이 한 원인이다.
또 "기자는 직접 분석하기보다는 전문가의 분석결과를 잘 전달하면 충분하다"는 생각도 CAR의 활용을 더디게 하는 것 같다.
하지만 인터넷 시대는 속보경쟁을 넘어서 누가 더 깊이있고 정확한 분석정보를 제공하느냐가 경쟁력이 되는 시대가 될 수 밖에 없다.
그런 방향으로 경쟁이 활성화될 수록 CAR의 활용은 필수가 될 수밖에 없을 것이다.
이 책은 통계청의 종합 통계 데이타베이스인 통계정보시스템(KOSIS)의 통계 원자료를 엑셀(EXCEL) 프로그램을 활용해 분석,가공함으로써 새로운 정보를 생산하고 이를 기사화하는 방법을 다룬 것이다.
구체적으로 말하면, 그동안 그런 방식으로 쓰여졌던 기사들을 예로 들어, 통계정보시스템에서 원자료를 확보하는 것부터 이를 분석해 기사화하는 과정을 상세히 소개한 것이다.
물론 나 자신도 그동안 "도시가계 조사" 통계자료나 "고용통계" 등 당시 현안과 밀접한 관련이 있는 몇몇 원자료만을 분석한 경험을 가졌을 뿐이다.
그러나 통계정보시스템에는 거의 모든 경제관련 데이타가 서비스되고 있고, 통계정보시스템 외에도 경제관련 데이타는 곳곳에 많기 때문에, 이런 기법의 활용 여지는 무한대로 열려 있다고 해도 지나친 말은 아닐 것이다.
앞에서 밝혔듯이 이 책은 통계자료를 가공하는 과정에서 엑셀 프로그램을 이용하는 것을 전제로 하고 있다.
따라서 엑셀 프로그램을 다룰 줄 모른다면 책을 읽기 전에 먼저 엑셀 프로그램의 기본적인 활용법을 익혀두는 것이 내용을 이해하는 데 도움이 될 것이다.
이 책이 빛을 볼 수 있도록 도움을 준 LG상남언론재단에 깊은 감사를 드린다.
2003년 5월
정남구
제1장통계정보시스템(KOSIS)이란 무엇인가?
1) 통계자료의 보고(寶庫), KOSIS
통계정보시스템(KOSIS, http://kosis.nso.go.kr)은 통계청이 운영하는 통계 데이터베이스다.
통계정보시스템에는 통계청을 비롯해 정부기관, 지방자치단체, 그리고 민간단체들이 생산한 거의 모든 통계가 수록돼 있다. 또 국제연합(UN) 및 국제통화기금(IMF), 경제협력개발기구(OECD) 등이 생산한 국제통계도 폭넓게 싣고 있어 국가간 통계자료의 비교에도 활용할 수 있도록 돼 있다.
통계청은 통계정보시스템에 수록된 모든 자료를 온라인 망을 통해 일반에 무료로 제공한다.
통계청은 직접 생산한 자료에 대해서는 실시간으로 자료를 올리고 있다.
월간 및 분기 자료의 경우, 보도자료를 배포한 뒤 데이타베이스에 그 내용을 수록하고, [연합뉴스]에 보도된 직후 일반에 공개하는 것을 원칙으로 하고 있다.
연간 자료나 그 이상인 경우에는 보고서를 배포한 뒤 곧바로 내용을 공개한다.
다만 통계정보시스템에 실려 있는 통계 가운데 통계생산기관이 통계청이 아닌 경우, 자료 업데이트가 조금 늦은 경우가 있다는 점을 기억해야 한다.
예를 들어 관세청이 집계하고, 산업자원부가 언론에 서비스하는 수출입 통계의 경우, 월간 수출입액에 대한 확정치가 발표한 뒤에도 통계정보시스템에는 한동안 잠정치가 실려 있을 수 있다.
따라서 이로 인한 문제를 피하기 위해서는 통계청이 생산하지 않는 통계에 대해서는 통계조사기관의 최근 원자료를 확인해볼 필요가 있다.
통계정보시스템의 가장 큰 장점은 보도자료에 실리지 않은 자료라도 실제 조사된 것이라면 거의 모든 원자료가 실린다는 점이다.
정부기관이 생산하는 보도자료에는 지면의 제약 때문에 일부 조사항목의 통계표만 싣고 있다. 따라서, 통계정보시스템을 활용하지 않고는 얻을 수 없는 자료가 적지 않다.
주제별, 조사별, 통계작성기관별로 색인어 검색을 통해 시계열 자료를 검색하고, 검색한 자료를 엑셀 파일 등의 형태로 내려받을 수 있는 서비스를 제공하는 것이야말로 통계정보시스템의 최대 장점이다.
통계정보시스템의 통계자료를 내려받아 원하는 형태로 가공할 수 있는 것이다.
2) 왜 보도자료만으로는 안되는가?
경제통계와 관련된 언론의 보도는 통계발표 기관이 제공하는 보도자료에 거의 의존하는 것이 현실이다.
통계작성 기관은 해당 통계를 발표하면서, 보도자료에 조사결과를 분석하여 주요특징을 설명하고 있으므로 이를 활용할 수 있기 때문이다.
사실 보도자료에 담긴 내용만을 기사화한다고 해도 제한된 지면에 이를 다 소화하기에 벅찬 것이 현실이다.
그러나 보도자료는 뚜렷한 한계를 갖고 있다. 우선 보도자료는 통계작성 기관의 시각에서 통계내용을 분석한 것이다.
따라서 통계를 해석할 때, 국민들의 관심사보다는 정부기관의 시각에 치우치기 쉽다.
또 통계작성 기관은 지표의 단기적인 변화에 중점을 두는 경향이 있어, 장기적인 추세 변동에 대해서는 적절한 해석을 제공하지 않는 경우가 많다.
결국 기자가 나름의 문제의식을 갖고 통계에 담긴 의미를 따져보려 한다면, 보도자료를 넘어서 통계원자료를 직접 살펴봐야 한다.
대체로 보도자료에는 부록에 통계표를 함께 싣는다.
그러나 조사항목이지만, 보도자료 통계표에는 실리지 않는 것이 적지 않다.
예를 들어, 통계청이 "월간 고용동향"을 발표할 때, 연령대별 실업률과 같은 세부항목의 통계표는 잘 덧붙이지 않는다.
지면의 제약 때문이다. 그런데, 20대의 취업난이 어느 정도인지를 정확히 살펴보고 싶다면, 20대의 실업률, 실업자수, 취업자 수의 변동추이를 모두 함께 살펴봐야 한다.
이런 경우 통계정보시스템이 유일한 자료원이 된다.
이런 식으로 기자 스스로 어떤 문제의식을 갖고 통계 원자료를 가공해 새로운 분석정보를 생산하고자 할 때, 통계정보시스템은 실로 보석같은 존재라고 할 수 있다.
3) 통계정보시스템의 활용한 분석기사의 사례
사례 1. 도시근로자가구 실질소득 변화 분석
제목; 근로자가구 60% IMF전보다 실질소득 줄었다
외환위기를 겪은 지 4년이 지나며 경제는 예전 수준을 되찾았지만, 도시 근로자 가구의 60%는 외환위기 전의 실질소득을 여전히 회복하지 못하고 있는 것으로 밝혀졌다.
또 저소득 근로자 가구일수록 실질소득 이 큰 폭으로 줄고, 고소득층의 소득은 큰 폭으로 늘어나 빈익빈 부익부 현상이 현실화한 것으로 확인됐다.
이런 사실은 2일 [한겨레]가 최근 통계청이 발표한 3분기 도시근로자가구소득통계(10분위별 소득)를 외환위기 전인 1997년 3분기때와 비교한 결과 나타났다.
10분위 소득 통계는 조사대상 가구를 소득규모에 따라 소득이 적은 쪽에서부터 10%씩 10개 계층으로 나누어 계층별 소득변화를 파악한 것이다.
분석결과 도시근로자가구 전체의 실질소득은 4년 전보다 평균 2.65% 늘어난 것으로 나타났다.
그러나 소득 하위 10%(1분위) 계층의 실질소득은 5.1%, 2분위계층은 4.25%, 3분위 계층은 3.5% 줄어드는 등 하위 60% 계층의 실질소득이 감소했다.
또 대체로 저소득 계층일수록 소득감소율이 컸다.
그렇지만 특이하게 가장 큰 타격을 입은 계층은 2001년 가구 명목소득이 평균 197만원인 소득 10분위상 5분위 계층으로 나타났는데, 실질소득이 9.65%나 줄었다.
반면에 최상위 10% 계층은 실질소득이 14.02%나 늘어나 실질소득 증가율이 평균의 5배나 됐다. 이 계층을 제외하면 모든 소득계층의 실질소득 증가율이 평균치보다 낮았다.
이로 인해 계층간 소득격차를 보여주는 10분위 소득배율(최상위 10%계층의 소득을 최하위 10% 계층의 소득으로 나눈 것)은 최근 4년 사이 7.59배에서 9.12배로 커졌다.
아울러 도시근로자 가구의 명목소득은 4년 동안 평균 12.9% 늘어나는 데 그쳤으나, 가계지출은 22.4%나 늘어, 가계의 월평균흑자가 72만3천원에서 65만6천원으로 9.3% 줄어드는 등 갈수록 가계가 쪼들려가고 있는 것으로 나타났다.
한편 지난해 농가의 실질소득은 97년에 비해 11.5%, 어가의 실질소득은 16.3%나 줄어드는 등 농어가는 도시근로자 가구보다 더 생활이 어려워졌다.
[그림1] 도시근로자 가구 소득 10분위별 실질소득 증감률
이 기사는 2001년12월3일치 [한겨레] 1면에 실렸던 것이다.
기사의 핵심내용인 실질소득 변화를 직접 분석해 보기로 한 것은, 통계청 조사에서는 도시근로자 가구의 소득이 빠르게 늘어나는 것으로 나타나고 있는데, 국민들은 소득 증가를 전혀 느끼지 못하고 있다는 지적 때문이었다. 독자들 사이에서는 통계가 조작된 것 아니냐는 불신과 냉소가 팽배했다.
독자들의 그런 반응은 검증해볼 가치가 있었다.
하나는 생활형편을 가늠할 실질소득이 늘었느냐는 것이고, 다른 하나는 가구 소득이 소득계층에 따라 어떻게 변동했는지를 알아보는 것이었다.
우선 통계정보시스템에서 97년3분기와 2001년 3분기의 도시근로자가구소득 통계자료(명목소득)를 엑셀파일 형태로 내려받았다.
그리고 소비자물가지수 통계를 다시 내려받아, 이를 조합하여 실질소득의 변화를 따져보았다.
그 결과 그 사이 명목소득은 크게 늘었음에도 대부분의 가구에서 실질소득은 여전히 외환위기 수준을 회복하지 못하고 있음을 확인할 수 있었다.
또 계층별로 실질소득 증감률을 비교한 결과, 소득 하위계층일수록 실직소득 감소폭이 크고, 최상위 소득자는 실질소득이 큰 폭으로 증가한 것으로 나타났다.
따라서 이 두가지 분석결과를 큰 줄기로 하여 기사를 구성했다.
이에 덧붙여 소득대비 지출 비중, 어떤 항목의 지출이 늘어 가계부담이 커졌는지 따져보았는데, 조세와 사회보험료 등 비소비지출이 외환위기 전보다 평균 38.9%나 늘어난 것으로 밝혀졌다.
또 교통통신비가 51.9%, 광열수도비가 44.8% 늘어나는 등 소비지출중에서도 필수항목의 지출이 늘어나 가계의 저축여력이 크게 줄었음도 확인할 수 있었다.
이런 내용들은 별도의 해설기사에 담았다.
이 기사가 나오기 전까지 많은 사람들이 ‘그럴 것이다’고 막연히 얘기는 해왔지만, 실제 통계자료를 가공해 구체적인 수치로 그 실체를 보여준 것이 이 기사의 특징이라 할 수 있다.
사례 2. 고용시장의 장기 동향 분석
제목;20대 실업률 2년째 7%대, 제조.건설업 고용흡수력 떨어져
통계청이 11일 발표한 2001년 고용동향 자료는 외환위기 뒤 우리 사회에 청년실업이 구조적인 문제로 자리를 잡아가고 있음을 보여준다.
무엇보다 전체실업률이 낮아져도 20대의 실업률은 좀체 떨어지지 않고 있으며, 취업자 수는 오히려 줄어들고 있다. 제조업과 건설업의 고용창출 능력이 떨어지고 있는 것도 청년실업이 예사롭지 않은 문제임을 드러내는 대목이.
△청년실업의 구조화=1998년 외환위기와 함께 큰 폭으로 증가한 청년실업률은 2000년까지는 점차 개선됐으나 2001년 들어 더 이상 호전되지 않고 있다.
20~29살 인구의 실업률은 2000년 7.1%에서 지난해 7.0%로 거의 낮아지지 않았다.
전체 실업률이 2000년 4.1%에서 지난해 3.7%로 낮아진 것을 감안하면 상대적으로 나빠진 것이라고 볼 수 있다.
15~19살 인구의 실업률도 13.3%대로 2000년 13.6%에 비해 조금 낮아지는 데 그쳤다.
특히 전체 취업자 수는 늘어나고 있는데도 20대 취업자 수는 2000년 412만명에서 지난해 402만명으로 오히려 줄었다.
이는 20대 실업률의 하락이 구직활동을 하지 않아 실업자로 계산되지 않는 청년인구가 늘어난 데 따른 것임을 보여준다.
△제조업 고용흡수력 감소=산업별로 연평균 취업자 수를 보면 제조업 취업자 수가 2000년 424만명에서 지난해 419만명으로 1.0% 줄었다.
농림어업 취업자의 경우 농업인구 감소와 함께 4.2% 줄었다. 건설업 취업자 수도 98년 21.3% 감소한 이후 2000년 일시적으로 7.2% 늘어난 것을 빼면 지속적인 감소추세를 보이고 있다.
반면, 도소매 음식숙박업의 취업자는 99년 2.7%, 2000년 3.8%, 지난해 1.6% 늘었다. 특히 사업개인공공서비스업 취업자는 99년 이후 매년 6.0%, 4.5%, 5.8% 늘어나는 등 고용창출에 가장 기여도가 높았다.
△자영업자는 증가추세=개인서비스업 취업자는 지난해 30만명이 늘었는데, 이는 자영업자의 증가와도 관련이 있어보인다.
자영업주는 지난해 17만명(2.8%) 이 늘어나는 등 외환위기 이후의 증가추세가 계속됐다.
임금근로자의 고용의 질을 보면 경기회복과 함께 상용근로자의 비중이 소폭 늘어나고 있는 것으로 나타났다.
상용근로자는 지난해 평균 전체 취업자의 48.7%로 99년의 48.3%에 비해 소폭 증가했다.
이는 공공근로자 등 일용직이 감소한 데 따른 것으로 보인다.
임시직의 경우에는 2000년 전체 임금근로자의 34.3%에서 지난해 34.5%로 그 비중이 조금 늘었다.
한편 주당 36시간 일하는 근로자는 지난해 216만명으로 전년에 비해 4.6% 늘었다.
([한겨레] 2002년1월12일, 9면)
이 기사는 당시 연간 고용동향에 대한 자료가 나온 것을 계기로 외환위기 이후 고용시장의 큰 흐름을 분석해 본 것이다.
통계정보시스템에서 시계열자료를 내려받아 가공함으로써,
1)전체 취업자수는 늘어나고 있는데 20대 취업자는 감소하고 있으며, 청년실업률이 조금 낮아졌으나 이는 수치상의 착시에 불과하다는 점
2) 제조업의 고용창출 능력 하락
3)자영업자의 지속적인 증가 현상 등이 나타나고 있음을 기사화했다.
통계정보시스템은 장기간의 데이타를 모두 제공하기 때문에, 이를 통해 트렌드의 변화를 살펴볼 수 있다.
사례 3. 근로자가구 조세형평성 분석
제목;노동자 조세 형평성 높아져
최근 3년간 저소득 근로자 가구의 세금 부담은 크게 줄고, 고소득 근로자가수의 세금 부담은 커지는 등 근로자가구에선 조세 형평성이 높아진 것으로 나타났다.
통계청이 최근 발표한 2001년 도시근로자가구 가계수지 동향 자료 중 소득 계층별 소득 및 조세지출 내역을 [한겨레]가 3일 분석한 결과, 월평균 소득이 177만4천원인 4분위 소득계층의 경우 지난해 조세지출(월3만716원)이 전년보다 12.0% 줄었다.
소득이 이보다 낮은 3분위 계층(월평균소득 150만원)은 6.7%, 2분위 계층은(121만원) 0.3% 줄었다.
반면 월평균 소득이 205만원인 5분위 계층은 전년보다 세금(4만4537원)이 12.7% 늘어나는 등 중상위 소득계층은 전반적으로 세금 부담이 커졌다.
전년대비 세금액 증가율은 월 소득 321만원 가량인 8분위 계층이 26.5%로 가장 높았다.
7분위 계층(275만원)은 12.9% 9분위 계층(392만원)은 18.0%, 10분위 계층(665만원)은 16.2% 늘었다.
그러나 최저 소득층인 1분위 계층의 경우 소득은 2000년 월 68만3천원에서 지난해 75만7천원으로 10.9% 늘었지만, 세금도 8272원에서 9480원으로 14.6% 늘어나 세제개편의 혜택을 보지 못했다.
세금이 소득에서 차지하는 비율도 고소득층은 커지고 저소득층은 낮아지고 있다.
(중략) 한편 소득규모에 관계없이 소득액의 일정비율을 내는 공적연금과 사회보험료 지출은 99년 소득이 평균 3.5%에서 지난해 3.9%까지 높아져 저소득가구 가계에는 큰 부담이 되고 있는 것으로 나타났다.
( [한겨레] 2002년3월4일, 2면)
이 기사는 외환위기 이후 조세부담률이 갈수록 높아지고 있는 상황에서 정부가 실시한 근로소득세제 개편의 효과가 실제로 중산층과 서민에게 혜택을 주고 있는지 따져보기 위한 것이었다.
통계 원자료는 도시근로자가구소득 통계에서 소득계층별로 월소득과 조세 부문만을 떼어낸 것이다. 분석결과 세제개편의 긍정적 효과가 통계상 의미있는 것으로 나타났다.
어쨌든 한번쯤 따져볼 만한 가치가 있는 소재였다.
제2장KOSIS에서 자료 검색 및 다운받기
1) 통계에. 대한 이해의 중요성
“지역 격차라는 얘기들을 많이 하는데, 실제 시도별로 주민들의 소득은 어떻게 차이가 날까?” 누군가 이런 질문을 던졌다고 해보자.
통계정보시스템을 활용하면 대부분의 통계를 검색할 수 있다는 것은 알고 있다. 그런데, 무슨 통계를 검색해야 그 질문에 대답할 수 있을까?
결론부터 말하면, 지역별 소득을 알아보기 위해서는 통계청이 5년마다 조사해 발표하는 ‘가구소비실태조사’를 살펴봐야 한다. 그것이 유일한 통계조사 자료이기 때문이다.
소득 대신 지역간 경제력 격차를 통해 간접적으로 지역격차를 따져보는 방법도 있다.
이는 ‘1인당 지역내 총생산(GRDP)’을 비교해 보여줌으로써 어느 정도 설명이 가능하다.
물론 특정시점만을 놓고 비교하기보다는 장기간에 걸친 추이를 비교해봐야 한다. 그런데, 1인당 지역내총생산은 통계정보시스템에서도 찾을 수가 없다.
‘추계인구’와 ‘지역내총생산’ 통계수치를 각각 찾아 지역별 추계인구로 지역내총생산을 나눠줌으로써 ‘1인당 지역내 총생산’을 구해야 한다.
통계정보시스템을 잘 활용하려면 이처럼 개별 통계에 대한 이해가 선행돼야 한다. 그렇지 못하면, 통계의 소재를 알기도 어려울 뿐더러, 통계 원자료를 분석하기란 거의 불가능한 일이다.
그러나 그것이 말처럼 쉽지 않다. 통계법에 의해 승인받은 통계만 해도 438종(2003년4월1일 현재)에 이르기 때문이다.
그 많은 통계를 미리 다 공부하고 시작할 수는 없는 노릇이다.
다만 실제 통계자료들을 자주 검색해봄으로써 통계조사 자체에 대한 이해를 높이는 것이 통계정보시스템을 잘 활용하는 지름길이라는 점을 먼저 지적해두고 싶다.
이 책은 자료의 확보와 가공방법에 대해 통계청이 분기별로 실시하는 ‘도시가계조사’를 예로 들어 설명할 예정이다. 따라서 도시가계조사에 대해서는 미리 설명이 필요할 것이다.
도시가계조사는 통계청이 분기별로 조사해 발표한다.
1963년부터 실시하고 있는 이 통계조사는 도시가구의 생활수준실태와 변동사항을 파악하기 위해 가계의 수입과 지출을 항목별로 조사한 것이다.
조사대상은 2002년까지는 ‘근로자 가구’만을 대상으로 하였고, 그것도 ‘도시’ 가구만을 대상으로 하고 있어 모든 근로자가구를 포괄하지는 못한다.
또 1999년까지는 근로자가구와 사무직가구를 별도로 조사했으나, 지금은 사무직가구에 대한 통계는 따로 내지 않는다.
도시가계조사는 전가구 평균통계만이 아니라, 가구를 10개의 소득계층으로 나눠 1분위부터 10분위까지 소득계층별로 통계를 낸다.
따라서 소득계층간 소득의 격차나, 지출의 변동 등을 파악하는 데 매우 유용하다.
소득계층별로 소득과 지출을 조사하는 국내 통계는 ‘도시가계조사’가 현재는 유일하다.
주요 조사내용은 가구원수, 가구당 취업자수, 주거에 관한 사항(주택 소유형태) 및 자동차 보유 여부, 소득원별 소득, 항목별 지출 등이다.
따라서 이 통계를 세부적으로 분석하면 계층간 소득(근로소득, 경상소득 등, 총소득) 격차나 가계수지 현황을 한눈에 파악할 수 있다.
또 주택소유비율의 변화, 지출항목별(조세, 사회보험료, 통신비, 월세 등) 지출 비중의 변화를 파악할 수 있으며, 이와 관련한 계층간 차이도 따져볼 수도 있다.
도시가계조사와 비슷한 통계조사로는 ‘가구소비실태조사’가 있다.
통계청이 5년마다 가구의 소득과 소비, 내구재 및 자산의 보유실태를 조사하는 이 통계자료는, 계층간 차이는 알 수 없지만 지역별(시도별) 차이를 알 수 있다.
가장 최근의 조사는 지난 2000년에 실시됐다.
2) 자료의 검색
통계정보시스템은 통계를 화면상에서 직접 검색할 수도 있다.
또 이를 파일 형태로 내려받을 수 있도록 하고 있다.
검색은 필요한 데이타가 적은 경우에 활용하고, 파일 내려받기는 데이타를 필요한 형태로 가공할 때 활용한다.
[그림2] 통계정보시스템 홈페이지
[그림2]에서 보듯이 통계정보시스템은 검색어를 통해 자료를 검색할 수 있는 기능을 제공하고 있다.
한편으로 통계조사 내용을 직접 찾아가는 방식으로 자료탐색을 할 수 있도록 하고 있다.
검색어를 통한 검색방식은 화면상에서 간단한 데이타를 확인하고자 할 때 쓴다.
예를 들어 ‘가구&소득’을 검색어로 넣으면, 이와 관련된 통계 테이블 목록이 [그림3]과 같이 열거된다.
[그림3] ‘가구&소득’으로 검색한 경우
그러나 목록이 너무 많이 나오기 때문에 이런 식으로 찾고자 하는 통계를 찾아내기란 쉽지 않다.
실제로 ‘가구&소득’을 검색하면 1백개가 넘는 목록이 나온다.
검색어 검색은 내가 찾고자 하는 통계가 어떤 통계조사에 들어있는 지를 확인하는 데 도움을 받을 수 있을 뿐이다.
통계조사 내용을 직접 찾아들어가는 방식은 주제분류별로 탐색하는 방법과 통계조사별로 탐색해가는 방법이 있다.
통계조사에 대해 잘 아는 사람이라면 통계조사별 탐색 쪽이 빠르다.
통계청이 분기별로 실시하는 도시가계조사의 데이타를 실제 검색해보자.
주제분류별 탐색에서는 ‘가계소득 소비 자산’ ->‘도시가계 소비 지출’로 들어가면 ‘도시가계조사’가 나온다. 통계조사별 탐색의 경우 곧바로 ‘도시가계조사’를 누르면 같은 화면이 나오게 된다.
3) 세부 지표 찾기
통계정보시스템은 하나의 통계조사를 찾으면, 거기에서 세부적인 부분으로 연속검색을 할 수 있게 돼 있다.
예를 들어 도시가계조사는 세부 통계 테이블 목록이 [그림4]와 같이 열거된다.
[그림4] 도시가계조사 세부 항목
이중 가장 위쪽에 나오는 ‘가계수지 기본통계표’는 글자 그대로 도시가계조사의 기본항목을 중심으로 데이타를 모아놓은 것이다.
즉, 가구원수, 취업자수, 가구주 연령, 주택소유비율, 소득, 지출 등에 대한 데이타를 볼 수 있다. 기억해야 할 것은 이 통계는 도시가계 ‘평균값'들을 모아놓은 것이라는 점이다.
가계수지 기본통계표를 눌러 나온 화면이 다음의 [그림5]이다.
[그림5] 세부통계가 있는 경우
그런데 [그림5]를 잘 보면 경상소득이란 항목 앞에 ‘+’ 표시가 돼 있는 것이 눈에 띈다.
경상소득만이 아니라 아래로 계속 내려가면 소비지출, 비소비지출 항목에도 그런 표시가 돼 있다. 이는 그 항목의 경우, 더 세부적인 통계가 있다는 것을 표시하고 있다.
경상소득의 경우, 근로소득, 사업 및 재산소득, 이전소득 등으로 다시 세분돼 있다. 또 이렇게 세분된 항목에 들어가면 다시 ‘근로소득'은 더 하위조사항목이 있다는 표시가 돼 있다.
소비지출은 식료품, 주거비, 광열수도비 등으로, 비소비지출은 조세, 공적연금, 사회보험료 등으로 세분돼 있다.
화면상에서 세부항목을 보고 싶다면, 해당 항목을 더블클릭하면 된다. 각 항목의 □에 체크(√)를 하고 검색을 눌러도 체크한 항목들의 세부항목을 볼 수 있다.
그런데, 이렇게 할 경우 한 가지 문제가 생긴다. 체크한 항목들의 세부항목은 볼 수 있지만, 애초 화면에 있던 대분류(또는 중분류) 항목의 통계들은 이제 화면에서 사라져버리는 것이다.
원래의 대분류 항목 통계들까지 함께 한 화면에서 보고 싶다면 어떻게 해야할까?
세부항목이 별도로 없는 다른 항목들에도 □에 모두 체크(√)를 한 뒤 ‘검색’을 눌러야 같은 화면에서 모든 데이타를 함께 볼 수 있다. 수고스럽지만 반드시 그렇게 해야만 한다.
뒤에서 다시 설명하겠지만, 통계자료를 엑셀파일로 내려받는 경우에도 이런 과정을 거쳐야 한다.
‘도시가계조사’의 통계 테이블 목록에서 두 번째로 열거된 것은 ‘소득10분위 가계수지 항목별‘이다.
이 목록은 통계를 소득 계층별로 검색할 수 있게 해놓은 것이다. 이를 클릭([그림6])하면 평균과 함께 1분위에서 10분위까지 검색할 수 있는 항목이 열거돼 나온다.
[그림6] 소득10분위별 가구당 월평균 가계수지
모든 소득계층의 가계수지를 항목별로 파악하고자 한다면 각각의 □간에 모두 체크(√)를 하고 검색을 누른다.
그러면, 앞에서 검색한 바 있는 가계수지 기본통계표의 통계자료가 이번에는 소득계층별로 화면에 출력돼 나온다. 맨 위쪽이 도시가계 평균이고, 그 아래쪽에 1분위 소득계층부터 10분위까지 세로로 나열돼 있다.
화면에 나와있는 것보다 더 세부적인 항목의 통계를 보는 방법은 앞에서 설명한 바와 같다.
소득계층별로 경상소득의 하위조사항목들을 보고 싶으면, 모든 소득계층의 ‘경상소득’에 일일이 체크(√)를 하고 검색을 누른다.
이 때도 경상소득 항목들에만 체크(√)를 했다면 다른 통계들은 화면에서 모두 사라지게 된다.
경상소득의 세부항목을 클릭한 이후, 화면을 보면 ‘근로소득’ 앞에는 ‘+’ 표시가 돼 있음을 볼 수 있다.
이는 다른 소득들은 그렇지 않지만, 근로소득은 더 세부적으로 분류돼 있다는 표시이다. 실제 근로소득을 클릭하면 ‘가구주 소득’, ‘배우자 소득’, ‘기타 가구원 소득’으로 더 세분돼 있음을 볼 수 있다.
4) 시계열 데이타 검색
지금까지의 검색은 특정 시점의 자료만을 대상으로 한 것이었다.
그러나 통계정보시스템에서 데이타를 얻는 것은 대개 중장기적인 추세를 분석하기 위함이다. 또는 과거 특정시점과 비교해, 현재의 상황이 어떻게 달라졌는지를 비교하기 위한 것이다.
따라서 특정 시점의 통계보다는 시계열자료를 찾아야 하는 경우가 훨씬 많다. 시계열 자료를 얻기 위해서는 먼저 얻고자 하는 통계항목들을 지정하여 화면에 출력시킨 뒤, 기간만 새로 설정해주면 된다.
[그림7] 기간 설정
기간 설정은 [검색]의 왼쪽에 마련돼 있다.
우선 ‘주기’는 통계자료를 어떤 주기로 제공할 것인가를 묻는 것이다. 매월 발표하는 통계의 경우, 분기별, 연간 통계자료도 선택할 수 있다. 분기별 발표통계는 분기별 통계와 연간자료를 제공한다.
주기를 선택한 뒤 자료 제공 기간을 설정해 넣으면 된다. 선택한 기간 동안의 데이타를 화면에 다 출력하고 싶으면 ‘검색’을 누른다. 화면에서 볼 필요없이 엑셀파일로 곧바로 내려받으려면 ‘자료받기’를 클릭하면 된다.
5) 엑셀파일로 받기
원하는 항목을 설정하고, 주기와 기간을 설정한 뒤 검색을 누르면 화면에 검색하고자 하는 통계들이 나타나게 된다. 그러나 이 자료는 프린트를 해서 출력하기도 어렵고, 그 자체로 가공하는 것은 아예 불가능하다.
통계자료를 가공하기 위해서는 통계처리 프로그램에서 쓸 수 있는 파일로 내려받아야 한다. 통계정보시스템은 자료를 text파일이나 excel파일로 내려받을 수 있는 기능을 제공하고 있다.
현재 화면에 떠 있는 모든 통계를 파일로 내려받기를 원할 경우 ‘자료받기’를 클릭한다. 그러면 다음과 같은 창이 뜨는 데, 조건이 맞는지 확인한 뒤 ‘자료받기’을 클릭하면 된다.
[그림8] 내려받기 창
내려받기 창을 보면, ‘받기시작’이라고 돼 있는 부분도 있다. 이곳을 클릭하면, 내려받은 엑셀파일이 화면 상태에서 열리게 된다.
그러나 ‘받기시작’ 대신 ‘자료받기’를 클릭하라고 하는 것은 내려받은 자료를 컴퓨터에 저장한 뒤 이를 재가공해야 하기 때문이다.
한편 ‘자료받기’를 통해 내려받은 파일을 저장할 때는 반드시 파일명은 새로 바꿔쓰는 것이 좋다. 통계정보시스템은 이용자가 내려받는 파일의 이름을 모두 'sws_999'로 하고 있어서, 이름을 바꾸지 않으면 이미 내려받은 다른 파일을 지워버릴 위험이 있기 때문이다.
한편, 통계정보시스템은 ‘자료받기’ 외에 화면상에서 [장기시계열], [자료정렬], [자료분석] 기능을 제공한다. ([그림7] 참조) 파일을 직접 내려받아 가공하는 경우 이 기능을 활용할 필요는 없지만, 참고삼아 알아둘 필요는 있을 것이다.
[장기시계열]은 표시로 지정한 특정항목에 대해 장기간의 시계열 데이타를 별도 창을 열어 보여준다.
[자료정렬]은 지정한 항목의 데이타를 내림차순, 혹은 오름차순으로 재배열해 보여준다.
[자료분석]은 화면에 나타난 자료가 시계열 자료일 경우, 전년동기대비 증감, 또는 증감률로 변환시켜 볼 수 있게 해준다.
제3장통계자료 분석의 실제-도시가계조사
1) 어떤 데이타가 필요한가?
통계정보시스템을 활용해 경제뉴스를 만들어가는 과정은 다음과 같은 순서로 이뤄진다.
먼저, 문제를 제기하는 과정이다.
“근로자가구의 평균 소득은 계속 늘고 있는데, 왜 저소득층은 살기가 갈수록 어려워진다고 하는가? ”현장에서 느끼는 청년실업은 매우 심각한데 청년실업률은 왜 낮게 나온가?“ 등이 그 예일 것이다.
그 다음은 그 문제를 풀어줄 통계자료를 찾는 것이다. 지금까지 우리는 통계정보시스템에서 어떻게 자료를 검색하고, 필요한 데이타를 엑셀파일 형태로 내려받을 수 있는지 살펴보았다.
마지막 과정은 실제 통계를 가공하고 분석하는 것이다. 실제 통계의 분석과정에서 필요한 것은 엑셀 프로그램을 능숙하게 활용하는 능력이다. 경험으로 본건대, 엑셀 프로그램을 능숙하게 활용할 수만 있다면, 어떤 데이타를 내려받아 분석해 하나의 결론을 도출하기까지 길어야 10분 안팎이면 끝난다.
여기에서는 이 책의 맨 앞에서 통계정보시스템을 활용한 경제뉴스의 사례로 든 ‘도시근로자가구 실질소득’을 예로 들어 구체적인 분석 과정을 설명하려고 한다.
이 기사의 문제의식은 애초 ‘도시근로자 가구의 실질소득이 외환위기 전과 비교해 어떻게 변했을까?’ 하는 것이었다. 그런데, 실제 분석을 진행하는 과정에서 질문이 계속 이어졌다. “저소득층일수록 실질소득이 크게 줄고, 고소득층은 실질소득이 크게 늘었는데, 그렇다면 그 이유는 무엇일까?” “ 소득 외에 지출내용은 어떻게 달라졌을까?”
이제 구체적인 분석과정을 살펴보자.
2) 자료받기
가. 실질소득과 소비자 물가지수
도시가계조사에 나타난 소득은 명목소득이다. 그러므로 과거 특정시점과 현재의 실질소득을 비교하려면 물가상승률을 감안해 각각의 명목소득들을 실질소득으로 바꿔줘야 한다.
예를 들어 외환위기 이전(1997년3분기)과 2001년3분기의 실질소득을 비교한다고 해보자. 실질소득 변화를 비교하는 방법은 크게 두 가지가 있을 수 있다.
하나는 각 시점의 명목소득들을 해당 시점의 소비자물가지수로 나누어, 실질소득들을 먼저 구하는 것이다. 그리고 이를 비교해 실질소득이 어떻게 변했는지를 알 수 있다.
다른 하나는 현 시점(2002년3분기)의 명목소득에 ‘기준시점의 물가지수/현재의 물가지수’를 곱하여 값을 산출한 뒤, 이를 기준시점(1997년3분기)의 명목소득과 직접 비교하는 방법이 있다.
어느 쪽이든 실질소득을 비교를 위해서는 소비자물가지수 통계를 먼저 통계정보시스템에서 내려받아야 한다.
소비자물가지수는 통계정보시스템 홈페이지에서 ‘통계조사별-소비자물가지수-기본분류지수’ 순으로 찾아들어가면 된다.
[그림9] 소비자 물가지수 자료 받기
[그림9]는 ‘기본분류지수’를 클릭한 뒤 나온 화면에서 필요한 데이타를 내려받는 과정이다.
왼쪽에 세로로 나열된 세부항목에서 필요한 것은 ‘총지수’ 뿐이다. 또 오른쪽으로 열거된 항목중 시도별 소비자물가 상승률도 필요가 없으므로 ‘전도시’에만 체크를 했다.
다음에 할 일은 기간설정인데, 도시가계조사가 분기별로 발표되는 통계이므로 여기에서도 ‘분기’를 선택하였고, 도시가계조사의 데이타를 내려받을 ‘97년3분기에서 2001년3분기’로 기간을 설정했다.
이 상태에서 ‘자료받기’를 누르면 엑셀 파일로 소비자물가지수 시계열 데이타를 내 컴퓨터에 저장할 수 있다.
나. 도시가계조사 기본 데이타 자료받기
소득계층별로 실질소득 변동을 따져보고자 한다면, 필요한 데이타는 ‘소득’ 뿐이다. 그런데, 분석에 앞서 한 가지 생각해야 할 문제가 있다.
도시가계조사에서 소득이라 하면, 총소득을 말한다. 그런데 총소득은 경상소득과 비경상소득으로 나뉜다. 비경상소득이란 퇴직금 일시불, 복권당첨금, 상속금 등을 말하는데, 이를 제외한 경상소득만을 비교할 것인지, 아니면 이를 포함한 총소득을 비교할 것인지 먼저 결정해야 한다.
또 비경상소득을 제외하기로 한 경우에도, 경상소득은 근로소득, 사업 및 부업소득, 재산소득, 이전소득 등으로 나뉘므로 이중 근로소득만을 비교할 지, 경상소득 전체를 비교대상으로 할지 결정해야 한다.
여기에서는 총소득을 일단 비교대상으로 하기로 한다.
이제 ‘1997년3분기부터 2001년 3분기’까지 ‘도시근로자 가구의 총소득’ 통계를 먼저 엑셀파일로 내려받아보자.
먼저 통계정보시스템 홈페이지에서 ‘통계조사별-도시가계조사-소득10분위/가계수지항목별’ 순으로 들어간다.
[그림10] 도시가계 조사 파일 내려받기
이어 [그림10]과 같이 소득계층을 평균에서부터 10분위까지 모두 체크하고, 검색을 누른다.
그러면 맨 위에 평균, 그리고 그 아래 1분위부터 10분위까지 데이타가 나온다.
이 상태에서 기간설정을 하고 ‘자료받기’를 클릭하면 원하는 데이타를 엑셀파일로 내려받을 수 있다.
참고로, 경상소득만을 비교한다고 해서 평균부터 시작해 1분위~10분위까지 일일이 ‘경상소득’에 체크를 하고 검색을 누른 뒤 자료받기를 하는 것은 현명한 일이 못된다.
일단 엑셀파일로 내려받은 뒤 불필요한 부분을 제거하거나, 필요한 부분만 따로 모아 분석하는 것이 더 편하기 때문이다.
3) 실질소득 증감율의 계산
엑셀프로그램을 본격적으로 활용하는 것은 이제부터다. 아쉽게도 이 책에서 엑셀 프로그램 활용법을 일일이 설명할 수는 없다. 다만 분석과정에서 필수적인 활용법만을 괄호에 설명하기로 하겠다.
다음 [그림11]은 97년3분기~2002년3분기까지 도시가계조사 자료를 내려받은 것이다.
(참고/엑셀프로그램을 열어 불러오기를 하려고 할 때, 이 파일이 발견되지 않는 경우가 있다.
이는 사용하는 엑셀프로그램의 버전 때문인 듯하다. 이런 문제가 생겼을 때는 먼저 엑셀프로그램을 실행한 뒤 파일열기를 할 때 대상을 ‘모든 파일’로 바꾸어, 내려받은 파일을 찾으면 된다.)
[그림11] 도시가계 조사 기본통계 내려받은 엑셀파일
먼저 할 일은 이 파일을 복사해 새 파일로 저장하는 일이다.
그 이유는 내려받은 파일은 시트가 단 1개 뿐이라는 점 때문이다. 통계자료를 가공하기 위해서는 대체로 여러 개의 작업 시트가 필요하다.
또 앞에서 설명한 것처럼 엑셀 프로그램의 버전이 달라, 다음에 다시 이 파일을 열 때 불편함을 없애기 위해서다.
복사해 새로 저장하려면 작업시트에서 맨왼쪽, 맨 위의 셀을 클릭한다. 그러면 시트의 색깔이 바뀌게 된다.
그 상태에서 ‘ 편집-복사(또는 Ctrl-C)’를 하여, ‘새 파일 열기(Ctrl-N)’를 하고, 새 시트에 ‘붙여넣기(Ctrl-V)’를 하여 저장한다.
(참고/ 엑셀프로그램에서 시트 수를 늘리는 방법은 ‘도구-옵션-일반’을 차례로 클릭한 뒤 ‘새통합문서의 시트수’를 조절하면 된다)
복사해 새로 저장한 화면을 열면 시트 수가 늘어나 있을 것이다. 다음 작업순서는 다음과 같다.
가) 작업시트에서 불필요한 데이타를 제거한다.
먼저 눈에 띄는 것은 ‘사무직 가구’의 소득이다.
이는 99년까지만 별도로 통계를 냈기 때문에 2000년 이후에는 무의미하게 됐다.
(참고/엑셀 프로그램에서 불필요한 데이타를 제거하는 방법은 두 가지다. 시트 형태는 그대로 둔 채 데이타만 지우려면 지울 범위를 지정한 뒤 delete 키를 누른다.
그렇지 않고 시트에서 열이나 행 자체를 아예 삭제하려면 삭제할 범위를 지정(맨 위쪽의 열 번호를 클릭해 삭제할 열을 지정, 행은 맨왼쪽의 행번호를 클릭해 지정)한 뒤 ‘편집-삭제’를 한다.)
나) 평균부터 10분위까지 계층별로 소득(총소득) 데이타만 남기고 다른 데이타도 모두 삭제(편집-삭제 기능 이용)한다.
주의할 것은 이렇게 불필요한 데이타를 다 지워가다 보면, ‘소득’ 자료가 몇 분위 계층의 것인지 알아보기 어려워지는 수가 있다.
소득 앞에 어느 소득계층의 소득인지가 명시돼 있지 않기 때문이다. 불필요한 자료를 지워가는 과정에서 ‘소득’ 항목에 계층을 표시해줘야 한다.
이 작업이 끝나면 시트에는 맨 위에 도시근로자가구 평균 소득(97년3분기~2001년3분기), 그 다음에 1분위, 2분위 순서로 소득이 나열되게 된다.
다) 소비자물가지수 파일을 열고, 통계내용을 복사해서 현재 작업시트에 시점이 일치하도록 붙여넣는다. 이어 맨 위쪽에 새로운 행을 삽입해 데이타의 이름을 달아준다.
여기까지 한 것이 [그림12]이다.
[그림12] 실질소득 계산을 위한 데이터 결합
라) [그림12]에서 소득 데이타와 소비자물가지수 데이타의 시점이 일치한다면 D열은 지워버려도 무방하다. 그리고 평균에만 복사돼 있는 소비자물가지수 데이타를, 소득계층별 데이터 옆에 차례로 복사해 넣는다.
마) 함수식을 이용해 오른쪽 열에다 실질소득을 계산한다.
실질소득 계산법은 ‘소득(명목소득)’/‘소비자물가지수’*100을 하면 된다.
현재 소비자물가지수는 2000년=100이므로 실질소득이란 ‘2000년 화폐가치를 기준으로 한 실질소득’이라는 게 정확한 표현이다.
(함수식 이용법은 엑셀 프로그램 활용법에 대한 별도교재를 참고하는 것이 좋을 것이다)
[그림13] 실질소득의 계산식
바) 이런 방식으로 실질소득을 모두 계산한다.
(참고/엑셀프로그램에서 계산식을 적용한 셀에 커서를 대면, 커서가 굵은 십자가 모양으로 바뀐다. 커서를 그 셀의 오른쪽 아래부분으로 옮기면 커서가 가느다란 십자가 모양으로 다시 바뀐다. 이 상태에서 마우스를 클릭해 아래로 천천히 끌어내리면 아래 셀에도 같은 계산식이 계속 적용된다.)
사)2001년3분기와 1997년3분기 실질소득을 비교해 증감율({2001년3분기 실질소득/1997년3분기 실질소득}-1)을 계산한다.
[그림 14]는 2001년3분기 도시근로자가구의 실질소득이 외환위기 전인 1997년3분기에 비해 -0.023, 즉 2.3% 줄었음을 보여주고 있다. 이런 식으로 전 소득계층의 실질소득 증감율을 계산한다.
[그림14] 실질소득 증감율 계산
4) 결론의 도출과 기사화
지금까지의 분석과정을 종합해 요약하면 다음과 같은 데이타가 도출된다.
통계 분석의 결론은 다음과 같다.
“외환위기 전과 비교할 때 도시근로자가구의 실질소득은 평균 2.3% 줄었고, 소득이 늘어난 계층은 소득 상위 10% 뿐이다. 소득이 낮은 계층일수록 실질소득 감소율이 크고, 소득이 높은 계층일수록 실질소득 감소율이 작다. 최상위 계층은 실질소득이 큰 폭으로 늘었다. 빈부의 격차는 현격히 커졌다. ”
분석결과 나타난 수치는 이 책의 맨 앞에서 예로 든 실제 분석기사의 내용과는 약간 차이가 난다. 전반적으로 저소득 계층의 실질소득 감소율이 기사에 실렸던 것보다 더 크다. 이는 이 책에서는 계산방식을 당시와 조금 달리했기 때문이다.
실제 기사를 쓸 당시에는 물가지수가 1995년=100이었다. 이 때문에 분기별 명목소득을 각각 실질소득으로 환산해 실질소득 증감율을 따지는 대신, 2001년3분기의 명목소득에 [2001년 3분기 물가지수/97년 3분기 물가지수]를 곱해 얻은 소득을 1997년3분기 소득과 비교해 실질소득 증감율을 계산했다. 이 때문에 오차가 있었던 것으로 보인다.
어쨌든 이번에 새로 계산한 방식이 실질소득 증감율을 따지는 데는 더 정확한 것으로 판단된다.
5) 추가적인 분석
가) 소득격차의 추이 분석
실질소득의 증감율을 비교해보지 않더라도, 도시근로자가구 사이에 빈부격차가 커졌다는 것은 이미 널리 알려진 일이다. 이를 구체적인 수치로 따져보기 위해서는 고소득층의 소득이 저소득층의 몇 배인지를 계산해보면 된다.
보통 쓰는 방법은 ‘9분위계층과 10분위 계층의 소득합계’가 ‘1분위 계층과 2분위 계층의 소득합계’의 몇배인지(5분위 소득배율)를 계산해보는 것이다. 또 최고소득계층인 10분위 계층이 1분위 계층 소득의 몇배인지를 계산하기도 한다.
시계열 자료를 살펴보면 소득격차가 확대되고 있는지, 줄어들고 있는지 추이를 알 수 있다.
[그림15]는 엑셀 프로그램을 잉요해 5분위 소득배륭를 계산한 뒤 이를 그래프로 나타낸 것이다.
5분위 소득배율은 외환위기를 계기로 급격히 올라간 뒤 등락을 거듭하고 있다. 이는 외환위기 이후 빈부격차가 추세적으로 확대되고 있는 것은 아니라는 점을 보여준다.
[그림15] 5분위 소득배율의 계산
나) 소득격차의 확대원인에 대한 분석
소득격차가 확대된 원인에 대해서는 그것이 경상소득의 차이에서 비롯된 것인지, 비경상소득에서 비롯된 것인지를 따져볼 수 있다.
또 경상소득에서 비롯된 것이라면 그것이 근로소득의 격차에서 비롯된 것인지, 다른 소득의 차이 때문인지를 분석해볼 수 있다.
먼저 실질경상소득 증감율을 계산해, 이를 총소득(실질) 증감율과 비교해보고, 이어 실질근로소득 증감율을 계산해 이를 총소득(실질) 증감율 및 경상소득(실질) 증감율과 비교한다.
다만, 근로소득(실질) 증감율을 계산하려면 앞에서 내려받은 데이타만으로는 안되고, 새로운 데이타를 내려받아야 한다.
통계정보시스템 홈페이지에서 ‘통계조사별’-‘도시가계조사’-‘소득10분위/가계수지항목별’ 순으로 들어간다. 이어 앞의 [그림10]에서와 같이 평균에서부터 10분위까지 모두 □에 체크(√)를 하고, 검색을 누른다. 다음에는 평균에서부터 아래 10분위 계층에 이르기까지 ‘경상소득’에 체크를 한 뒤 다시 검색을 누른다. 마지막으로 모든 소득계층에 걸쳐 ‘근로소득’에 체크를 한 뒤 검색을 누른다. 이 화면에서 기간을 설정하고 자료받기를 하면 근로소득에 대한 시계열 자료를 엑셀파일로 받을 수 있다.
참고로, 2002년3분기 도시가계조사를 1997년3분기 조사와 비교한 결과, 계층간 소득격차 확대는 대부분 근로소득 격차확대에서 비롯되는 것으로 나타났다. ([한겨레21] 2003년01월08일 제442호 ‘부자 아빠, 꿈도 꾸지마’ 참조. )
다) 도시가계조사를 통해 분석가능한 기타 항목
도시가계조사는 조사항목이 매우 다양하기 때문에 도시가계의 삶의 실태에 대한 다양한 정보를 제공한다.
예컨대 가계 지출에서 특정 항목이 차지하는 비중의 변화를 분석해볼 수 있다. 가계총소득에서 조세가 차지하는 비중, 사회보험료가 차지하는 비중, 또는 통신비가 차지하는 비중 등을 분석할 수 있다.
또 도시가계의 평균(또는 소득계층별로) 자가소유 비율의 추이, 자동차 소유비율의 추이 등도 도시가계조사 통계자료를 통해 분석할 수 있다.
도시가계의 평균 자가소유비율 추이를 살펴보는 것은 간단하므로 여기에서 직접 찾아보기로 한다.
‘소득10분위별 가구당 월평균 가계수지’ 통계에서 맨 위쪽 평균 부분에서 ‘주택소유가구비율’에 체크를 하고 ‘검색’을 누른 뒤 기간을 설정하면 다음과 같은 내용이 화면에 출력된다.
[그림16] 도시가계 주택소유가구비율 추이
[그림16]을 보면, 주택소유가구비율에 대한 통계는 98년 이후의 것만 나온다는 것을 알 수 있다.
그 이전에는 조사항목이 아니었다. 2000년1분기 이후 통계가 없는 것은 사무직가구의 것이다. 사무직 가구에 대한 별도의 통계는 1999년까지만 이뤄졌다.
자료를 살펴보면 주택소유비율은 98년4분기(58.41%)에 가장 높았다가 조금씩 낮아지다 외환위기 이후 경기가 절정이던 2000년1분기에 58.26%까지 회복된 것으로 나타나 있다.
이후 주택소유비율은 다시 계속 낮아져 2002년1분기에는 55.71%까지 떨어졌다. 그 뒤로는 주택소유비율이 조금씩 높아지고 있다. 원인은 은행들이 주택담보대출을 크게 확대하고, 정부도 생애최초주택구입자금 대출 등 건설경기부양책을 쓴 것이 영향을 준 것으로 보인다.
이 데이타를 ‘자료받기’를 하여 엑셀파일로 내려받을 수 있으므로, 엑셀프로그램을 활용하면 말끔하게 그래프로 추이를 볼 수 있다.
한편, 도시근로자가구의 자가소유비율 추이를 정부가 발표하는 주택보급률 추이와 비교해보는 것도 의미가 있다. 실제로 통계정보시스템을 활용해 이를 분석한 기사가 [경향신문] 2002년3월2일치 1면에 실린 적이 있다. [경향신문] 기사는 도시가계 평균만이 아니라, 소득계층별로도 주택소유비율을 따져가면서, 주택정책의 근본적인 문제점을 지적하고 있다.
제목:주택보급률 100% 육박했다지만…내집보유 근로자 갈수록 줄어든다
주택보급률이 100%에 육박하고 있지만 근로자의 주택 소유 비율은 갈수록 낮아지고 있다. 특히 전.월세난 심화에 따라 월세 지출 증가율이 2년 연속 18, 19%나 되면서 서민층 생활고를 한층 가중시키고 있다.
이는 최근 아파트값 상승 속에서 정부가 주력하고 있는 30만가구 주거단지 조성 등 주택 공급위주 대책에 한계가 있음을 시사하는 것으로 풀이된다. /관련기사 5면
1일 기획예산처에 따르면 전체 주택수를 총 가구수로 나눠 산출하는 주택보급률은 1998년 92.4%에서 지난해 95.9%로 해마다 높아졌고 올해는 98.0%로 높인다는 것이 정부 계획이다.
그러나 통계청 조사 결과 도시근로자 가구의 평균 주택 소유 비율은 외환위기 직후인 98년 56.93%에서 99년 57.89%로 높아졌다가 2000년 57.48%로 낮아진 뒤 지난해 56.99%로 떨어진 것으로 집계됐다.
더욱이 서울에 사는 근로자의 주택 소유 비율은 지난해 2.4분기 57.49%, 3.4분기 56.61%, 4.4분기 55.78%로 눈에 띄게 낮아지고 있다.
소득계층을 10단계로 나눌 때 소득수준이 가장 낮은 10%가구(1분위)의 주택 소유 비율은 2000년 38.20%까지 오름세를 보였으나 지난해에는 37.67%로 낮아졌다. 또 2분위 가구는 40%선에서 지난해 39.99%를 기록했고 3분위 가구와 4분위 가구도 각각 2000년 44.08%, 50.80%에서 지난해 41.01%, 49.91%로 하락했다. 전체 근로자 가구의 40%를 차지하는 저소득층 가구 중 절반 이상은 집이 없는 셈이다.
한편 근로자 가구의 월세 지출은 지난해 월평균 21만7천원으로 전년보다 19.4% 증가했다. 전년 대비 월세 지출 증가율은 98년 21.3% 감소했다가 99년 4.5% 증가한 데 이어 2000년 18.5% 느는 등 급증세를 보이고 있다. 집세는 2월 들어서도 0.4% 오르는 등 25개월 연속 상승세를 이어가고 있다.
전문가들은 "근로자들이 과거처럼 월급을 저축해서는 집값 상승폭을 결코 따라잡을 수 없다"면서 "주택 물량을 늘리는 것만으로는 문제해결이 어려운 만큼 근로자와 저소득층이 내집 마련의 희망을 가질 수 있도록 특단의 대책을 강구해야 할 것"이라고 말했다.
권석천 기자miladk@kyunghyang.com
라) 도시가계의 조세 및 사회보험료 부담
도시가계조사 통계자료를 이용하면, 도시근로자가구의 총소득에서 조세 지출 및 사회보험료 지출 비중을 알아볼 수 있다. 이를 분석하면, 조세제도 및 사회보험 제도의 변화가 도시근로자 가구의 수지에 어떤 영향을 주고 있는지를 간접적으로 알아볼 수 있다.
구체적인 분석을 위해서는 먼저, 도시가계 평균 소득에서 조세 및 사회보험료 지출 비중의 장기추이를 따져봐야 한다. 이어 소득계층별로 조세 및 사회보험료 지출 비중, 그리고 그 추이를 살펴봐야 한다.
먼저 도시가계의 총 소득에서 조세 및 사회보험료 지출의 비중 추이를 분석해보기로 하자.
도시가계의 총소득 추이는 이미 내려받은 엑셀파일이 있으므로 이를 활용하면 될 것이다.
조세 및 사회보험료는 ‘지출’항목중 ‘비소비지출’ 에 들어있다. 엑셀파일로 내려받는 순서는 다음과 같다.
1) ‘소득 10분위별 가구당 월평균 가계수지’ 통계 테이블에서, 평균부터 1~10분위에 모두 체크를 하고, 검색을 누른다.
2) 다음으로 평균을 포함한 모든 소득계층의 ‘비소비지출’ 항목 앞에 체크를 하고 검색을 누른다.
3) 기간을 설정한다. 여기서는 1997년1분기부터 최근까지로 기간을 설정해 검색을 누른다. 그러면 맨 위에 도시근로자 가구의 평균 비소비지출, 조세, 공적연금, 사회보험, 기타 비소비지출액이 분기별로 화면에 출력돼 나온다. 평균 아래쪽에는 1분위부터 10분위까지 통계자료가 출력된다.
4) 자료받기를 눌러, 이 자료를 엑셀파일로 저장한다.
먼저 도시가계 조사 총소득 파일을 열어 1997년1분기부터 2003년1분기까지 통계를 작업 시트에 정리한다. 그리고 그 옆에 조세, 사회보험 통계를 복사해 붙여넣으면 다음과 같은 모습이 된다.
추가그림1) 도시가계 총소득 및 조세, 사회보험
이 작업 시트에서 총 소득 대비 조세지출, 사회보험의 비중을 계산한다. 계산식은 다음과 같이 나타낼 수 있다.
추가그림2) 조세지출 비중 계산식
엑셀프로그램의 그래프 기능을 이용해 계산결과를 그래프로 나타내보면, 도시근로자가구의 총소득대비 조세지출 비중 및 사회보험료 지출비중의 추이를 한 눈에 볼 수 있다.
조세지출 비중의 경우에는 들쭉날쭉 하여, 일관된 경향을 찾기 어렵지만, 사회보험료 지출액의 경우 97년 1분기 이후 절대액이 늘어날 뿐 아니라, 그것이 총소득에서 차지하는 비중도 계속해서 커지고 있다.
추가그림 3) 사회보험료 지출액 및 총소득대비 비중 추이
그래프에서 볼 수 있듯이, 도시근로자가구의 사회보험료 지출은 97년 1분기 2만원도 안되던 것이 점차 늘어나 2003년1분기 5만원에 거의 육박한다. 또 총소득에서 차지하는 비중도 0.85%에서 1.68%로 2배 가까이 커졌다.
좀 더 심층적인 분석을 위해서는 이를 소득계층별로 따져보는 것이다. 분석의 과정은 같기 때문에 생략하기로 한다. 분석결과 2003년1분기 현재, 각 소득계층의 사회보험료 지출 비중은 다음과 같이 나타났다.
추가그림4) 소득계층별 사회보험료 및 소득대비 비중
통계를 보면 저소득층의 총소득대비 사회보험료 비중은 2%대 후반이며, 고소득층일수록 비중이 낮아져 10분위 계층은 1.2% 가량이다.
이는 사회보험 제도의 지속적인 확대가 저소득층에게는 상당한 부담으로 작용하고 있음을 보여준다. 그만큼 소비 가능한 소득액이 줄어드는 결과를 낳기 때문이다.
여기서는 구체적으로 따져보지 않지만, 도시가계의 소득대비 지출액을 계산해 저소득계층의 가계수지 적(흑)자율 및 그 추이를 따져보면 의미 있는 결과가 나올 것으로 보인다.
제4장다른 통계에의 응용
1) 고용통계 분석 사례
앞에서 예로 든 ‘도시가계조사’를 바탕으로 한 분석은 통계정보시스템에서 제공하는 다른 통계자료에도 거의 그대로 응용할 수 있다. 매달 통계청이 발표하는 ‘경제활동인구조사’는 대표적인 예라 할 수 있다.
흔히 ‘고용동향’ 통계라고 부르는 이 통계조사는 경제활동인구, 경제활동참가율, 실업률, 실업자수, 취업자수를 주요항목으로 하여, 성별, 연령별, 행정구역별로 이를 세분해 조사한다. 또 취업자 수의 경우 업종별, 산업별 세부통계가 있으며, 종사자 지위별(상용직, 임시직, 일용직 등)로 나눠져 있고, 실업자에 대해서도 다양한 세부통계를 제공한다.
이들 원자료를 바탕으로 다양한 분석정보를 생산할 수 있다. 고용이 늘고 있는 업종과 감소하고 있는 업종을 따져볼 수 있다. 비정규직의 비중이 늘어나는 추세인만큼, 그에 대한 구체적인 실태를 분석해볼 수도 있다. 지역별로 실업률 추이를 분석해 지역별 고용동향을 면밀히 따져볼 수도 있다. (삭제)
고용통계를 분석하면, 청년실업 문제 외에도 고용시장에서 일어나고 있는 여러 변화를 구체적으로 분석할 수 있다.
예를 들어 산업별 취업자 수의 추이를 따져봄으로써, 어떤 산업분야가 고용을 새로 창출하고, 어떤 산업의 고용흡수력이 떨어지고 있는지를 알아볼 수 있다. 여기서는 제조업 취업자의 비중이 계속해서 줄어들고 있는 실태를 확인해보자.
산업별 취업자수에 대한 통계자료는 ‘경제활동인구조사’ - ‘취업자’를 누른 뒤 나오는 ‘성 및 농가 비농가/산업별’ (년, 분기, 월 :2000.01 ~ 2003.05 )이란 테이블에 들어있다. 통계 테이블에 대한 설명에서 볼 수 있듯이 데이터는 2000년 이후의 것이다.
이는 산업분류가 2000년부터 새로 바뀌었기 때문이다. 2000년 이전의 구 산업분류에 따른 통계는 ‘경제활동인구조사 - 취업자’로 찾아들어가면 ‘산업직업별 2000년 이전’이란 분류항목이 맨 위에 나타난다. 여기에서 찾을 수 있다.
먼저 2000년 이후 전체 취업자와 제조업 취업자 수를 알아보자.
통계테이블 목록에 나타난 ‘성 및 농가 비농가/산업별’을 클릭하면, 첫 화면에 출력되는 내용은 실제 필요한 데이터와는 거리가 멀다. 성별, 농가 비농가별 분류항목이 나오기 때문이다.
이런 경우에는 화면 위쪽의 ‘분류선택’을 이용해야 한다. 분류선택에는 ‘산업별’과 ‘성별 및 농가.비농가별 산업별’ 등 두 가지 선택항목이 있다. 이중에서 ‘산업별’에 체크를 하고 검색을 누르면 성별 구분없이 산업별 취업자수가 화면에 출력된다.
주기를 ‘년’으로 하고, 기간을 2000년1월부터 현재까지로 설정한 뒤 검색을 눌러 원하는 자료를 화면에서 살펴본다. 이어 자료받기를 눌러 엑셀파일로 내려받는다.
주기를 연간으로 하는 것은 장기간에 걸친 제조업 취업자수의 비중 추이를 따져보는데, 월간 데이터는 신뢰도가 그만큼 떨어지기 때문이다.
추가그림 5) 산업별 취업자수(검색 화면)
2000년 이전의 구 산업분류에 따른 산업별 취업자수 통계를 엑셀파일로 내려받는 방법도 마찬가지다.
이제 내려받은 두 개의 엑셀파일에서 연도별 전체 취업자와 제조업 취업자 수를 재정리해 새로운 작업시트를 만든다. 그리고, 제조업 취업자수의 비중추이를 그래프로 나타내면 다음과 같다.
추가그림 6) 총취업자중 제조업 취업자 비중 추이
그래프는 90년대 들어 전체 취업자중 제조업 취업자수의 비중이 지속적으로 낮아졌으며, 97년말 외환위기 이후 경기회복기에 일시적으로 소폭 증가했으나 2001년부터 다시 낮아지고 있음을 보여주고 있다.
또 제조업 취업자수의 추이를 보면, 92년 498만명에서 2002년 424만명으로 절대수치가 낮아지는 등 제조업체는 고용을 새로 흡수하기는커녕, 실업자를 만들어내는 창구가 되고 있다.
이런 방식의 통계 분석은 제조업 외에 다른 산업에도 그대로 적용할 수 있다. 이를 통해 고용흡수력이 갈수록 떨어져가는 제조업을 대신해 현재 어떤 산업이 고용창출에 가장 기여를 하고 있는지 따져볼 수 있을 것이다.
외환위기 이후 고용시장에서 가장 심각한 문제로 거론되는 것이 ‘청년실업’이다.
통계정보시스템의 통계원자료를 이용해 이와 관련한 새로운 정보를 생산할 수는 없을까? 이 책에서는 실업률만으로는 파악할 수 없는 청년실업 문제의 심각한 실태를 한번 분석해보기로 한다.
외국의 경우 15세~24세 인구의 실업률을 청년실업률로 본다. 그러나 우리나라의 경우 대학 진학률이 매우 높고, 병역문제까지 걸려 있어 고용시장에 신규진입하는 연령대가 외국에 비해 높기 때문에 20대를 청년으로 보는 것이 옳을 것이다.
우선 청년 실업률과 전세 실업률의 장기추이를 비교해보기로 한다.
통계정보시스템에서 통계조사별 분류로 들어가 ‘경제활동인구’를 검색하면 경제활동인구조사와 관련한 다양한 통계 테이블이 나온다.
실업률을 비교하려는 것이므로 ‘실업률’을 클릭한다. 이어 ‘성/연령별’을 선택하면 연령별 실업률에 대한 데이터를 내려받을 수 있다.
[그림17] 연령별 실업률 통계 내려받기
[그림 17]에서 맨 위쪽의 분류선택은 지금까지 이 책의 설명에서는 활용할 필요가 없었던 것이다. 그러나 이번에는 선택을 해야 한다. 화면에 성별 실업률만 출력돼 나오고 있기 때문이다.
성별로 분류된 실업률은 의미가 없고 연령대별 분류가 필요하므로, [분류선택]에서 위쪽에 있는 ‘연령계층별’에 표시를 하고 검색을 누른다.
이어 연령대별로 실업률이 화면에 출력되면, 기간을 외환위기 전인 ‘1997년1월부터 현재까지’로 설정해 자료받기를 한다.
내려받은 엑셀파일에서 전체 실업률과 20대(20~29세)실업률만을 나란히 배치한 것이 [그림18]이다.
[그림18] 전체 실업률과 20대 실업률
이 엑셀파일에 나타난 전체 실업률과 20대 실업률을 엑셀 프로그램의 그래프 기능을 활용해 그래프로 나타낸 것이 [그림19]이다.
[그림19] 전체 실업률과 20대 실업률 비교
[그림19]를 보면 2002년 말 이후 전체실업률과 20대 실업률 간의 관계에서 과거와는 다른 양상이 나타나고 있다. 전체 실업률이 늘어나는 것보다 훨씬 빠른 속도로 20대 실업률이 높아지고 있는 것이다.
이는 경기하강 국면에서 20대가 다른 연령계층보다 훨씬 심각한 고용상의 타격을 받고 있음을 암시한다.
그렇다면 실업자 수에서도 그런 특징이 나타날 것이라고 우리는 예상할 수 있다. 20대 실업자가 전체 실업자 수에서 차지하는 비중은 어떻게 변해왔을까?
전체실업자중 20대 비중의 추이를 따져보려면 새로운 통계자료를 내려받아야 한다.
바로 연령별 실업자 수에 대한 통계이다. 통계정보시스템에서 ‘경제활동인구’-‘실업자’를 찾은 뒤 나오는 여러 목록중 ‘연령별’이 들어있는 통계를 찾는다.
이어 연령별 실업자수에 대한 통계자료를 엑셀파일로 내려받아, 전체 실업자중 20대 실업자의 비율추이를 계산한다. 이를 그래프로 나타내면 다음과 같다.
[그림20] 전체 실업자중 20대 실업자의 비율 추이
그래프는 전체 실업자중 20대 실업자의 비율은 2000년 이후 지속적으로 높아지고 있는 추세임을 보여준다. 청년실업 문제가 앞으로도 심각한 사회문제가 될 것임을 예고하는 것이다.
이밖에 청년실업의 실태를 구체적으로 보여주기 위해 20대 취업자수의 추이를 따져보고, 취업자의 종사자별 지위(정규직, 비정규직 여부), 어느 업종에 취업하는 지 등을 따져볼 수 있을 것이다.
2) 산업활동동향 통계 분석 사례
통계청은 매월말에 전달의 ‘산업활동동향’을 발표한다.
이 통계의 핵심은 경기종합지수라고 할 수 있다. 경기종합지수란 경기를 잘 반영하는 주요 개별경제지표들의 움직임을 종합해 산출하는 지수로, 전체 경기의 변화방향, 속도, 전환점을 판단 및 예측하기 위해 작성하는 통계다.
경기종합지수는 앞으로 경기의 방향을 예측하게 해주는 선행종합지수(선행지수 구성지표(10개); 건축허가면적, 건설용중간재생산지수, 기계수주액, 수출신용장내도액, 수출용원자재수입액, 총유동성, 내구소비재출하지수, 재고순환지표, 중간재출하지수, 입이직자수 비율 ), 현재의 경기상태를 보여주는 동행지수(동행지수 구성지표(10개) ; 산업생산지수, 제조업가동률지수, 제조업전력사용량, 생산자출하지수, 도소매판매액지수, 비내구소비재 출하지수, 시멘트소비량, 수입액, 수출액, 노동투입량 ), 몇 개월 전의 경기상태를 사후적으로 확인해주는 후행지수(후행지수 구성지표(6개); 생산자 재고지수, 비농가실업률, 상용근로자수, 도시가계소비지출, 기계류수입액, 회사채유통수익률 )로 나뉜다. 각 지표는 2000년을 100으로 하여 수치가 높아지면 경기가 좋아지는 것을, 낮아지면 나빠지는 것을 뜻한다.
그러나 이들 지표는 경기의 국면을 시각적으로 뚜렷하게 보여주지 못하는 단점이 있다. 우리나라의 경우 경제성장률이 여전히 높은 수준이어서 경기종합지수를 그래프에 나타내면 계속해서 증가하기만 하는 것처럼 보인다. 그래서 경기흐름을 살필 때는 동행지수 순환변동치(동행지수에서 경제성장에 따른 자연적인 경기변동을 제거한 지표이다. 따라서 경기가 호황일 때는 100이상, 불황일 때는 100 이하로 나타난다. ), 선행지수 전년동월비(현재의 선행지수가 지난해 같은달의 선행지수보다 얼마나 증감했는지를 보여준다. 전년도의 선행지수는 12개월평균치(앞 6개월, 뒤 5개월 포함)를 사용한다. 몇% 증가(또는 감소)로 나타나며 경기상승 국면에서 증가한다. )라는 지표를 더 많이 활용한다.
[그림21] 동행지수 순환변동치와 선행지수 전년동월비
산업활동동향 통계에는 경기종합지수와 함께 산업생산지수, 출하(내수 및 수출)지수, 도소매판매액지수, 재고지수, 그리고 제조업가동률 등 개별경제지표들이 포함돼 있다.
또 생산, 출하, 도소매판매, 재고, 가동률은 전산업에 대해서뿐 아니라 표준산업분류에 따른 업종별 지표를 함께 발표한다. 설비투자관련 지표라고 할 수 있는 기계수주, 건설수주 및 건설기성액통계도 함께 발표한다.
산업활동동향은 발표되는 통계의 방대함 때문에, 실제 언론보도에서는 산업생산, 출하, 도소매판매액지수의 증감율 등 극히 일부만 다뤄지는 것이 일반적이다. 그러나 이 통계는 다양한 가공이 가능하다.
먼저 다른 경제지표들과 상관관계 분석을 통해 산업활동동향 통계가 담긴 의미를 구체화하는 쪽으로 접근할 수 있다.
예를 들어 선행지수 전년동월비의 움직임을 주식시장의 종합주가지수와 비교해보면, 두 지표가 거의 비슷하게 움직이는 경향을 볼 수 있다.
[그림22]는 1997년 이후 선행지수 전년동월비와 월평균주가 추이를 나타낸 것이다. 주가가 경기에 6개월 가량 앞서 움직인다는 점을 분명하게 보여준다.
[그림22] 선행지수 전년동월비와 월평균주가 흐름 비교
또 도소매판매액 지수의 흐름은 유통업체들의 주가흐름과, 건축허가면적 증감율 추이는 건설업체들의 주가흐름과 밀접한 상관관계를 갖는 것으로 나타나고 있다.
주식시장 지표만이 아니라, 실업률, 금리, 물가 등 다른 경제지표들과의 상관관계 분석도 경제에 대한 독자들의 이해를 높이는 데 활용할 수 있는 여지가 많다.
3) 지역경제에 대한 분석
이 책의 제 2장에서 통계에 대한 이해의 중요성을 강조하며 던진 질문이 있다.
“지역 격차라는 얘기들을 많이 하는데, 실제 시도별 주민들의 소득은 어떻게 차이가 날까?”
실제 통계정보시스템의 자료를 분석해 가공한 기사가 있으므로, 그 과정을 한번 살표보기로 한다. 다음은 [한겨레21] 2003년1월22일치에 실린 기사이다.
제목:그 정권이 지역경제 망쳤다고?
사람은 자기를 중심으로 생각하는 경향이 있다.
그래서 내가 하면 로맨스, 남이 하면 스캔들 이란 말도 있다. 지난 16대 대통령 선거에서 나타난 지역별 표쏠림 현상을 둘러싼 논쟁에서도 그런 경향을 볼 수 있다.
내가 사는 지역에서 특정 후보에 몰표가 나온 것은 당연한 것이고, 다른 지역의 몰표는 지역주의다!
선거가 끝난 뒤 지역주의 논쟁이 한바탕 인터넷을 뜨겁게 달궜다. 물론 비난을 한몸에 받은 것은 호남의 유권자들이다. 그들이 민주당 노무현 후보에게 보낸 지지율은 절대수치에서 다른 지역을 압도했기 때문이다.
광주 95%, 전남 93%, 전북 91%. 그런데, 특정 후보에 대한 표쏠림의 정도가 지역주의의 강도를 보여주는 것이라면, 한가지 질문에 먼저 대답해야 한다.
이회창 후보에게 쏠린 대구의 77%, 경북의 73%는 어떻게 봐야 할까? 두 후보에게 비슷하게 표를 던진 인천의 유권자들은 상을 받아야 할까?
지역별 득표율만 놓고 누가 더 나쁘냐고 따지는 것은 핵심을 놓치게 만들 가능성이 있다.
누구에게 몰표를 던졌든, 그 지역 사람들의 마음을 헤아려보지 않으려 하기 때문이다. 속을 털어놓고 이야기하지 않으면 서로 말이 통하지 않는다.
노무현 후보에게 몰표를 던진 호남 사람들은 말한다. 우리는 수십년간 나라 안의 식민지에 살았다.
이회창 후보에게 몰표를 던진 대구 경북 사람들도 마찬가지로 00정부가 들어선 뒤, 우리 지역 경제는 망했다고 소외감을 토로한다.
정치인들이 지역을 돌며 조용히 퍼뜨린 이런 주장은 유권자들에게 상당한 호소력을 발휘했다. 그런데, 그런 주장은 정말 근거가 있는가?
지역경제의 수준을 말할 때, 흔히 거론하는 것이 1인당 GRDP(지역내총생산)이다. 그 지역에서 생산된 부가가치의 총합을 그 지역의 추계인구 수로 나눈 값이다.
지난 2001년의 수치를 보면 대구광역시가 전국에서 가장 낮다. 전국 평균을 100으로 볼 때, 대구광역시는 64.5에 불과하다.
도시지역은 생산거점이 아니라 소비의 거점이므로 광역시의 1인당 GRDP는 도 지역보다는 대체로 낮게 나온다. 이를 감안하더라도 대구광역시의 수치는 부산(78)이나 광주(78)보다 상당히 낮은 것이 사실이다.
그러나 이 통계수치는 대구 경제가 최근 몇년새 다른 지역보다 큰 타격을 입었다는 증거가 되기에 부족하다.
대구지역의 1인당 GRDP는 지난 1985년에도 전국시도중 가장 낮았기 때문이다. 다만 그때는 전국 평균 대비 72.5에서 지금은 64.5로 더 낮아졌다는 점이 눈에 띈다.
그러나 이 또한 경북지역의 1인당 GRDP가 85년 103에서 2001년 113로 높아졌다는 점을 감안해야 한다.
호남은 어떤가. 광주의 1인당 GRDP는 직할시로 분할된 1987년 전국평균 대비 79에서 2001년 현재 78로, 거의 그대로다. 다른 직할시들에 비하면 하락폭이 아주 낮다.
그러나 이 또한 전남지역이 1985년 122에서 113로 크게 낮아진 것을 계산에 넣어야 한다.
한덩어리로 묶어보면 대구경북이나 광주전남의 산업기반은 상대적인 측면에서 그 사이 별로 변한 게 없다. 광주전남의 산업기반이 내부식민지를 거론할 만큼 형편없이 취약한 것도 아니다.
1인당 GRDP는 그 지역 사람들의 소득 수준을 직접 보여주는 것이 아니다.
그렇다면 소득은 어떨까?
지역별 소득 수준을 비교할 수 있는 유일한 자료는 지난 2000년 통계청이 실시한 가구소비실태 조사 뿐이다.
전국 가구의 평균 경상소득을 100으로 할 때 대구지역은 92.4로, 부산(91.0) 인천(91.2) 광주(92.3) 대전(90.5)보다 약간 높다.
전국평균보다 소득수준이 높은 곳은 서울(116.2) 울산(112) 경기(105.7)이고, 나머지 지역에서는 경남(97.4) 경북(92.7)이 상대적으로 높다.
서울을 빼면, 영남지역의 소득수준이 대체로 높은 편이다. 전남(86.6)은 영남에 비해서는 조금 낮고, 충청지역(86)과는 비슷하다.
통계자료는 적어도 경제적 측면에서 어느 지역도 절대적인 소외를 거론하고, 그것으로 지역주의적 투표행태를 정당화하기 어렵다는 것을 보여준다.
정작 할 말이 많은 지역은 강원도와 전라북도 사람들이다. 강원도의 1인당 GRDP는 79.7(2001년)로 9개 도 가운데 가장 낮고, 경상소득은 82.9에 불과하다. 전북의 1인당 GRDP는 81.6, 경상소득 수준은 전국에서 가장 낮은 82.0이다.
그렇다면 도대체 우리지역은 버림받았다는 말을 누가 곳곳에서 퍼뜨리는 것일까?
근로자가구(연평균 소득 2862만원)와 사업자가구(연평균소득 3582만원)를 따로 뜯어보면 한가지 특징이 나타난다.
서울,경기,부산,울산,경남을 제외한 나머지 시도의 경우, 사업자가구의 경상소득이 전국평균에 비해 크게 떨어지는 것이다.
이들 사업자들이 자신들의 소외감을 바탕으로 지역주의를 부추기는 것은 아닐까?
지역 사업자들은 중앙정부에서 지역 예산을 많이 따올수록 가장 직접적으로 혜택을 보는 사람들이다. 한 지역 시민단체의 간부는 지역주의는 그 지역 사람들의 보편적 이익을 위한 것이라기보다는 지역여론을 주도하는 특정 계층의 이득을 위한 것이라고 말했다.
지역간 격차의 현실에 비하면, 지역주의에는 너무 많은 거품이 끼어있다는 것이다.
정작 지역주의적 투표행태를 통해 별 혜택도 입지 못하는 사람들끼리 서로를 비난하는 것은 결과적으로 지역주의를 조장하려는 사람들을 돕는 일이 된다.
지역격차의 현실을 있는 그대로 드러내고, 지역균형발전을 모색하는 정책적 합의점을 도출하는 것이 훨씬 현실적인 해결책일 뿐이다. 그러나 그동안 어느 누구도 그것을 위해 적극 나서지 않았다. 지역에 뿌리를 둔 정치인들에게는 강고한 지역주의가 당선에 안전판으로 작용하기 때문이다. 정부도 마찬가지였다.
지난 2002년 한국개발연구원이 펴낸 <열린세상, 유연한 경제>라는 제목의 비전 2011 프로젝트 최종보고서는 이렇게 지적하고 있다.
지역격차를 파악하기 위한 가장 기초자료인 지역별 소득자료를 만들지 않는 현실은 지역정책이 갖고 있는 정치적 측면을 단적으로 보여준다.
이는 정부의 정책목표 달성에 대한 실천의지를 의심하게 하는 대목이다. 유럽연합(EU)의 경우 지역별 1인당 소득, 실업률, 교육수준, 사회간접자본시설 수준 등을 지역균형정책의 주요 지표로 채택하고 이를 기준으로 지역정책을 수립하고 그 성과를 평가한다고 한다.
지역주의를 극복하겠다고 강조한 노무현 당선자가 취임 이후 가장 먼저 해야 할 일이 무엇인지 이 보고서에 해답이 나와있다.
이 기사는 크게 두 가지 통계 자료를 분석해 쓴 것이다.
하나는 1인당 지역내 총생산을 지역별로 비교한 것이고, 다른 하나는 통계청의 가구소비실태 조사에 나타난 지역별 가구소득을 비교한 것이다.
먼저 1인당 지역내 총생산부터 살펴보자. 지역내총생산이란 시도단위별 생산액, 물가 등 기초통계를 바탕으로 일정 기간동안 해당지역의 총생산액을 추계하는 시도단위의 종합경제지표다. 이 지표는 단지 그 지역에서 생산된 부가가치만을 뜻할 뿐, 발생된 소득이 시도간 이전을 통해 최종적으로 어느 시도의 주민에게 귀속되는가를 따지지는 않는다.
예를 들면 서울 사람이 부산에 있는 사업체에서 근무할 경우 그 직장에서 생산하는 재화나 용역은 부산지역 지역총생산으로 된다.
따라서 그 지역 주민의 소득수준을 뜻하는 것은 아니다. 다만 그 지역의 산업기반이 어느 정도 수준인지를 보여줄 뿐이다.
1인당 지역내총생산은 지역내총생산을 그 지역의 인구(추계인구)로 나눈 값이다. 그런데, 통계정보시스템은 1인당 지역내총생산 통계 테이블을 직접 제공하지 않고 있다.
따라서 통계정보시스템에서 추계인구와 지역내총생산 통계를 각각 내려받아 1인당 지역내총생산을 직접 구해야 한다.
먼저 지역내총생산 통계는 주제분류별 검색에서 ‘국민계정’ - ‘지역내총생산 및 지출국부’ - ‘지역내총생산 및 지출’ 순으로 들어가면 된다.
통계 테이블 목록중 ‘행정구역(시도)/경제활동별 지역내총생산 (년 :1985 ~ 2001)을 클릭하면 된다. 1985년부터 2001년까지 통계가 있으므로, 검색기간을 85년부터로 설정한다.
추가그림7) 시도별 지역내총생산(검색화면, 기간설정 전)
이 통계에는 시도별 지역내총생산액이 당해연도 가격과 95년 기준년 가격 2가지로 표시돼 있다. 이중 어느 것을 사용해도 관계 없다. 어차피 지역별 비교를 하려는 것이기 때문이다.
한편, 추계인구는 통계조사별 검색에서 바로 ‘추계인구’를 찾을 수 있다. 추계인구는 2030년까지 나와있으므로, 지역내 총생산 자료와 똑같이 85년부터 2001년까지의 기간을 설정해 데이타를 얻으면 된다.
이제 엑셀프로그램의 작업시트에 획득한 자료를 나란히 배치해 1985년부터 2001년까지 시도별 1인당 지역내총생산을 구해 비교를 해보자. 1인당 지역내 총생산은 지역내총생산을 추계인구로 나눠 계산한다. 2001년의 값만 가지고 그래프를 만들면 다음과 같다. (참고/1985~2001년까지 열거된 데이터에서 2001년치만 모으기 위해서는 현재의 작업시트를 비어있는 시트에 복사한 뒤, 불필요한 데이터를 지워나가면 된다)
추가그림8) 2001년 1인당 지역내총생산 비교
그래프를 보면 대구는 전국시도 가운데 1인당 지역내 총생산이 가장 낮은 지역으로 나타나고 있다. 특히 광주, 대전, 부상 등 다른 광역시와 비교해도 매우 낮다. 이는 대구 지역의 산업기반이 매우 취약하다는 점을 보여주는 것이다.
이런 현상이 언제부터 시작된 것인지를 살펴보는 데는 여러 방법이 있을 수 있다. 그중 전국평균값과 대구의 1인당 지역내총생산의 장기추이를 비교해보는 것이 무난할 것이다.
추가그림9) 전국평균 대비 대구지역 1인당 지역내총생산 추이
그래프는 대구지역 1인당 지역내 총생산을 전국 평균값으로 나눈 값이 90년대 들어 지속적으로 낮아지고 있음을 보여준다. 이는 90년대 들어 대구지역의 산업기반이 상대적으로 취약해지기 시작했음을 있음을 뜻한다. 특히 95년 일시적으로 상승했다가, 외환위기를 전후해 급격히 떨어지는 양상을 볼 수 있다. 그리고 외환위기 이후에는 옆걸음질을 하고 있다. 따라서 이 시기(김대중 정부 집권기)에 대구지역의 산업기반이 무너졌다는 주장은 별 근거가 없는 것임을 확인할 수 있다.
다른 시도에 대해서도 이런 방식으로 전국대비 1인당 지역내총생산 추이를 살펴보면, 지역 경제의 실태를 알아볼 수 있다. 다만, 광역시의 경우 생산거점이라기보다는 주거 및 소비 거점이기 때문에, ‘경북+대구’ ‘전남+광주’처럼 두 행정구역을 하나의 지역으로 보고 1인당 지역내총생산을 비교해볼 필요도 있다.
1인당 지역내 총생산 비교는 이 정도로 해두고, 이번에는 시도별 소득을 비교해보기로 한다.
지역별 소득에 대한 통계자료는 통계청이 5년 단위로 조사하는 ‘가구소비실태’ 조사가 현재로선 유일하다. KOSIS의 경우 주제별 검색 (KOSIS) > 가계소득소비자산 > 가구소비실태로 가서 2000년 조사자료를 찾으면 가장 최근의 테이타를 얻을 수 있다.
‘1인 가구’ 통계와 ‘2인 이상’ 가구 통계중에서는 ‘2인 이상 가구’를 선택하고, 이어 나오는 선택항목중 ‘가계수지’를 선택하면, 여러 통계 테이블이 열거돼 나온다. 여기에서 ‘행정구역(시도)별’을 택하면 된다. 이 통계에는 전가구, 근로자가구, 사업자가구의 수입과 지출이 정리돼 있다.
이 자료를 엑셀파일로 내려받아 시도별 경상소득만 남기고 모두 지우면 다음과 같은 모습이 된다.
추가그림 10) 지역별 경상소득 비교
가구소득을 지역별로 보면, 서울이 가장 높고 울산과 경기만이 3천만원을 넘는다. 대구는 다른 광역시와 별 차이가 없다. 가장 소득이 떨어지는 곳은 전북과 강원임을 알 수 있다.
이 작업시트에서 이밖에 여러 분석을 해볼 수 있다. 예를 들면, 지역별 근로자가구 소득과 사업자가구 소득이 전국평균 몇 %인지를 비교해볼 필요가 있다. 언뜻 봐도 근로자가구의 소득은 지역별로 큰 격차가 없는데, 사업자 가구의 소득은 큰 차이가 나는 것으로 보인다. 실제 기사는 이런 분석을 통해, ‘지역차별’에 대한 주장이 근로자보다는 사업주들 사이에서 나오고 있을 가능성을 다뤘다.
한편, 가구소비실태 조사 통계를 이용하면 이밖에도 지역별 가구 흑자율이나 저축률 등 많은 지료를 비교할 수 있다.
4) 수출입 통계의 분석
무역의존도가 매우 높은 한국경제에서 수출입 동향은 매우 중요한 관심사다. 과거 데이터를 분석해본 결과, 우리 경제는 본격적인 경기호황 국면을 맞기 위해서는 수출증가가 핵심적인 열쇠가 되었던 것으로 나타나고 있다.
이에 대한 분석과정부터 소개하기로 한다.
경기의 국면을 보여주는 지표를 동행지수 순환변동치로 보고, 수출증가율을 이 데이타와 하나의 평면위에 그래프로 나타내보자.
동행지수 순환변동치는 주제별 검색 (KOSIS) > 경기산업활동소비자전망에서 ‘경기종합지수’를 클릭해 자료를 내려받을 수 있다.
수출액은 ‘주제별 검색 (KOSIS) > 무역외환국제수지 > 무역’ 으로 들어간 뒤, 필요한 통계 테이블을 선택하면 된다.
하지만, 내려받은 수출액 통계자료는 그대로 활용할 수는 없다. 동행지수 순환변동치와 비교할 대상이 수출액이 아니라, 수출 증가율이기 때문이다. 따라서 수출액 통계를 가지고 수출증가율을 직접 산출해야 한다. 증가율은 보통 전년동월대비 증가율을 뜻한다.
엑셀 프로그램의 작업시트에서 전년동월대비 증가율을 구하려면, 올해 1월 지표를 분자로, 전년 1월 지표를 분모로 하여 나눈 뒤 1을 빼주면 된다.
추가그림11) 전년동월대비 증감율 계산
해당 셀에 함수식을 넣고 엔터키를 누르면 ‘-0.01176’이란 수치가 r계산돼 나온다. 이는 올 1월 수출이 전년동월대비 1.11% 줄었다는 것을 뜻한다.
이를 백분율로 나타내려면 엑셀프로그램의 ‘% 변환’ 기능을 활용하면 된다. 또 백분율의 소수점 이하 자릿수도 ‘자릿수 늘림, 줄임’ 기능을 활용해 적절히 조절할 수 있다.
2월의 증감율, 3월의 증감율 등은 ‘드랙’(함수식을 적용한 셀을 클릭한 뒤 커서를 오른쪽 아래부분으로 옮기면 커서가 작은 십자가 모양으로 바뀌는 데, 이를 아래로 끌어내리면 아래 셀에도 같은 계산식이 적용되는 기능)을 하여 쉽게 계산할 수 있다.
이런 방식으로 계산한 1993년1월부터 2003년4월까지의 수출 증가율을 동행지수 순환변동치와 나란히 배치한다.
추가그림 12) 동행지수 순환변동치와 수출증가율(엑셀파일)
두 지표를 동시에 하나의 평면에 나타내는 그래프를 그릴 때는 주의해야 할 점이 있다. 지표의 크기가 서로 비슷할 때는 관계없지만, 이번 경우처럼 데이터의 크기가 크게 차이가 날 때는 ‘이중 축’ 그래프를 그려야 한다. 엑셀프로그램의 차트마법사를 클릭하면 ‘사용자 정의 종류’를 통해 ‘이중축 꺾은 선’ 그래프를 그릴 수 있다.
추가그림 13) 이중축 꺾은 선 그래프 그리기
이 기능을 활용해 만든 그래프를 보면, 경기와 수출 증감율과의 상관관계가 나타난다. 93년 이후 두 지표간의 관계를 보면, 수출증가율이 지속적으로 상승할 때 경기도 상승하고, 수출증가율이 떨어지면 경기도 옆걸음질을 치거나 하강하는 것으로 나타나고 있다.
2003년의 경우, 수출증가율은 전년동월대비 20% 안팎인데도 동행지수순환변동치는 2003년1월을 고점으로 계속 낮아지고 있음을 볼 수 있다. 실제 수출증가율은 2002년12월을 고점으로 낮아지는 추세이다. 이는 수출의 절대액수가 아니라, 수출 증가율이 늘어나느냐 줄어드느냐가 경기흐름에 더 큰 영향을 미친다는 것을 보여주는 것이다.
추가그림 14) 수출증가율과 경기 흐름
수출 통계 원자료는 이밖에도 전체 수출에서 차지하는 국가별 수출 비중이나, 품목별 비중 추이를 분석해 기사화할 수 있다.
맺는말통계정보시스템을 넘어서
지금까지 통계정보시스템을 활용해 경제뉴스를 작성하는 방법을 몇 가지 사례를 들어 살펴보았다. 문제의식이 다르고, 찾아봐야 할 통계가 다를 뿐 테크닉면에서만 보면 앞에서 설명한 내용이 거의 전부라고 해도 지나친 말은 아니다. 중요한 것은 실제 통계정보시스템에 실려 있는 데이터를 많이 찾아보고, 분석해보는 것이다.
그러나 통계정보시스템의 자료가 모든 것을 말해주는 것은 아니라는 점도 기억해야 한다. 모든 통계가 다 들어있는 것도 아니고, 또 통계만으로 기사가 완성되는 것도 아니다.
경제통계중 주기가 짧은 금융시장 통계는 통계정보시스템 바깥에서 찾아야 한다. 금융시장 통계는 증권전산의 CHECK 단말기를 통해 가장 풍부한 데이터를 확보할 수 있다. CHECK 단말기는 화면 자체를 캡쳐해 엑셀 프로그램으로 데이터를 저장하는 기능을 제공하고 있다. 환율동향의 경우 한국은행 홈페이지에서, 해외 금융시장 통계의 경우 해당국 중앙은행과 증권거래소 등의 홈페이지에서 시계열 자료를 내려받을 수 있다.
이밖에 중요한 통계자료에 대해서는 ‘정보공개청구’를 적극 활용할 것은 권한다. 노무현 정부는 기자실 제도를 바꾸는 대신 정보공개를 활성화할 것이라고 예고하고 있다. 지금까지 언론인들이 정보공개를 직접 청구해 확보한 자료를 바탕으로 탐사보도를 하는 경우는 그리 많지 않았다. 그러나 앞으로는 정보공개 청구야말로 핵심자료에 접근하는 매우 중요한 루트가 될 것으로 보인다.
정보공개 청구는 전자정부 홈페이지나, 해당 부처의 홈페이지에서 인터넷으로 간단히 할 수 있다.
지난 4월 통계정보시스템에서 연령대별 취업자수를 검색하던 중, 연령대별로는 종사자지위별(상용직, 임시직, 일용직) 통계가 공개되지 않는다는 사실을 발견했다. 궁리 끝에 통계청에 정보공개를 청구하자, 월간 자료는 샘플이 적어 별도로 데이터를 공개하지 않고 있으며, 필요하다면 연간 통계자료는 공개하겠다고 밝혔다. 자료를 입수해 분석한 결과 뉴스가치가 크지 않아 보도에 활용하지는 않았지만, 이런 방식으로도 통계정보시스템에서 서비스하지 않는 자료를 얻을 수 있다는 점을 확인했다.
한편, 통계청은 통계조사 ‘원시자료’를 필요로 하는 사람에게 판매하는 서비스도 하고 있다. 필요하다면 원시자료를 사서 활용할 수도 있을 것이다.
1968년생. 연세대학교 정치외교학과 졸업.
95년 한겨레신문사에 입사, 사회부를 거쳐, 주로 경제부에서 일함.
현재 [한겨레21] 경제팀 기자.
경기순환과 주식시장의 순환 사이의 상관관계를 분석한 [한국주식시장 흐름 읽는법] 등을 씀.