이전기사 다음기사
UPDATE 2025-11-05 02:02 (Wed)
로그인
phone_iphone 모바일 웹
위로가기 버튼
chevron_right 오피니언 chevron_right 경제칼럼
일반기사

여론조사와 통계의 허와 실

황의영 경제학박사
황의영 경제학박사

며칠 전 일요일 점심 식사 중인데 여론조사를 한다는 전화가 왔다. 평소 여론조사에 별 관심이 없었고 통계를 통한 오류를 마치 진실인 양 호도하는 경향이 있어 신뢰하지도 않았다. 설문에 응하지 않고 전화를 끊었다. 조사를 꼭 일요일 점심 식사 시간에 진행해야 하는가? 반감이 들었다. 당시 소중한 분들과 식사 중에 자리를 비우고 전화를 받을 정도로 중요한 일이라고 생각하지 않았기에 응답을 거절했다.

현대를 ‘정보화 시대’라 한다. 정보의 홍수 속에서 진위를 가리기가 어렵다. 대통령·차기 대권후보·정당·정책 등의 지지도가 몇%라는 보도를 자주 접한다. 사실이라고 생각하기 쉽다. 그러나 사실이 아니다. 국민 지지도를 말하려면 국민 전체에게 묻고 그 답을 토대로 비율을 산출해야 한다. 그렇게 산출하기는 불가능하다. 국민 중 외국에 살고, 병원에 입원하고, 여행가 있고, 유소년 등 질문을 바르게 이해 못 하는 연령대도 있는 등 국민 전체를 대상으로 조사가 불가능하기 때문이다. 통계학에서 비율을 산출할 때 조사대상 전체를 ‘모집단’이라 하고 실제 조사하는 대상을 ‘표본’이라 한다. 신뢰성을 높이려면 모집단 대비 표본 비율이 높아야 한다. 그러나 실제 통계를 측정할 때는 시간과 공간, 경제적 제약을 조건으로 표본의 크기를 결정한다. 대부분의 여론조사는 표본을 1~2천명 내외로 정해 조사하고 통계를 낸다. 국민 5천2백만명 중 1천명은 0.001923%, 2천명은 0.003846%이다. 국민 여론이라면서 고작 0.002~0.004% 정도의 생각을 전체 국민 여론이라 할 수 있을까? 추세를 나타낼 수는 있을지언정 신뢰성은 높지 않다. 여론조사 결과를 접하는 국민이 이런 조건을 안다면 별문제 없다. 그렇지 않고 이를 사실이라 믿는다면 많은 사람이 오류를 범하게 된다. 그리고 설문을 만들 때 어떤 결론을 미리 정하고 거기에 맞게 문항을 만들 수도 있다. 이는 어떤 사실을 은폐하거나 과장 홍보가 필요할 때 사용한다. 역사를 보면 정권이 국민을 속일 때 의도적으로 통계적 오류를 범하기도 했다. 표본을 어떻게 정하느냐에 따라 결과가 완전히 달라질 수 있다. 지지도나 호불호를 측정할 때는 표본이 더 객관적으로 정해져야 한다. 국민 여론이라고 한다면 전체 국민의 연령·지역·남녀성별 등의 비율이 표본에서도 똑같은 비율이 적용돼야 한다. 각 지역의 실제 인구 구성비와 표본의 비율이 같아야 한다. 연령비나 성비도 마찬가지다. 이렇게 표본을 산출한다면 어느 정도 전체의 여론이 반영된다고 볼 수 있다. 선거 시 특정 후보 지지도나 음악 인기도를 속이기 위해 포탈의 실시간 조회 수를 기계로 조작하는 사례를 봐왔다. 그래서 이를 신뢰할 수 없다.

요즘 여론조사가 표본을 1~2천명 내외로 하여 실시한다. 이것은 통계를 보는 사람의 눈을 속이는 행위라고도 볼 수 있다. 통계는 얼마든지 활용하는 사람의 입맛에 맞게 조작하여 활용할 수 있다. 이에 국민이 속으면 안 된다. 이런 조사는 여론조사라고 할 수 없다. 여론조사기관들이 진실한 국민의 여론을 제대로 측정하고 싶다면 시간과 비용이 더 들더라도 표본을 늘려서 유의성과 신뢰성을 높여야 한다. 언론기관에서도 이런 통계 작성상의 문제에 대한 의식을 가지고 신뢰할 수 있는 통계가 작성될 수 있는 환경을 만드는데 함께 노력하면 좋겠다.

/황의영 경제학박사

저작권자 © 전북일보 인터넷신문 무단전재 및 재배포 금지

다른기사보기

개의 댓글

※ 아래 경우에는 고지 없이 삭제하겠습니다.

·음란 및 청소년 유해 정보 ·개인정보 ·명예훼손 소지가 있는 댓글 ·같은(또는 일부만 다르게 쓴) 글 2회 이상의 댓글 · 차별(비하)하는 단어를 사용하거나 내용의 댓글 ·기타 관련 법률 및 법령에 어긋나는 댓글

0 / 400
오피니언섹션