널뛰기 지지율, 못 믿을 여론조사? 싹 다 합쳐서 분석하면…

[the300][대선 D-100]

박종진 l 2021.11.29 10:27

편집자주 들쭉날쭉 여론조사는 이제 그만. 머니투데이 더300(the300)이 매주 월요일 '통합 지지율'을 독자 여러분께 제공합니다. 중앙선거여론조사심의위원회에 등록된 모든 여론조사를 분석해 '경향성'을 고려한 평균적 수치를 산출합니다. 관련 분야 최고 권위자인 한규섭 서울대 교수 연구팀과 함께 합니다.



주요 선거를 앞두고 민심 파악을 위해 가장 빈번하게 활용되는 게 여론조사지만 그만큼 논란도 따른다. 전화 면접조사 혹은 ARS(자동응답시스템), 유·무선 비율과 같은 조사 방법에 따라서 차이가 나는 건 물론이고 같은 방식이라도 여론조사업체별로 결과가 상당한 격차를 보인다.

실제 동일한 날짜에 실시한 조사들 간에도 차이가 10%포인트(p) 이상 나는 경우가 발생하면서 신뢰도를 둘러싸고 논란이 불거진다.

제20대 대통령 선거를 100일 앞둔 29일부터 머니투데이 더300(the300)이 매주 공개하는 '통합 지지율'은 이 같은 개별 여론조사의 한계를 극복하기 위해 기획됐다.

더300의 '2022 대선후보 통합 지지율 지표' 페이지(https://www.mt.co.kr/election2022/)에서는 내년 3월 대선 때까지 중앙선거여론조사심의위원회(여심위)에 등록된 제20대 대통령 선거 후보 지지율 조사 결과를 모두 취합해 소위 '하우스 효과'(House Effect)라 불리는 개별 조사업체의 고유한 경향성을 보정한 추정값을 제공할 예정이다.

이날 공개된 수치는 올해 1월4일부터 11월24일(이하 조사기간 기준)까지 시행돼 여심위에 등록된 305개 여론조사 결과를 대상으로 분석한 결과다.

개별 업체의 경향성을 보정한다는 것은 특정 후보 등에 유·불리하게 작용할 수 있는 업체별 특성을 고려한다는 의미다. 여론조사업체가 과거 어떤 조사 결과를 내왔는지를 분석해 이를 반영하는 방식이다. 현재 시점 기준에서 보다 정확한 지지율을 보여주기 위해 올해 1월부터 여론조사 결과를 다 살펴보는 이유다.

가령 A업체가 그동안 실시한 여론조사에서 B후보가 해당 기간 나온 다른 여론조사 결과에 비해 지지율이 더 높게 나오거나 낮게 나오는 경향을 보인 경우 이를 반영한 수치를 바탕으로 평균적 지지율, 즉 '통합 지지율'을 분석했다.

미국의 대표적 데이터저널리즘 기관인 파이브써티에이트(FiveThirtyEight)나 정치 전문 사이트 리얼폴리틱스(RealPolitics) 등에서는 지난 2000년대 후반부터 이와 유사한 분석을 통해 대통령 선거 예측에서 높은 적중률을 보이기도 했다.

더300 통합 지지율 분석에는 서울대 폴랩(한규섭 교수 연구실)이 개발한 방법론을 적용했다. 앞서 폴랩은 2017년 제19대 대통령 선거 당시 국내 최초로 미국 스탠포드대 사이먼 잭맨 교수 연구팀이 고안한 방법론을 적용해 경향성을 보정한 추정값을 매주 발표했다.

(서울=뉴스1) 국회사진취재단 = 22일 오후 국립서울현충원에서 열린 김영삼 대통령 서거 6주기 추모식에서 여야 대선주자들이 나란히 국민의례를 하고 있다. 왼쪽부터 이재명 더불어민주당 대선 후보, 윤석열 국민의힘 대선 후보, 심상정 정의당 대선 후보, 안철수 국민의당 대선 후보, 김동연 새로운물결 창당준비위원장, 허경영 국가혁명당 대선 후보. 2021.11.22/뉴스1


이번 분석에서는 이보다 한층 진화한 기법을 적용한다. 한규섭 교수는 "미국과 달리 조사업체의 '경향성' 자체가 시간에 따라 크게 변화하는 현상이 나타났다"며 "연구팀 분석에 따르면 미국 대통령 지지율 조사에서는 조사업체들의 경향성 변화폭이 평균 약 4.9%p 정도였으나 한국은 그 두 배가 넘는 10.6%p에 달했다"고 밝혔다.

우리나라 여론조사업체들은 특정 후보에 유리하거나 불리한 결과가 나오는 정도가 시기에 따라 천차만별이라는 의미다. 예컨대 B후보 지지율이 상대적으로 높게 나오던 A업체 조사가 어느 순간에 C후보에게 유리한 조사 결과를 내놓는 식이다. 따라서 특정 조사업체에 대한 경향성을 일률적으로 적용하기가 어렵다.

또 조사 결과를 자주 발표하는 업체들이 상대적으로 더 정확한 결과를 내놓는 것처럼 보이는 '착시 효과'도 문제로 꼽혔다.

한 교수는 "이러한 한국적 조사 환경을 고려해 시간에 따라 변화하는 조사기관의 '최신 경향성'를 모델링한 지지율 추정 값을 제시하는 등 정확한 수치를 산출하기 위해 최선을 다하고 있다"고 밝혔다.

한편 이날 더300이 공개한 24일까지 조사된 여론조사 기준 지지율은 윤 후보 42%, 이 후보 36.3%, 안철수 국민의당 후보 4.4%, 심상정 정의당 후보 3.7%, 김동연 새로운물결(가칭) 후보 1%로 집계됐다.

공유하기