베이지안 통계로 보는 2022 대선 결과 추측 (Bayesian Hierarchical Modeling)

베이지안 통계로 보는 2022 대선 결과 가정 (Bayesian Hierarchical Modeling)

TV에서 대통령 후보 토론회를 진행할 때마다. 회원수가 많은 인터넷 카페에서는 여러 가지 의견들이 오고 가는데요. 토론회가 끝날 때마다. 조회수를 높이며 지지자에 대한 의견 교환이 활발합니다.


검토 심사 개요
검토 심사 개요

검토 심사 개요

2022년 2월 최종적 주, 각 수사 기관의 여론수사 결과

2022년 2월 최종적 주 결과가 없는 경우, 3월 결과로 대체 지지율 상위 4자 이상을 대상으로 실시된 여론수사 예측하고자 하는 것 (y) : 당시 지지율 top2를 기록하던 이재명 후보와 윤석열 후보의 득표율 차이 사용한 프로그래밍 툴 : R의 패키지

(참고) 파이썬의 경우 라이브러리에서 유사한 기능을 제공합니다. 분석에 사용한 여론수사 데이터는 아래와 같습니다.

제언
제언

제언

여론조사에 적용되는 대게 거시적인 글이 되었습니다. 9번 질문에서 언급한 것과 같이 각 결과를 정리해보고, 질문에서 제시한 것처럼 등에서 각 결과가 어떻게 인용되는지 살펴보시면 더 심도 깊게 여론조사를 분석할 수 있을 것으로 보입니다. 언론사별로 취재 보도시 해당 여론조사기관 바로 의뢰 유무도 함께 분석하면 좋겠습니다. 단 빅카인즈에는 20대 대선 여론조사를 특히 의뢰했던 모임회 TOP 5 중에서 오마이뉴스, CBS, 데일리안이 포함되어 있지 않습니다.

이번엔 살펴보지 않았지만, 결과에 영향을 미치는 변수에는 조사방법, 표본추출방법, 가중 방법 뿐만 아니라 날짜 및 시간, 표본 수, 질문 방법, 질문 순서, 질문 길이, 보기 길이, (ARS가 아닌 경우) 질문자의 말투나 태도, 의뢰기관의 정치적 성향 등 정말 여러 변수가 있기에 섣불리 도출하는 것에 대해서는 조심스러워할 필요가 있겠습니다.

윤석열 안철수 후보 단일화 가능성은?
윤석열 안철수 후보 단일화 가능성은?

윤석열 안철수 후보 단일화 가능성은?

야권 대선후보중 단일화 가능성은 윤석열 안철수 후보가 있죠. 언론에서는 지석적으로 단일화 내용을 양 후보에게 질문을 하지만. 서로간 원론적인 이야기만 하고 있는 상황에 있습니다. 먼저 단일화를 던지는 후보가 약세로 보이는게 현실이기에 먼저 단일화를 이야기 하는 후보가 없을 것입니다. 국민의 힘에서는 대선후보 지지율에서 1위를 하기에 더욱 안철수 후보를 괴롭히면서 상승세를 타려는 의도가 있을것입니다만. 안철수 후보가 몇 군데에서 자주 지지율이 15% 이상이 등장하면 향후 분위기는 달라 지겠죠. 안철수 후보 지지율이 여론조사에서 20%가 넘는다면 심각해 지는 상황이 올것입니다.

만약 20% 넌는 다면 안철수 후보의 길은 많은데요. 대선 완주를 통하여 본인의 정치적 자리를 잡는 것입니다.

Option #1 : 모든 실험이 공통의 파라미터를 갖는다고 가정

첫 차례 방법은 모든 실험에 대하여 암이 발병할 확률은 동일하다고 가고르는 것 입니다. 즉 $ heta_j = heta$ 라고 가정합니다. 이 경우, 모든 실험 결과를 종합쳐서 아래와 같이 작성할 수 있습니다. $$ y_1 + y_2 + … + y_{71} | heta sim Bin(n_1 + n_2 + … + n_71, heta) $$ 물론 이와 같이 단순하게 가정할 경우, 한계가 명확합니다.

실제 데이터에서는 암이 발병한 비율이 실험마다.

19대 대선 여론수사 의뢰기관

여론수사 전개 1위였던 MBN-매일경제 그룹에서는 특히 리얼미터에만 의뢰했음을 확인할 수 있습니다. 나머지 여론수사 의뢰기관도 역시 특별한 여론수사 기관에만 특히 의뢰했음을 확인할 수 있습니다. 역시 5개 이상의 그룹만 표시하였고, 전체는 에서 확인하실 수 있습니다. 7.기관별로 여론수사 진행방법에 뚜렷한 차이가 있을까요? 따라서 해당 통계를 함께 보고자, 20대 대선 여론수사 중 2019년 10월 1일부터의 2021년 8월 28일까지의 데이터를 기준으로 하였습니다.

기관별로 조사방법 비율, 표본추출방법, 가중 방법이 어떻게 달라지는지 살펴보도록 하겠습니다. 소수의 표본으로 큰 숫자가 나올 수 있으므로, 모두 5개 이상 표본을 가지고 있는 그룹만 집계에 포함하였습니다.

1- 조사방법 비율

먼저 조사방법 비율에 따른 응답률을 보겠습니다. 조사방법과 조사방법2 각각에 따라 응답률이 어떻게 다른지 확인하실 수 있습니다. ”Null”의 경우 조사방법2가 존재하지 않음을 의미합니다. ARS의 경우 유선 및 무선 모두 전반적으로 응답률이 낮습니다. (물론 방법보단, 날짜 및 시간, 질문 방법, 질문 수 등의 다른 요인이 영향을 미칠 수도 있습니다.

References

[1]

자주 묻는 질문

검토 심사 개요

2022년 2월 최종적 주, 각 수사 기관의 여론수사 결과2022년 2월 최종적 주 결과가 없는 경우, 3월 결과로 대체 지지율 상위 4자 이상을 대상으로 실시된 여론수사 예측하고자 하는 것 (y) : 당시 지지율 top2를 기록하던 이재명 후보와 윤석열 후보의 득표율 차이 사용한 프로그래밍 툴 : R의 패키지(참고) 파이썬의 경우 라이브러리에서 유사한 기능을 제공합니다. 궁금한 사항은 본문을 참고하시기 바랍니다.

제언

여론조사에 적용되는 대게 거시적인 글이 되었습니다. 구체적인 내용은 본문을 참고 해주시기 바랍니다.

윤석열 안철수 후보 단일화

야권 대선후보중 단일화 가능성은 윤석열 안철수 후보가 있죠. 구체적인 내용은 본문을 참고하시기 바랍니다.

Leave a Comment